DataStax用語集
C
カーディナリティ
列の一意の値の数。たとえば、従業員ごとに一意のID番号の列はカーディナリティが高く、複数の従業員が同じ郵便番号を持つ可能性があるため、従業員の郵便番号の列はカーディナリティが低くなります。
カーディナリティの低い列のインデックスは、インデックスが列よりも大幅に小さいため、読み取りパフォーマンスを向上させることができます。カーディナリティの高い列のインデックスは、パフォーマンスを低下させる可能性があります。アプリケーションでカーディナリティの高い列の検索が必要な場合は、マテリアライズドビューが理想的です。
クラスタリング列
テーブル定義では、クラスタリング列は複合主キー定義の一部である列です。クラスタリング列は、パーティションキー用に予約されているため、最初の列にはできないことに注意してください。列は、単一のパーティション内の複数の行でクラスタリングされます。クラスタリング順序は、複合主キー定義における列の位置によって決定されます。
合体戦略
同じデータセンター (intra-DC) 内のノードまたは異なるデータセンター (inter-DC) 内のノードへのアウトバウンド TCP 接続のために、複数のネットワークメッセージを単一のパケットに結合する戦略。合体戦略には、保留中のメッセージのブロッキングキューと、送信するメッセージの出力コレクションが提供されます。
列ファミリー
リレーショナルシステムのテーブルに似た、行のコンテナー。CQL 3ではテーブルと呼ばれます。
コンパクション
SSTableを統合し、墓石を破棄し、SSTableインデックスを再生成するプロセス。利用可能なコンパクション戦略は次のとおりです。
複合主キー
データが格納されるノードを決定するパーティションキーと、クラスタリングを決定する1つ以上の追加の列で構成される主キー。
D
E
EBNF
EBNF (拡張バッカス・ナウア記法) 構文は、言語を正式に記述するコンテキストフリー文法を表します。EBNFは、拡張で許可される追加の演算子を使用して、前身のBNF (バッカス・ナウア記法) を拡張します。構文 (鉄道) 図は、EBNF文法をグラフィカルに描写します。
埋め込み
機械学習における数学的手法。複雑な高次元データが低次元空間の点として表現されます。埋め込みを作成するプロセスでは、距離や類似性などの元のデータの関連プロパティが保持され、計算処理が容易になります。たとえば、自然言語処理 (NLP) において、意味が類似している単語は、機械学習モデルでの使用を容易にするために、縮小された空間で互いに近くに設定できます。
ユークリッド距離
2点間の座標幾何学的な非負の距離メトリックで、ベクトルとして表されるデータ点間の類似性または非類似性を定量化します。生成されたサンプルを実際のデータポイントと比較するために使用します。
結果整合性
データベースは可用性とパーティション許容度を最大化します。データベースは、読み取り操作中にすべてのレプリカを更新し、直接アクセスされないレプリカを定期的にチェックおよび更新することにより、最終的なデータ整合性を保証します。更新とチェックにより、すべてのクエリで常に最新の結果セットが返され、任意の指定された行のすべてのレプリカが最終的に互いに完全に整合することが保証されます。
H
HDD
ハードディスクドライブ (HDD) またはスピニングディスクは、1つ以上の剛性のある高速回転ディスクを使用してデジタル情報を保存および取得するために使用されるデータストレージデバイスです。SSDと比較してください。
L
LeveledCompactionStrategy (LCS)
このコンパクション戦略では、レベルにグループ化された固定の比較的小さいサイズのSSTableが作成されます。各レベル内では、SSTableが重複しないことが保証されています。各レベル (L0、L1、L2など) は、前のレベルの10倍の大きさです。SSTableが連続して大きなレベルにコンパクションされるため、ディスクI/Oは、低いレベルよりも高いレベルでより均一で予測可能になります。各レベルで、行キーは次のレベルの重複しないSSTableにマージされます。このプロセスにより、データベースが行キーデータの存在を確認するために各レベルのどのSSTableをチェックするかを判断できるため、読み取りのパフォーマンスが向上します。
M
P
partition(パーティション)
パーティションは、キーによってアドレス指定可能なデータのコレクションです。このデータは、Cassandraクラスター内の1つのノードに存在します。パーティションは、レプリケーションファクターで指定されている数だけノードにレプリケートされます。
partition key(パーティションキー)
パーティションキーは、Cassandraクラスターが要求されたデータがどのノードに存在するかを知るのに役立つ論理エンティティを表します。
パーティションキーは、プライマリキー定義で宣言された最初の列です。複合キーでは、複数の列がプライマリキーを形成する列を宣言できます。
partition range(パーティション範囲)
構成されたパーティショナーによって異なるパーティションの制限。Murmur3Partitioner(デフォルト)の範囲は-263から+263で、RandomPartitionerの範囲は0から2127-1です。
partition summary(パーティションサマリー)
パーティションインデックスのサブセット。デフォルトでは、128個ごとに1つのパーティションキーがサンプリングされます。
Partitioner(パーティショナー)
クラスター全体にデータを分散します。パーティショナーの種類は、Murmur3Partitioner(デフォルト)、RandomPartitioner、およびOrderPreservingPartitionerです。
modules/ROOT/pages/glossary.adoc内の未解決のincludeディレクティブ - include::ROOT:partial$persistent-volume.adoc[]
modules/ROOT/pages/glossary.adoc内の未解決のincludeディレクティブ - include::ROOT:partial$persistent-volume-claim.adoc[]
primary key(プライマリキー)
パーティションキー。テーブル内の行を一意に識別する1つまたは複数の列。
R
replication factor (RF)(レプリケーションファクター)
クラスター全体のレプリカの総数。RFと略されます。レプリケーションファクターが1の場合、クラスター内の各行のコピーは1つだけです。行を含むノードがダウンすると、行を取得できません。レプリケーションファクターが2の場合、各行のコピーが2つあり、各コピーが異なるノードにあることを示します。すべてのレプリカは同様に重要です。プライマリレプリカまたはマスターレプリカはありません。
replication group(レプリケーショングループ)
データセンターを参照してください。
role(ロール)
ユーザーに割り当てられ、データベースリソースへのアクセスを制限する一連の権限。内部認証を使用する場合、ロールにはパスワードを設定でき、単一のユーザー、DSEクライアントツール、またはアプリケーションを表すこともできます。
rolling restart(ローリング再起動)
ダウンタイムなしでクラスター内のノードをアップグレード中に実行される手順。他のノードがオンラインで動作し続けている間、ノードは一度に1つずつアップグレードおよび再起動されます。
row cache(行キャッシュ)
読み取り集中型操作のパフォーマンスを向上させるためのデータベースコンポーネント。オフヒープメモリでは、行キャッシュはローカルのSSTablesから最も最近読み取られた行を保持します。ローカルの各読み取り操作は、その結果セットを行キャッシュに格納し、コーディネーターノードに送信します。次の読み取りでは、最初に行キャッシュがチェックされます。必要なデータがある場合、データベースはすぐにそれを返します。この最初の読み取りでは、Bloomフィルター、パーティションキーキャッシュ、パーティションサマリー、パーティションインデックス、およびSSTableでのその後のシークを節約できます。
データベースは、LRU(Least-Recently-Used)エビクションを使用して、最も頻繁にアクセスされる行で行キャッシュが更新されるようにします。行キャッシュのサイズは、cassandra.yamlファイルで構成できます。
S
seed(シード)
シード、またはシードノードは、クラスターに参加する新しいノードのゴシッププロセスをブートストラップするために使用されます。シードノードは他の機能を提供せず、クラスターの単一障害点ではありません。
modules/ROOT/pages/glossary.adoc内の未解決のincludeディレクティブ - include::ROOT:partial$segment.adoc[]
serializable consistency(シリアライズ可能な整合性)
リニアライズ可能な整合性を参照してください。
SizeTieredCompactionStrategy (STCS)(サイズ階層化コンパクション戦略)
デフォルトのコンパクション戦略。この戦略は、テーブルのサブプロパティmin_thresholdで構成されているように、ディスク上に多数の同様のサイズのSSTableがある場合に、マイナーコンパクションをトリガーします。マイナーコンパクションには、キースペース内のすべてのテーブルは含まれません。関連するCQLドキュメントのSTCSコンパクションサブプロパティも参照してください。
Snitch(スニッチ)
ノードのIPアドレスから、ラックやデータセンターなどの物理的な場所および仮想的な場所へのマッピング。要求ルーティングメカニズムは、使用されるスニッチのタイプによって影響を受けます。
SSD
ソリッドステートドライブ(SSD)は、集積回路を使用してデータを永続的に保存するソリッドステートストレージデバイスです。HDDと比較してください。
SSTable
ソート済み文字列テーブル(SSTable)は、データベースが定期的にmemtableを書き込む不変のデータファイルです。SSTableはディスクに順次格納され、データベーステーブルごとに維持されます。
streaming(ストリーミング)
クラスター内のノード間でデータ交換を処理するコンポーネント。SSTableファイルの一部です。
例として、以下があります。
-
新しいノードをブートストラップするとき、新しいノードはストリーミングを使用して既存のノードからデータを取得します。
-
nodetool repairを実行すると、ノードはストリーミングを使用して同期していないデータを交換します。
-
バックアップからデータを一括ロードするとき、sstableloaderはストリーミングを使用してタスクを完了します。
strong consistency(強い整合性)
データベースがデータを読み取ると、結果を返す前に読み取り修復を実行します。
T
table(テーブル)
名前で順序付けられ、行でフェッチされる列のコレクション。行は列で構成され、プライマリキーを持ちます。キーの最初の部分は列名です。複合キーの後続の部分は、テーブル内の列の順序を定義する他の列名です。
TimeWindowCompactionStrategy (TWCS)
このコンパクション戦略は、一連の時間窓に基づいてSSTableをコンパクションします。現在の時間窓の間、SSTableは1つ以上のSSTableにコンパクションされます。現在の時間窓の終わりには、すべてのSSTableが1つのより大きなSSTableにコンパクションされます。コンパクションプロセスは、次の時間窓の開始時に繰り返されます。各TWCS時間窓は、指定された範囲内のデータを含み、さまざまな量のデータを含んでいます。
token
パーティショナーに依存するリング上の要素。リング上のノードの位置と、そのノードが担当するデータ部分を決定します。Murmur3Partitioner(デフォルト)の範囲は-263から+263です。RandomPartitionerの範囲は0から2127-1です。
調整可能な一貫性
データベースは、特定の行のすべてのレプリカが最終的に完全に一貫性を持つことを保証します。即時かつ完全な一貫性を必要とする状況では、データベースは、指定された操作、データセンター、またはクラスターに対して100%の一貫性を提供するように調整できます。データベースは、すべてのデータと操作に対して完全な一貫性に調整することはできません。
U
UnifiedCompactionStrategy (UCS)
このコンパクション戦略は、一連の時間窓に基づいてSSTableをコンパクションします。現在の時間窓の間、SSTableは1つ以上のSSTableにコンパクションされます。現在の時間窓の終わりには、すべてのSSTableが1つのより大きなSSTableにコンパクションされます。コンパクションプロセスは、次の時間窓の開始時に繰り返されます。各TWCS時間窓は、指定された範囲内のデータを含み、さまざまな量のデータを含んでいます。
レベル化、階層化、時間窓化されたコンパクション戦略の適用範囲をカバーし、コンパクション階層の異なるレベルでのレベル化と階層化の組み合わせを含みます。このコンパクションは、[STCS](w = T4がSTCSのデフォルトのしきい値4と一致)に類似したモード、LCS(w = L10がLCSのデフォルトのファンファクター10と一致)で動作でき、大きな階層化ファンファクター(例:w = T20)で使用すると、時系列ワークロードにも十分に機能します。特にブルームフィルターや時間順序の恩恵を受けることができない(つまり、ワイドパーティション非時系列)読み取り負荷の高いワークロードは、レベル化された構成に最適です。書き込み負荷の高い、時系列またはキーバリューワークロードは、階層化されたものが最適です。
X, Y, Z
ゾンビ
削除後、データベーステーブルに再出現する行またはセル。これは、ノードが長期間ダウンし、修復されずに復元された場合に発生する可能性があります。
削除されたデータはデータベーステーブルから消去されません。コンパクションまでtombstoneでマークされます。1つのノードで作成されたtombstoneは、削除されたデータを含むノードに伝播される必要があります。これらのノードの1つがこれが発生する前にダウンした場合、ノードは最新のtombstoneを受け取れない可能性があります。ノードがオンラインに戻る前に修復されない場合、データベースはtombstoneされていないアイテムを見つけ、それらを新しいデータとして他のノードに伝播します。
この問題を回避するには、復元されたノードをクラスターに再結合する前に、nodetool repairを実行してください。