ベクトルAtlas Searchのフィールドにインデックスを付ける方法
項目一覧
vectorSearch
タイプを使用して、 $vectorSearch
クエリを実行中のフィールドにインデックスを作成できます。 クエリするベクトル埋め込みと、データを事前フィルタリングするために使用するブール値、日付、ObjectId、数値、string、または UUID 値のインデックスを定義できます。 データをフィルタリングすると、セマンティック検索の範囲を絞り込み、マルチテナント環境など特定のベクトル埋め込みが比較の対象とならないようにするのに役立ちます。
Atlas Vector Search インデックスを 作成 するには、Atlas UI、Atlas Administration API、Atlas CLI、mongosh
、またはサポートされている MongoDB ドライバー を使用できます。
注意
非推奨のknnBeta演算子を使用して、 vectorSearch
型のインデックス定義を使用してインデックス付けされたフィールドをクエリすることはできません。
Considerations
vectorSearch
型のインデックス定義では、単一要素のみを含む配列のインデックスを作成できます。 ドキュメントの配列内のフィールド、またはオブジェクトの配列内のフィールドをインデックスすることはできません。 ドット表記を使用してドキュメント内のフィールドにインデックスを付けることができます。
埋め込みをインデックス化する前に、Atlas クラスターでのベクトルの効率的な保存と取り込みのために、埋め込みを BSON BinData vector
サブタイプ float32
または int8
ベクトルに変換することをお勧めします。詳細については、「埋め込みを BSON ベクトルに変換する方法」を参照してください。
サポートされているクライアント
Atlas Vector SearchAtlasmongosh
Atlas CLIAtlasAtlasAPIMongoDB ベクトル検索インデックスは、 Atlas UI、 、 Atlas CLI 、 Atlas Administration API 、および次のMongoDBドライバー を使用して作成、管理できます。
構文
次の構文は、 vectorSearch
インデックス タイプを定義します。
1 { 2 "fields":[ 3 { 4 "type": "vector", 5 "path": "<field-to-index>", 6 "numDimensions": <number-of-dimensions>, 7 "similarity": "euclidean | cosine | dotProduct" 8 }, 9 { 10 "type": "filter", 11 "path": "<field-to-index>" 12 }, 13 ... 14 ] 15 }
Atlas Vector Search インデックス フィールド
Atlas Vector Search インデックス定義には次のフィールドがあります。
オプション | タイプ | 必要性 | 目的 |
---|---|---|---|
fields | ドキュメントの配列 | 必須 | インデックスするベクトル フィールドとフィルター フィールド(ドキュメントごとに 1 つ)。 少なくとも 1 つのドキュメントには、ベクトル フィールドのフィールド定義が含まれている必要があります。 オプションで、ブール値、日付、数値、 ObjectId 、 string 、および UUID フィールドをドキュメントごとに 1 つずつインデックスして、データを事前にフィルタリングすることもできます。 |
fields.type | string | 必須 |
|
fields.path | string | 必須 | インデックスを作成するフィールドの名前。ネストされたフィールドの場合は、ドット表記を使用して埋め込みフィールドへのパスを指定します。 連続するドットが 2 つあるフィールド名やドットで終わるフィールド名はインデックスできません。たとえば、Atlas Vector Search では、 |
fields.numDimensions | 整数 | 必須 | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 4096 以下の値を指定する必要があります。 このフィールドはvector 型フィールドにのみ設定できます。 |
fields.similarity | string | 必須 | 上位 K 近傍の検索に使用するベクトル類似度関数。このフィールドは
詳細については、「 類似性関数について 」を参照してください。 |
vector
型について
インデックス定義の vector
フィールドには、次のいずれかのタイプの数値の配列が含まれている必要があります。
注意
データ用BSON BinDatavector
サブタイプfloat32
またはvector
サブタイプint8
ベクトルの生成の詳細については、「 量化ベクトルを取り込む方法 」を参照してください。
ベクトル フィールドは、fields
配列内の vector
タイプとしてインデックスする必要があります。
次の構文は、 vector
フィールド型を定義します。
1 { 2 "fields":[ 3 { 4 "type": "vector", 5 "path": <field-to-index>, 6 "numDimensions": <number-of-dimensions>, 7 "similarity": "euclidean | cosine | dotProduct" 8 }, 9 ... 10 ] 11 }
類似度関数について
Atlas ベクトル検索は次の類似性関数をサポートしています。
euclidean
- ベクトルの端点間の距離を測定します。 この値により、さまざまな次元に基づいて類似性を測定できます。 詳しくは、「 Euclidean 」を参照してください。cosine
- ベクトル間の角度に基づいて類似性を測定します。この値により、大きさでスケーリングされない類似性を測定できます。cosine
では絶対値ゼロのベクトルは使用できません。コサイン類似度を測定するには、ベクトルを正規化し、代わりにdotProduct
を使用することをお勧めします。dotProduct
-cosine
と同様の類似性を測定しますが、ベクトルの大きさを考慮します。 大きさを正規化すると、類似性の測定においてcosine
とdotProduct
はほぼ同じになります。dotProduct
を使用するには、インデックス作成時とクエリ時にベクトルを単位の長さで正規化する必要があります。
最高のパフォーマンスを得るには、埋め込みモデルをチェックして、どの類似度関数が埋め込みモデルの訓練プロセスと一致するかを判断します。ガイダンスがない場合は、 dotProduct
から開始します。 fields.similarity
を dotProduct
の値に設定すると、角度と大きさの両方に基づいて類似性を効率的に測定できます。 dotProduct
は cosine
よりも計算リソースの消費量が少なく、ベクトルが単位の長さの場合に効率的です。ただし、ベクトルが正規化されていない場合は、サンプルクエリの結果の類似性スコアを euclidean
距離と cosine
類似性について評価して、どれが妥当な結果に対応しているかを判断してください。
filter
型について
オプションで、ブール値、日付、数値、objectId、string、および UUID フィールドをインデックスして、データを事前にフィルタリングできます。データをフィルタリングすると、セマンティック検索の範囲を絞り込み、すべてのベクトルが比較の対象とならないようにするのに役立ちます。類似性比較を実行するドキュメントの数が減るため、クエリのレイテンシが減り、検索結果の精度が向上します。
fields
配列内で filter
タイプを使用して、フィルタリングするフィールドをインデックスする必要があります。
次の構文は、 filter
フィールド型を定義します。
1 { 2 "fields":[ 3 { 4 "type": "vector", 5 ... 6 }, 7 { 8 "type": "filter", 9 "path": "<field-to-index>" 10 }, 11 ... 12 ] 13 }
注意
データを事前にフィルタリングしても、Atlas Vector Search が$vectorSearch
クエリに$vectorSearchScore
を使用して返すスコアには影響しません。
Atlas Vector Search インデックスの作成
Atlas Search インデックスは、簡単に検索可能な形式でデータを分類するデータ構造であり、タームとタームを含むドキュメントの間をマッピングします。Atlas Search インデックスを使用すると、特定の識別子を使用してドキュメントをすばやく検索できます。Atlas Search を使用して Atlas クラスター内のデータをクエリするには、Atlas Search インデックスを構成する必要があります。
Atlas Search インデックスは、単一または複数のフィールドで作成できます。データのソートやフィルタリングによく使用するフィールドはインデックスを作成して、クエリ時に関連データを含むドキュメントをすばやく取得できるようにすることをお勧めします。
Atlas UI、Atlas Administration API、Atlas CLI を使用して、Atlas クラスター上の任意の種類のデータとともに、長さが4096次元以下のベクトル埋め込みを含むすべてのコレクションに対する Atlas Vector Search インデックスを作成できます。 、 mongosh
、またはサポートされているMongoDB ドライバー。
前提条件
Atlas Vector Search インデックスを作成するには、次の前提条件を持つ Atlas クラスターが必要です。
MongoDB バージョン
6.0.11
、7.0.2
、または 以上Atlas Vector Search インデックスの作成対象のコレクション
注意
mongosh
コマンドまたはドライバーヘルパーメソッドを使用して、すべての Atlas クラスター階層に Atlas Search インデックスを作成できます。サポートされているドライバー バージョンのリストについては、 「サポートされているクライアント」 を参照してください。
必要なアクセス権
Atlas Vector Search インデックスを作成および管理するには、 Project Data Access Admin
以上のロールが必要です。
インデックスの制限
インデックス作成数の上限は以下のとおりです。
M0
クラスターで 3 件。M2
クラスターで 5 件M5
クラスターで 10 件
単一の M10+
クラスターには、2 , 500 以下の検索インデックスを作成することを推奨します。
手順
➤ [言語を選択 ] ドロップダウン メニューを使用して、インデックスの作成に使用するクライアントを選択します。
注意
この手順には、 sample_mflix
データベース内のembedded_movies
コレクションのインデックス定義の例が含まれています。 サンプル データを クラスターにロードし、このコレクション用のサンプル Atlas Search インデックスを作成すると、このコレクションに対してサンプル$vectorSearch
クエリを実行できます。 実行できるサンプル クエリの詳細については、「 $vectorSearch の例 」を参照してください。
Atlas Administration API を使用してコレクション用 Atlas Vector Search インデックスを作成するには、必要なパラメータを指定して Atlas Search indexes
エンドポイントにPOST
リクエストを送信します。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --header "Content-Type: application/json" \ 4 --include \ 5 --request POST "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes" \ 6 --data ' 7 { 8 "database": "<name-of-database>", 9 "collectionName": "<name-of-collection>", 10 "type": "vectorSearch", 11 "name": "<index-name>", 12 "definition": { 13 "fields":[ 14 { 15 "type": "vector", 16 "path": <field-to-index>, 17 "numDimensions": <number-of-dimensions>, 18 "similarity": "euclidean | cosine | dotProduct" 19 }, 20 { 21 "type": "filter", 22 "path": "<field-to-index>" 23 }, 24 ... 25 } 26 ] 27 }'
エンドポイントの構文とパラメータの詳細については、「 Atlas Search インデックスを 1 つ作成する 」を参照してください。
例
次のインデックス定義は、Atlas Vector Search インデックスで、 plot_embedding
フィールドを タイプとして、vector
フィールドとgenres
year
フィールドを タイプとしてインデックス化します。filter
plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 インデックス定義では、 1536
ベクトル次元を指定し、 euclidean
距離を使用して類似性を測定します。
次のインデックス定義は、ベクトル検索を実行するためのベクトル埋め込みフィールドのみをインデックスします。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --header "Content-Type: application/json" \ 4 --include \ 5 --request POST "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes" \ 6 --data ' 7 { 8 "database": "sample_mflix", 9 "collectionName": "embedded_movies", 10 "type": "vectorSearch", 11 "name": "vector_index", 12 "definition: { 13 "fields":[ 14 { 15 "type": "vector", 16 "path": "plot_embedding", 17 "numDimensions": 1536, 18 "similarity": "euclidean" 19 } 20 ] 21 } 22 }'
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --header "Content-Type: application/json" \ 4 --include \ 5 --request POST "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes" \ 6 --data ' 7 { 8 "database": "sample_mflix", 9 "collectionName": "embedded_movies", 10 "type": "vectorSearch", 11 "name": "vector_index", 12 "definition: { 13 "fields":[ 14 { 15 "type": "vector", 16 "path": "plot_embedding", 17 "numDimensions": 1536, 18 "similarity": "euclidean" 19 }, 20 { 21 "type": "filter", 22 "path": "genres" 23 }, 24 { 25 "type": "filter", 26 "path": "year" 27 } 28 ] 29 } 30 }'
Atlas CLI v 1.14.3以降を使用してコレクションに Atlas Vector Search インデックスを作成するには、次の手順を実行します。
.json
ファイルを作成し、ファイル内にインデックスを定義します。
インデックス定義は、次の形式のようになります。
1 { 2 "database": "<name-of-database>", 3 "collectionName": "<name-of-collection>", 4 "type": "vectorSearch", 5 "name": "<index-name>", 6 "fields":[ 7 { 8 "type": "vector", 9 "path": "<field-to-index>", 10 "numDimensions": <number-of-dimensions>, 11 "similarity": "euclidean | cosine | dotProduct" 12 }, 13 { 14 "type": "filter", 15 "path": "<field-to-index>" 16 }, 17 ... 18 ] 19 }
例
vector-index.json
という名前のファイルを作成します。
以下のプレースホルダー値を置き換えて、ファイルを保存します。
<name-of-database> | インデックスを作成するコレクションを含むデータベース。 |
<name-of-collection> | インデックスを作成するコレクション。 |
<index-name> | インデックスの名前。 インデックス名を省略すると、Atlas Vector Search はインデックスに vector_index という名前を付けます。 |
<number-of-dimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<field-to-index> | インデックスするベクトル フィールドとフィルター フィールド。 |
例
次のインデックス定義をコピーして、 vector-index.json
ファイルに貼り付けます。 次のインデックス定義は、Atlas Vector Search インデックスで、 plot_embedding
フィールドを タイプとして、vector
フィールドとgenres
year
フィールドを タイプとしてインデックス化します。filter
plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 インデックス定義では、 1536
ベクトル次元を指定し、 euclidean
距離を使用して類似性を測定します。
次のインデックス定義は、ベクトル検索を実行するためのベクトル埋め込みフィールドのみをインデックスします。
1 { 2 "database": "sample_mflix", 3 "collectionName": "embedded_movies", 4 "type": "vectorSearch", 5 "name": "vector_index", 6 "fields": [ 7 { 8 "type": "vector", 9 "path": "plot_embedding", 10 "numDimensions": 1536, 11 "similarity": "euclidean" 12 } 13 ] 14 }
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 { 2 "database": "sample_mflix", 3 "collectionName": "embedded_movies", 4 "type": "vectorSearch", 5 "name": "vector_index", 6 "fields":[ 7 { 8 "type": "vector", 9 "path": "plot_embedding", 10 "numDimensions": 1536, 11 "similarity": "euclidean" 12 }, 13 { 14 "type": "filter", 15 "path": "genres" 16 }, 17 { 18 "type": "filter", 19 "path": "year" 20 } 21 ] 22 }
以下のコマンドを実行してインデックスを作成します。
atlas clusters search indexes create --clusterName [cluster_name] --file [vector_index].json
コマンドで、次のプレースホルダー値を置き換えます。
cluster_name
は、インデックスを作成するコレクションを含む Atlas クラスターの名前です。vector_index
は、Atlas Vector Search インデックスのインデックス定義を含むJSONファイルの名前です。
例
atlas clusters search indexes create --clusterName [cluster_name] --file vector-index.json
コマンド構文とパラメーターについて詳しくは、Atlas CLI ドキュメントのAtlas クラスター検索インデックス作成コマンド を参照してください。
Atlas Atlasで、プロジェクトの {0 ページにGoします。GoClusters
まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーション バーのOrganizationsメニュー
まだ表示されていない場合は、ナビゲーション バーのProjectsメニューから目的のプロジェクトを選択します。
まだ表示されていない場合は、サイドバーの [Clusters] をクリックします。
[ Clusters (クラスター) ] ページが表示されます。
GoAtlas Searchクラスターの ページに します。
GoAtlas Searchページには、サイドバー、Data Explorer 、またはクラスターの詳細ページから できます。
サイドバーで、 Services見出しの下のAtlas Searchをクリックします。
[ Select data sourceドロップダウンからクラスターを選択し、[ Go to Atlas Search ] をクリックします。
Atlas Searchページが表示されます。
クラスターの [Browse Collections] ボタンをクリックします。
データベースを展開し、コレクションを選択します。
コレクションのSearch Indexesタブをクリックします。
Atlas Searchページが表示されます。
クラスタの名前をクリックします。
[Atlas Search] タブをクリックします。
Atlas Searchページが表示されます。
Index Name を入力し、Database and Collection を設定します。
Index Name フィールドにインデックス名を入力します。
インデックス名は、インデックスのタイプに関係なく、名前空間内で一意である必要があります。
例
サンプル インデックスの名前としてvector_indexと入力します。 このコレクションにvector_indexという名前のインデックスがすでに存在する場合は、インデックスに別の名前を入力します。
Database and Collectionセクションで、 データベースを検索し、 コレクションを選択します。
Tip
Data Explorerからこのページに移動した場合、Atlas はData Explorerで選択したデータベースとコレクションを事前選択するため、この手順をスキップできます。
例
Database and Collectionセクションで、
sample_mflix
データベースを検索し、embedded_movies
コレクションを選択します。
インデックスの定義を指定します。
Atlas Vector Search インデックスは次の例のようになります。
1 { 2 "fields":[ 3 { 4 "type": "vector", 5 "path": <field-to-index>, 6 "numDimensions": <number-of-dimensions>, 7 "similarity": "euclidean | cosine | dotProduct" 8 }, 9 { 10 "type": "filter", 11 "path": "<field-to-index>" 12 }, 13 ... 14 ] 15 }
インデックス内のフィールドの詳細については、 「ベクトル検索のフィールドにインデックスを作成する方法」 を参照してください。
例
次のインデックス定義は、Atlas Vector Search インデックスで、 plot_embedding
フィールドを タイプとして、vector
フィールドとgenres
year
フィールドを タイプとしてインデックス化します。filter
plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 インデックス定義では、 1536
ベクトル次元を指定し、 euclidean
距離を使用して類似性を測定します。
次のインデックス定義は、ベクトル検索を実行するためのベクトル埋め込みフィールドのみをインデックスします。
1 { 2 "fields": [{ 3 "type": "vector", 4 "path": "plot_embedding", 5 "numDimensions": 1536, 6 "similarity": "euclidean" 7 }] 8 }
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 { 2 "fields": [{ 3 "type": "vector", 4 "path": "plot_embedding", 5 "numDimensions": 1536, 6 "similarity": "euclidean" 7 }, 8 { 9 "type": "filter", 10 "path": "genres" 11 }, 12 { 13 "type": "filter", 14 "path": "year" 15 }] 16 }
mongosh
v 2.1.2以降を使用してコレクションに Atlas Vector Search インデックスを作成するには、次の手順を実行します。
mongosh
を使用して Atlas クラスターに接続します。
詳しくは、「 mongosh
経由で接続 」を参照してください。
db.collection.createSearchIndex()
メソッドを実行します。
db.collection.createSearchIndex()
メソッドの構文は次のとおりです。
1 db.<collectionName>.createSearchIndex( 2 "<index-name>", 3 "vectorSearch", //index type 4 { 5 fields: [ 6 { 7 "type": "vector", 8 "numDimensions": <number-of-dimensions>, 9 "path": "<field-to-index>", 10 "similarity": "euclidean | cosine | dotProduct" 11 }, 12 { 13 "type": "filter", 14 "path": "<field-to-index>" 15 }, 16 ... 17 ] 18 } 19 );
例
次のインデックス定義は、Atlas Vector Search インデックスで、 plot_embedding
フィールドを タイプとして、vector
フィールドとgenres
year
フィールドを タイプとしてインデックス化します。filter
plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 インデックス定義では、 1536
ベクトル次元を指定し、 euclidean
距離を使用して類似性を測定します。
次のインデックス定義は、ベクトル検索を実行するためのベクトル埋め込みフィールドのみをインデックスします。
1 db.embedded_movies.createSearchIndex( 2 "vector_index", 3 "vectorSearch", 4 { 5 "fields": [ 6 { 7 "type": "vector", 8 "path": "plot_embedding", 9 "numDimensions": 1536, 10 "similarity": "euclidean" 11 } 12 ] 13 } 14 );
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 db.embedded_movies.createSearchIndex( 2 "vector_index", 3 "vectorSearch", 4 { 5 "fields": [ 6 { 7 "type": "vector", 8 "path": "plot_embedding", 9 "numDimensions": 1536, 10 "similarity": "euclidean" 11 }, 12 { 13 "type": "filter", 14 "path": "genres" 15 }, 16 { 17 "type": "filter", 18 "path": "year" 19 } 20 ] 21 } 22 );
MongoDB Go ドライバー v1.16.0 以降を使用してコレクションの Atlas Vector Search インデックスを作成するには、次の手順を実行します。
.go
ファイルを作成し、ファイル内にインデックスを定義します。
1 package main 2 3 import ( 4 "context" 5 "fmt" 6 "log" 7 8 "go.mongodb.org/mongo-driver/bson" 9 "go.mongodb.org/mongo-driver/mongo" 10 "go.mongodb.org/mongo-driver/mongo/options" 11 ) 12 13 func main() { 14 ctx := context.Background() 15 16 // Replace the placeholder with your Atlas connection string 17 const uri = "<connectionString>" 18 19 // Connect to your Atlas cluster 20 clientOptions := options.Client().ApplyURI(uri) 21 client, err := mongo.Connect(ctx, clientOptions) 22 if err != nil { 23 log.Fatalf("failed to connect to the server: %v", err) 24 } 25 defer func() { _ = client.Disconnect(ctx) }() 26 27 // Set the namespace 28 coll := client.Database("<databaseName>").Collection("<collectionName>") 29 30 // Define the index details 31 type vectorDefinitionField struct { 32 Type string `bson:"type"` 33 Path string `bson:"path"` 34 NumDimensions int `bson:"numDimensions"` 35 Similarity string `bson:"similarity"` 36 } 37 38 type vectorDefinition struct { 39 Fields []vectorDefinitionField `bson:"fields"` 40 } 41 42 indexName := "<indexName>" 43 opts := options.SearchIndexes().SetName(indexName).SetType("vectorSearch") 44 45 indexModel := mongo.SearchIndexModel{ 46 Definition: vectorDefinition{ 47 Fields: []vectorDefinitionField{{ 48 Type: "vector", 49 Path: "<fieldToIndex>", 50 NumDimensions: <numberOfDimensions>, 51 Similarity: "euclidean | cosine | dotProduct"}}, 52 }, 53 Options: opts, 54 } 55 56 // Create the index 57 log.Println("Creating the index.") 58 searchIndexName, err := coll.SearchIndexes().CreateOne(ctx, indexModel) 59 if err != nil { 60 log.Fatalf("failed to create the search index: %v", err) 61 } 62 63 // Await the creation of the index. 64 log.Println("Polling to confirm successful index creation.") 65 log.Println("NOTE: This may take up to a minute.") 66 searchIndexes := coll.SearchIndexes() 67 var doc bson.Raw 68 for doc == nil { 69 cursor, err := searchIndexes.List(ctx, options.SearchIndexes().SetName(searchIndexName)) 70 if err != nil { 71 fmt.Errorf("failed to list search indexes: %w", err) 72 } 73 74 if !cursor.Next(ctx) { 75 break 76 } 77 78 name := cursor.Current.Lookup("name").StringValue() 79 queryable := cursor.Current.Lookup("queryable").Boolean() 80 if name == searchIndexName && queryable { 81 doc = cursor.Current 82 } else { 83 time.Sleep(5 * time.Second) 84 } 85 } 86 87 log.Println("Name of Index Created: " + searchIndexName) 88 }
例
vector-index.go
という名前のファイルを作成します。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
例
以下をコピーしてvector-index.go
ファイルに貼り付け、 <connectionString>
プレースホルダー値を置き換えます。 The following index definition indexes the plot_embedding
field as the vector
type and the genres
and year
fields as the filter
type in an Atlas Vector Search index. plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 The index definition specifies 1536
vector dimensions and measures similarity using euclidean
distance.
次のインデックス定義は、ベクトル検索を実行するためにベクトル埋め込みフィールド( plot_embedding
)のみをインデックスします。
1 package main 2 3 import ( 4 "context" 5 "fmt" 6 "log" 7 "time" 8 9 "go.mongodb.org/mongo-driver/bson" 10 "go.mongodb.org/mongo-driver/mongo" 11 "go.mongodb.org/mongo-driver/mongo/options" 12 ) 13 14 func main() { 15 ctx := context.Background() 16 17 // Replace the placeholder with your Atlas connection string 18 const uri = "<connectionString>" 19 20 // Connect to your Atlas cluster 21 clientOptions := options.Client().ApplyURI(uri) 22 client, err := mongo.Connect(ctx, clientOptions) 23 if err != nil { 24 log.Fatalf("failed to connect to the server: %v", err) 25 } 26 defer func() { _ = client.Disconnect(ctx) }() 27 28 // Set the namespace 29 coll := client.Database("sample_mflix").Collection("embedded_movies") 30 31 // Define the index details 32 type vectorDefinitionField struct { 33 Type string `bson:"type"` 34 Path string `bson:"path"` 35 NumDimensions int `bson:"numDimensions"` 36 Similarity string `bson:"similarity"` 37 } 38 39 type vectorDefinition struct { 40 Fields []vectorDefinitionField `bson:"fields"` 41 } 42 43 indexName := "vector_index" 44 opts := options.SearchIndexes().SetName(indexName).SetType("vectorSearch") 45 46 indexModel := mongo.SearchIndexModel{ 47 Definition: vectorDefinition{ 48 Fields: []vectorDefinitionField{{ 49 Type: "vector", 50 Path: "plot_embedding", 51 NumDimensions: 1536, 52 Similarity: "euclidean"}}, 53 }, 54 Options: opts, 55 } 56 57 // Create the index 58 searchIndexName, err := coll.SearchIndexes().CreateOne(ctx, indexModel) 59 if err != nil { 60 log.Fatalf("failed to create the search index: %v", err) 61 } 62 log.Println("New search index named " + searchIndexName + " is building.") 63 64 // Await the creation of the index. 65 log.Println("Polling to check if the index is ready. This may take up to a minute.") 66 searchIndexes := coll.SearchIndexes() 67 var doc bson.Raw 68 for doc == nil { 69 cursor, err := searchIndexes.List(ctx, options.SearchIndexes().SetName(searchIndexName)) 70 if err != nil { 71 fmt.Errorf("failed to list search indexes: %w", err) 72 } 73 74 if !cursor.Next(ctx) { 75 break 76 } 77 78 name := cursor.Current.Lookup("name").StringValue() 79 queryable := cursor.Current.Lookup("queryable").Boolean() 80 if name == searchIndexName && queryable { 81 doc = cursor.Current 82 } else { 83 time.Sleep(5 * time.Second) 84 } 85 } 86 87 log.Println(searchIndexName + " is ready for querying.") 88 }
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 package main 2 3 import ( 4 "context" 5 "fmt" 6 "log" 7 "time" 8 9 "go.mongodb.org/mongo-driver/bson" 10 "go.mongodb.org/mongo-driver/mongo" 11 "go.mongodb.org/mongo-driver/mongo/options" 12 ) 13 14 func main() { 15 ctx := context.Background() 16 17 // Replace the placeholder with your Atlas connection string 18 const uri = "<connectionString>" 19 20 // Connect to your Atlas cluster 21 clientOptions := options.Client().ApplyURI(uri) 22 client, err := mongo.Connect(ctx, clientOptions) 23 if err != nil { 24 log.Fatalf("failed to connect to the server: %v", err) 25 } 26 defer func() { _ = client.Disconnect(ctx) }() 27 28 // Set the namespace 29 coll := client.Database("sample_mflix").Collection("embedded_movies") 30 indexName := "vector_index" 31 opts := options.SearchIndexes().SetName(indexName).SetType("vectorSearch") 32 33 type vectorDefinitionField struct { 34 Type string `bson:"type"` 35 Path string `bson:"path"` 36 NumDimensions int `bson:"numDimensions"` 37 Similarity string `bson:"similarity"` 38 } 39 40 type filterField struct { 41 Type string `bson:"type"` 42 Path string `bson:"path"` 43 } 44 45 type indexDefinition struct { 46 Fields []vectorDefinitionField `bson:"fields"` 47 } 48 49 vectorDefinition := vectorDefinitionField{ 50 Type: "vector", 51 Path: "plot_embedding", 52 NumDimensions: 1536, 53 Similarity: "euclidean"} 54 genreFilterDefinition := filterField{"filter", "genres"} 55 yearFilterDefinition := filterField{"filter", "year"} 56 57 indexModel := mongo.SearchIndexModel{ 58 Definition: bson.D{{"fields", [3]interface{}{ 59 vectorDefinition, 60 genreFilterDefinition, 61 yearFilterDefinition}}}, 62 Options: opts, 63 } 64 65 // Create the index 66 searchIndexName, err := coll.SearchIndexes().CreateOne(ctx, indexModel) 67 if err != nil { 68 log.Fatalf("failed to create the search index: %v", err) 69 } 70 log.Println("New search index named " + searchIndexName + " is building.") 71 72 // Await the creation of the index. 73 log.Println("Polling to check if the index is ready. This may take up to a minute.") 74 searchIndexes := coll.SearchIndexes() 75 var doc bson.Raw 76 for doc == nil { 77 cursor, err := searchIndexes.List(ctx, options.SearchIndexes().SetName(searchIndexName)) 78 if err != nil { 79 fmt.Errorf("failed to list search indexes: %w", err) 80 } 81 82 if !cursor.Next(ctx) { 83 break 84 } 85 86 name := cursor.Current.Lookup("name").StringValue() 87 queryable := cursor.Current.Lookup("queryable").Boolean() 88 if name == searchIndexName && queryable { 89 doc = cursor.Current 90 } else { 91 time.Sleep(5 * time.Second) 92 } 93 } 94 95 log.Println(searchIndexName + " is ready for querying.") 96 }
MongoDB Java ドライバー v5.2.0 以降を使用してコレクションの Atlas Vector Search インデックスを作成するには、次の手順を実行します。
.java
ファイルを作成し、ファイル内にインデックスを定義します。
1 import com.mongodb.client.ListSearchIndexesIterable; 2 import com.mongodb.client.MongoClient; 3 import com.mongodb.client.MongoClients; 4 import com.mongodb.client.MongoCollection; 5 import com.mongodb.client.MongoCursor; 6 import com.mongodb.client.MongoDatabase; 7 import com.mongodb.client.model.SearchIndexModel; 8 import com.mongodb.client.model.SearchIndexType; 9 import org.bson.Document; 10 import org.bson.conversions.Bson; 11 12 import java.util.Arrays; 13 import java.util.Collections; 14 import java.util.List; 15 16 public class VectorIndex { 17 18 public static void main(String[] args) { 19 20 // Replace the placeholder with your Atlas connection string 21 String uri = "<connectionString>"; 22 23 // Connect to your Atlas cluster 24 try (MongoClient mongoClient = MongoClients.create(uri)) { 25 26 // Set the namespace 27 MongoDatabase database = mongoClient.getDatabase("<databaseName>"); 28 MongoCollection<Document> collection = database.getCollection("<collectionName>"); 29 30 // Define the index details 31 String indexName = "<indexName>"; 32 Bson definition = new Document( 33 "fields", 34 Arrays.asList( 35 new Document("type", "vector") 36 .append("path", "<fieldToIndex>") 37 .append("numDimensions", <numberOfDimensions>) 38 .append("similarity", "euclidean | cosine | dotProduct"), 39 new Document("type", "filter") 40 .append("path", "<fieldToIndex>"), 41 ... 42 ) 43 ); 44 45 // Define the index model 46 SearchIndexModel indexModel = new SearchIndexModel( 47 indexName, 48 definition, 49 SearchIndexType.vectorSearch() 50 ); 51 52 // Create the index 53 try { 54 List<String> result = collection.createSearchIndexes(Collections.singletonList(indexModel)); 55 System.out.println("New search index named " + result.get(0) + " is building."); 56 } catch (Exception e) { 57 throw new RuntimeException("Error creating index: " + e); 58 } 59 60 61 // Wait for Atlas to build the index 62 System.out.println("Polling to check if the index is ready. This may take up to a minute."); 63 64 ListSearchIndexesIterable<Document> searchIndexes = collection.listSearchIndexes(); 65 Document doc = null; 66 while (doc == null) { 67 try (MongoCursor<Document> cursor = searchIndexes.iterator()) { 68 if (!cursor.hasNext()) { 69 break; 70 } 71 Document current = cursor.next(); 72 String name = current.getString("name"); 73 // When the index completes building, it becomes `queryable` 74 boolean queryable = current.getBoolean("queryable"); 75 if (name.equals(indexName) && queryable) { 76 doc = current; 77 } else { 78 Thread.sleep(500); 79 } 80 } catch (Exception e) { 81 throw new RuntimeException("Failed to list search indexes: " + e); 82 mongoClient.close(); 83 } 84 } 85 System.out.println(indexName + " is ready for querying."); 86 87 } catch (Exception e) { 88 throw new RuntimeException("Error connecting to MongoDB: " + e); 89 } 90 } 91 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
以下の例では、インデックス定義を行います。
Atlas ベクトル検索インデックスで、
plot_embedding
フィールドをvector
型として、genres
フィールドとyear
フィールドをfilter
型としてインデックスします。plot_embedding
フィールドをベクトル埋め込みフィールドとして指定します。このフィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。1536
ベクトル次元を指定し、euclidean
距離を使用して類似性を測定します。
このインデックス定義は、ベクトル検索を実行するためのベクトル埋め込みフィールド(plot_embedding
)のみをインデックスします。
以下をコピーして作成したファイルに貼り付け、<connectionString>
プレースホルダー値を置き換えます。
1 import com.mongodb.client.ListSearchIndexesIterable; 2 import com.mongodb.client.MongoClient; 3 import com.mongodb.client.MongoClients; 4 import com.mongodb.client.MongoCollection; 5 import com.mongodb.client.MongoCursor; 6 import com.mongodb.client.MongoDatabase; 7 import com.mongodb.client.model.SearchIndexModel; 8 import com.mongodb.client.model.SearchIndexType; 9 import org.bson.Document; 10 import org.bson.conversions.Bson; 11 12 import java.util.Collections; 13 import java.util.List; 14 15 public class VectorIndex { 16 17 public static void main(String[] args) { 18 19 // Replace the placeholder with your Atlas connection string 20 String uri = "<connectionString>"; 21 22 // Connect to your Atlas cluster 23 try (MongoClient mongoClient = MongoClients.create(uri)) { 24 25 // Set the namespace 26 MongoDatabase database = mongoClient.getDatabase("sample_mflix"); 27 MongoCollection<Document> collection = database.getCollection("embedded_movies"); 28 29 // Define the index details 30 String indexName = "vector_index"; 31 Bson definition = new Document( 32 "fields", 33 Collections.singletonList( 34 new Document("type", "vector") 35 .append("path", "plot_embedding") 36 .append("numDimensions", 1536) 37 .append("similarity", "euclidean"))); 38 39 // Define the index model 40 SearchIndexModel indexModel = new SearchIndexModel( 41 indexName, 42 definition, 43 SearchIndexType.vectorSearch()); 44 45 // Create the index 46 try { 47 List<String> result = collection.createSearchIndexes(Collections.singletonList(indexModel)); 48 System.out.println("New search index named " + result.get(0) + " is building."); 49 } catch (Exception e) { 50 throw new RuntimeException("Error creating index: " + e); 51 } 52 53 // Wait for Atlas to build the index 54 System.out.println("Polling to check if the index is ready. This may take up to a minute."); 55 56 ListSearchIndexesIterable<Document> searchIndexes = collection.listSearchIndexes(); 57 Document doc = null; 58 while (doc == null) { 59 try (MongoCursor<Document> cursor = searchIndexes.iterator()) { 60 if (!cursor.hasNext()) { 61 break; 62 } 63 Document current = cursor.next(); 64 String name = current.getString("name"); 65 // When the index completes building, it becomes `queryable` 66 boolean queryable = current.getBoolean("queryable"); 67 if (name.equals(indexName) && queryable) { 68 doc = current; 69 } else { 70 Thread.sleep(500); 71 } 72 } catch (Exception e) { 73 throw new RuntimeException("Failed to list search indexes: " + e); 74 } 75 } 76 System.out.println(indexName + " is ready for querying."); 77 78 } catch (Exception e) { 79 throw new RuntimeException("Error connecting to MongoDB: " + e); 80 } 81 } 82 }
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
以下をコピーして作成したファイルに貼り付け、<connectionString>
プレースホルダー値を置き換えます。
1 import com.mongodb.client.ListSearchIndexesIterable; 2 import com.mongodb.client.MongoClient; 3 import com.mongodb.client.MongoClients; 4 import com.mongodb.client.MongoCollection; 5 import com.mongodb.client.MongoCursor; 6 import com.mongodb.client.MongoDatabase; 7 import com.mongodb.client.model.SearchIndexModel; 8 import com.mongodb.client.model.SearchIndexType; 9 import org.bson.Document; 10 import org.bson.conversions.Bson; 11 12 import java.util.Arrays; 13 import java.util.Collections; 14 import java.util.List; 15 16 public class VectorIndex { 17 18 public static void main(String[] args) { 19 20 // Replace the placeholder with your Atlas connection string 21 String uri = "<connectionString>"; 22 23 // Connect to your Atlas cluster 24 try (MongoClient mongoClient = MongoClients.create(uri)) { 25 26 // Set the namespace 27 MongoDatabase database = mongoClient.getDatabase("sample_mflix"); 28 MongoCollection<Document> collection = database.getCollection("embedded_movies"); 29 30 // Define the index details with the filter fields 31 String indexName = "vector_index"; 32 Bson definition = new Document( 33 "fields", 34 Arrays.asList( 35 new Document("type", "vector") 36 .append("path", "plot_embedding") 37 .append("numDimensions", 1536) 38 .append("similarity", "euclidean"), 39 new Document("type", "filter") 40 .append("path", "genres"), 41 new Document("type", "filter") 42 .append("path", "year"))); 43 44 // Define the index model 45 SearchIndexModel indexModel = new SearchIndexModel( 46 indexName, 47 definition, 48 SearchIndexType.vectorSearch()); 49 50 // Create the filtered index 51 try { 52 List<String> result = collection.createSearchIndexes(Collections.singletonList(indexModel)); 53 System.out.println("New search index named " + result.get(0) + " is building."); 54 } catch (Exception e) { 55 throw new RuntimeException("Error creating index: " + e); 56 } 57 58 // Wait for Atlas to build the index 59 System.out.println("Polling to check if the index is ready. This may take up to a minute."); 60 61 ListSearchIndexesIterable<Document> searchIndexes = collection.listSearchIndexes(); 62 Document doc = null; 63 while (doc == null) { 64 try (MongoCursor<Document> cursor = searchIndexes.iterator()) { 65 if (!cursor.hasNext()) { 66 break; 67 } 68 Document current = cursor.next(); 69 String name = current.getString("name"); 70 // When the index completes building, it becomes `queryable` 71 boolean queryable = current.getBoolean("queryable"); 72 if (name.equals(indexName) && queryable) { 73 doc = current; 74 } else { 75 Thread.sleep(500); 76 } 77 } catch (Exception e) { 78 throw new RuntimeException("Failed to list search indexes: " + e); 79 mongoClient.close(); 80 } 81 } 82 System.out.println(indexName + " is ready for querying."); 83 84 } catch (Exception e) { 85 throw new RuntimeException("Error connecting to MongoDB: " + e); 86 } 87 } 88 }
MongoDB Node ドライバーv 6.6.0以降を使用してコレクション用に Atlas Vector Search インデックスを作成するには、次の手順を実行します。
.js
ファイルを作成し、ファイル内にインデックスを定義します。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connectionString>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("<databaseName>"); 11 const collection = database.collection("<collectionName>"); 12 13 // define your Atlas Vector Search index 14 const index = { 15 name: "<indexName>", 16 type: "vectorSearch", 17 definition: { 18 "fields": [ 19 { 20 "type": "vector", 21 "numDimensions": <numberOfDimensions>, 22 "path": "<fieldToIndex>", 23 "similarity": "euclidean | cosine | dotProduct" 24 }, 25 { 26 "type": "filter", 27 "path": "<fieldToIndex>" 28 }, 29 ... 30 ] 31 } 32 } 33 34 // run the helper method 35 const result = await collection.createSearchIndex(index); 36 console.log(`New search index named ${result} is building.`); 37 // wait for the index to be ready to query 38 console.log("Polling to check if the index is ready. This may take up to a minute.") 39 let isQueryable = false; 40 while (!isQueryable) { 41 const cursor = collection.listSearchIndexes(); 42 for await (const index of cursor) { 43 if (index.name === result) { 44 if (index.queryable) { 45 console.log(`${result} is ready for querying.`); 46 isQueryable = true; 47 } else { 48 await new Promise(resolve => setTimeout(resolve, 5000)); 49 } 50 } 51 } 52 } 53 } finally { 54 await client.close(); 55 } 56 } 57 run().catch(console.dir);
例
vector-index.js
という名前のファイルを作成します。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
例
以下をコピーしてvector-index.js
ファイルに貼り付け、 <connectionString>
プレースホルダー値を置き換えます。 The following index definition indexes the plot_embedding
field as the vector
type and the genres
and year
fields as the filter
type in an Atlas Vector Search index. plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 The index definition specifies 1536
vector dimensions and measures similarity using euclidean
distance.
次のインデックス定義は、ベクトル検索を実行するためにベクトル埋め込みフィールド( plot_embedding
)のみをインデックスします。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connectionString>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("sample_mflix"); 11 const collection = database.collection("embedded_movies"); 12 13 // define your Atlas Vector Search index 14 const index = { 15 name: "vector_index", 16 type: "vectorSearch", 17 definition: { 18 "fields": [ 19 { 20 "type": "vector", 21 "numDimensions": 1536, 22 "path": "plot_embedding", 23 "similarity": "euclidean" 24 } 25 ] 26 } 27 } 28 29 // run the helper method 30 const result = await collection.createSearchIndex(index); 31 console.log(`New search index named ${result} is building.`); 32 33 // wait for the index to be ready to query 34 console.log("Polling to check if the index is ready. This may take up to a minute.") 35 let isQueryable = false; 36 while (!isQueryable) { 37 const cursor = collection.listSearchIndexes(); 38 for await (const index of cursor) { 39 if (index.name === result) { 40 if (index.queryable) { 41 console.log(`${result} is ready for querying.`); 42 isQueryable = true; 43 } else { 44 await new Promise(resolve => setTimeout(resolve, 5000)); 45 } 46 } 47 } 48 } 49 } finally { 50 await client.close(); 51 } 52 } 53 run().catch(console.dir);
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connectionString>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("sample_mflix"); 11 const collection = database.collection("embedded_movies"); 12 13 // define your Atlas Vector Search index 14 const index = { 15 name: "vector_index", 16 type: "vectorSearch", 17 definition: { 18 "fields": [ 19 { 20 "type": "vector", 21 "numDimensions": 1536, 22 "path": "plot_embedding", 23 "similarity": "euclidean" 24 }, 25 { 26 "type": "filter", 27 "path": "genres" 28 }, 29 { 30 "type": "filter", 31 "path": "year" 32 } 33 ] 34 } 35 } 36 37 // run the helper method 38 const result = await collection.createSearchIndex(index); 39 console.log(`New search index named ${result} is building.`); 40 41 // wait for the index to be ready to query 42 console.log("Polling to check if the index is ready. This may take up to a minute.") 43 let isQueryable = false; 44 while (!isQueryable) { 45 const cursor = collection.listSearchIndexes(); 46 for await (const index of cursor) { 47 if (index.name === result) { 48 if (index.queryable) { 49 console.log(`${result} is ready for querying.`); 50 isQueryable = true; 51 } else { 52 await new Promise(resolve => setTimeout(resolve, 5000)); 53 } 54 } 55 } 56 } 57 } finally { 58 await client.close(); 59 } 60 } 61 run().catch(console.dir);
PyMongoドライバー v 4.7以降を使用してコレクション用に Atlas Vector Search インデックスを作成するには、次の手順を実行します。
.py
ファイルを作成し、ファイル内にインデックスを定義します。
1 import pymongo 2 from pymongo.mongo_client import MongoClient 3 from pymongo.operations import SearchIndexModel 4 5 # Connect to your Atlas deployment 6 uri = "<connectionString>" 7 client = MongoClient(uri) 8 9 # Access your database and collection 10 database = client["<databaseName>"] 11 collection = database["<collectionName>"] 12 13 # Create your index model, then create the search index 14 search_index_model = SearchIndexModel( 15 definition={ 16 "fields": [ 17 { 18 "type": "vector", 19 "numDimensions": <numberofDimensions>, 20 "path": "<fieldToIndex>", 21 "similarity": "euclidean | cosine | dotProduct" 22 }, 23 { 24 "type": "filter", 25 "path": "<fieldToIndex>" 26 }, 27 ... 28 ] 29 }, 30 name="<indexName>", 31 type="vectorSearch", 32 ) 33 34 result = collection.create_search_index(model=search_index_model) 35 print("New search index named " + result + " is building.") 36 37 # Wait for initial sync to complete 38 print("Polling to check if the index is ready. This may take up to a minute.") 39 predicate=None 40 if predicate is None: 41 predicate = lambda index: index.get("queryable") is True 42 43 while True: 44 indices = list(collection.list_search_indexes(result)) 45 if len(indices) and predicate(indices[0]): 46 break 47 time.sleep(5) 48 print(result + " is ready for querying.") 49 50 client.close()
詳細については、「 create_search_index() 」を参照してください。 使用して複数のドキュメントを挿入できます。
1 from pymongo.mongo_client import MongoClient 2 from pymongo.operations import SearchIndexModel 3 4 def create_indexes(): 5 # Connect to your Atlas deployment 6 uri = "<connectionString>" 7 client = MongoClient(uri) 8 9 # Access your database and collection 10 database = client["<databaseName>"] 11 collection = database["<collectionName>"] 12 13 # Create your index models and add them to an array 14 first_model = SearchIndexModel( 15 definition={ 16 "fields": [ 17 { 18 "type": "vector", 19 "numDimensions": <numberOfDimensions>, 20 "path": "<fieldToIndex>", 21 "similarity": "euclidean | cosine | dotProduct" 22 }, 23 { 24 "type": "filter", 25 "path": "<fieldToIndex>" 26 }, 27 ... 28 ] 29 }, 30 name="<indexName>", 31 type="vectorSearch", 32 ) 33 34 second_model = SearchIndexModel( 35 definition={ 36 "fields": [ 37 { 38 "type": "vector", 39 "numDimensions": <numberOfDimensions>, 40 "path": "<fieldToIndex>", 41 "similarity": "euclidean | cosine | dotProduct" 42 }, 43 { 44 "type": "filter", 45 "path": "<fieldToIndex>" 46 }, 47 ... 48 ] 49 }, 50 name="<index name>", 51 type="vectorSearch", 52 ) 53 54 ... 55 56 idx_models = [first_model, second_model, ...] 57 58 # Create the search indexes 59 result = collection.create_search_indexes(models=idx_models) 60 print(result) 61 62 client.close()
詳細については、「 create_search_indexs() 」を参照してください。 使用して複数のドキュメントを挿入できます。
例
vector-index.py
という名前のファイルを作成します。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
例
以下をコピーしてvector-index.py
に貼り付け、 <connectionString>
プレースホルダー値を置き換えます。 次のインデックス定義は、Atlas Vector Search インデックスで、 フィールドを タイプとしてインデックス化し、 フィールドとplot_embedding
vector
genres
year
フィールドを タイプとしてインデックス化します。filter
plot_embedding
フィールドには、OpenAI のtext-embedding-ada-002
埋め込みモデルを使用して作成された埋め込みが含まれます。 インデックス定義では、 1536
ベクトル次元を指定し、 euclidean
距離を使用して類似性を測定します。
次のインデックス定義は、ベクトル検索を実行するためにベクトル埋め込みフィールド( plot_embedding
)のみをインデックスします。
1 from pymongo.mongo_client import MongoClient 2 from pymongo.operations import SearchIndexModel 3 import time 4 5 # Connect to your Atlas deployment 6 uri = "<connectionString>" 7 client = MongoClient(uri) 8 9 # Access your database and collection 10 database = client["sample_mflix"] 11 collection = database["embedded_movies"] 12 13 # Create your index model, then create the search index 14 search_index_model = SearchIndexModel( 15 definition={ 16 "fields": [ 17 { 18 "type": "vector", 19 "path": "plot_embedding", 20 "numDimensions": 1536, 21 "similarity": "euclidean" 22 } 23 ] 24 }, 25 name="vector_index", 26 type="vectorSearch", 27 ) 28 29 result = collection.create_search_index(model=search_index_model) 30 print("New search index named " + result + " is building.") 31 # Wait for initial sync to complete 32 print("Polling to check if the index is ready. This may take up to a minute.") 33 predicate=None 34 if predicate is None: 35 predicate = lambda index: index.get("queryable") is True 36 37 while True: 38 indices = list(collection.list_search_indexes(name)) 39 if len(indices) and predicate(indices[0]): 40 break 41 time.sleep(5) 42 print(result + " is ready for querying.") 43 44 client.close()
このインデックス定義は、次のフィールドをインデックスします。
データを事前にフィルタリングするためのstringフィールド(
genres
)と数値フィールド(year
)。事前フィルタリングされたデータに対してベクトル検索を実行するためのベクトル埋め込みフィールド(
plot_embedding
)。
1 from pymongo.mongo_client import MongoClient 2 from pymongo.operations import SearchIndexModel 3 import time 4 5 # Connect to your Atlas deployment 6 uri = "<connectionString>" 7 client = MongoClient(uri) 8 9 # Access your database and collection 10 database = client["sample_mflix"] 11 collection = database["embedded_movies"] 12 13 # Create your index model, then create the search index 14 search_index_model = SearchIndexModel( 15 definition={ 16 "fields": [ 17 { 18 "type": "vector", 19 "path": "plot_embedding", 20 "numDimensions": 1536, 21 "similarity": "euclidean" 22 }, 23 { 24 "type": "filter", 25 "path": "genres" 26 }, 27 { 28 "type": "filter", 29 "path": "year" 30 } 31 ] 32 }, 33 name="vector_index", 34 type="vectorSearch", 35 ) 36 37 result = collection.create_search_index(model=search_index_model) 38 print("New search index named " + result + " is building.") 39 # Wait for initial sync to complete 40 print("Polling to check if the index is ready. This may take up to a minute.") 41 predicate=None 42 if predicate is None: 43 predicate = lambda index: index.get("queryable") is True 44 45 while True: 46 indices = list(collection.list_search_indexes(result)) 47 if len(indices) and predicate(indices[0]): 48 break 49 time.sleep(5) 50 print(result + " is ready for querying.") 51 52 client.close()
Atlas Vector Search インデックスの表示
Atlas UI、Atlas 管理 API、Atlas CLI、 mongosh
、またはサポートされているMongoDB ドライバーから、すべてのコレクションの Atlas Vector Search インデックスを表示できます。
必要なアクセス権
Atlas Vector Search インデックスを表示するには、 Project Search Index Editor
以上のロールが必要です。
注意
mongosh
コマンドまたはドライバーヘルパーメソッドを使用して、すべての Atlas クラスター階層で Atlas Search インデックスを取得できます。サポートされているドライバー バージョンのリストについては、 「サポートされているクライアント」 を参照してください。
手順
➤ [言語の選択]ドロップダウン メニューを使用して、このセクション内の例の言語を設定します。
Atlas Administration API を使用してコレクションのすべての Atlas Vector Search インデックスを検索するには、データベースとコレクションの名前を指定して Atlas Search indexes
エンドポイントにGET
リクエストを送信します。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --include \ 4 --request GET "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{databaseName}/{collectionName}"
エンドポイントの構文とパラメータの詳細については、「 1 つのコレクションのすべての Atlas Search インデックスを返す 」を参照してください。
Administration Atlas Vector Searchを使用してコレクション用の インデックスをAtlasAPI 1GET
つ取得するには、取得対象のインデックスの一意のAtlas Searchindexes
IDまたは名前(4 行)を指定して エンドポイントに リクエストを送信します。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --include \ 4 --request GET "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{indexId} | https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{databaseName}/{collectionName}/{indexName|indexId}"
エンドポイントの構文とパラメータの詳細については、 「 名前で 1 つの取得 」および「 ID で 1 つの取得 」を参照してください。
Atlas CLI を使用してコレクションの Atlas Vector Search インデックスを返すには、次の手順を実行します。
次のコマンドを実行して、コレクションのインデックスを検索します。
atlas clusters search indexes list --clusterName [cluster_name] --db <db-name> --collection <collection-name>
コマンドで、次のプレースホルダー値を置き換えます。
cluster-name
- インデックス作成されたコレクションを含む Atlas クラスターの名前。db-name
- インデックスを検索するコレクションを含むデータベースの名前。collection-name
- インデックスを検索するコレクションの名前。
コマンド構文とパラメーターについて詳しくは、Atlas CLI ドキュメントのAtlas クラスター検索インデックス リストコマンドを参照してください。
AtlasGoClustersAtlas で、プロジェクトの ページにGoします。
まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーション バーのOrganizationsメニュー
まだ表示されていない場合は、ナビゲーション バーのProjectsメニューから目的のプロジェクトを選択します。
まだ表示されていない場合は、サイドバーの [Clusters] をクリックします。
[ Clusters (クラスター) ] ページが表示されます。
GoAtlas Searchクラスターの ページに します。
GoAtlas Searchページには、サイドバー、Data Explorer 、またはクラスターの詳細ページから できます。
サイドバーで、 Services見出しの下のAtlas Searchをクリックします。
[ Select data sourceドロップダウンからクラスターを選択し、[ Go to Atlas Search ] をクリックします。
Atlas Searchページが表示されます。
クラスターの [Browse Collections] ボタンをクリックします。
データベースを展開し、コレクションを選択します。
コレクションのSearch Indexesタブをクリックします。
Atlas Searchページが表示されます。
クラスタの名前をクリックします。
[Atlas Search] タブをクリックします。
Atlas Searchページが表示されます。
ページには、ページのインデックスに関する次の詳細が表示されます。
名前 | インデックスを識別するラベル。 |
インデックス タイプ | Atlas Search または Atlas Vector Search インデックスを示すラベル。 値には、次のものが含まれます。
|
インデックス フィールド | このインデックスがインデックスを作成するフィールドを含むリスト。 |
ステータス | クラスターのプライマリ ノード上のインデックスの現在の状態。 有効な値については、「インデックス ステータス 」を参照してください。 |
サイズ | プライマリ ノードのインデックスのサイズ。 |
ドキュメント | コレクション内のドキュメントの総数のうち、インデックスが作成されたドキュメントの数。 |
アクション | インデックスに対して実行できるアクション。 ここでは、次の作業が可能です。 Search TesterUIでは、 |
mongosh
を使用してコレクションの Atlas Vector Search インデックスを表示するには、次の手順を実行します。
mongosh
を使用して Atlas クラスターに接続します。
詳しくは、「 mongosh
経由で接続 」を参照してください。
db.collection.getSearchIndexes()
メソッドを実行します。
db.collection.getSearchIndexes()
メソッドの構文は次のとおりです。
1 db.<collectionName>.getSearchIndexes( "<index-name>" );
MongoDB Go ドライバー v1.16.0 以降を使用してコレクションの Atlas Vector Search インデックスを表示するには、次の手順を実行します。
.go
ファイルを作成し、SearchIndexes().List()
メソッドを使用してインデックスを検索します。
1 package main 2 3 import ( 4 "context" 5 "encoding/json" 6 "fmt" 7 "log" 8 9 "go.mongodb.org/mongo-driver/bson" 10 "go.mongodb.org/mongo-driver/mongo" 11 "go.mongodb.org/mongo-driver/mongo/options" 12 ) 13 14 func main() { 15 ctx := context.Background() 16 17 // Replace the placeholder with your Atlas connection string 18 const uri = "<connectionString>" 19 20 // Connect to your Atlas cluster 21 clientOptions := options.Client().ApplyURI(uri) 22 client, err := mongo.Connect(ctx, clientOptions) 23 if err != nil { 24 log.Fatalf("failed to connect to the server: %v", err) 25 } 26 defer func() { _ = client.Disconnect(ctx) }() 27 28 // Set the namespace 29 coll := client.Database("<databaseName>").Collection("<collectionName>") 30 31 // Specify the options for the index to retrieve 32 indexName := "<indexName>" 33 opts := options.SearchIndexes().SetName(indexName) 34 35 // Get the index 36 cursor, err := coll.SearchIndexes().List(ctx, opts) 37 if err != nil { 38 log.Fatalf("failed to get the index: %v", err) 39 } 40 41 // Print the index details to the console as JSON 42 var results []bson.M 43 if err := cursor.All(ctx, &results); err != nil { 44 log.Fatalf("failed to unmarshal results to bson: %v", err) 45 } 46 res, err := json.Marshal(results) 47 if err != nil { 48 log.Fatalf("failed to marshal results to json: %v", err) 49 } 50 fmt.Println(string(res)) 51 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | コレクションを含むデータベース。 |
<collectionName> | インデックスを検索するコレクション。 |
<indexName> | 特定のインデックスを検索する場合は、インデックスの名前。 コレクションのすべてのインデックスを返すには、この値を省略します。 |
MongoDB Java ドライバー v5.2.0 以降を使用してコレクションの Atlas Vector Search インデックスを表示するには、次の手順を実行します。
.java
ファイルを作成し、listSearchIndexes()
メソッドを使用してインデックスを検索します。
1 import com.mongodb.client.MongoClient; 2 import com.mongodb.client.MongoClients; 3 import com.mongodb.client.MongoCollection; 4 import com.mongodb.client.MongoDatabase; 5 import org.bson.Document; 6 7 public class ViewVectorIndex { 8 9 public static void main(String[] args) { 10 11 // Replace the placeholder with your Atlas connection string 12 String uri = "<connectionString>"; 13 14 // Connect to your Atlas cluster 15 try (MongoClient mongoClient = MongoClients.create(uri)) { 16 17 // Set the namespace 18 MongoDatabase database = mongoClient.getDatabase("<databaseName>"); 19 MongoCollection<Document> collection = database.getCollection("<collectionName>"); 20 21 // Specify the options for the index to retrieve 22 String indexName = "<indexName>"; 23 24 // Get the index and print details to the console as JSON 25 try { 26 Document listSearchIndex = collection.listSearchIndexes().name(indexName).first(); 27 if (listSearchIndex != null) { 28 System.out.println("Index found: " + listSearchIndex.toJson()); 29 } else { 30 System.out.println("Index not found."); 31 } 32 } catch (Exception e) { 33 throw new RuntimeException("Error finding index: " + e); 34 } 35 36 } catch (Exception e) { 37 throw new RuntimeException("Error connecting to MongoDB: " + e); 38 } 39 } 40 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | コレクションを含むデータベース。 |
<collectionName> | インデックスを検索するコレクション。 |
<indexName> | 特定のインデックスを検索する場合は、インデックスの名前。 コレクションのすべてのインデックスを返すには、この値を省略します。 |
MongoDB Node ドライバーv 6.6.0以降を使用してコレクションの Atlas Vector Search インデックスを表示するには、次の手順を実行します。
.js
ファイルを作成し、listSearchIndexes()
メソッドを使用してインデックスを検索します。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connectionString>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("<databaseName>"); 11 const collection = database.collection("<collectionName>"); 12 13 // run the helper method 14 const result = await collection.listSearchIndexes("<indexName>").toArray(); 15 console.log(result); 16 } finally { 17 await client.close(); 18 } 19 } 20 run().catch(console.dir);
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | コレクションを含むデータベース。 |
<collectionName> | インデックスを検索するコレクション。 |
<indexName> | 特定のインデックスを検索する場合は、インデックスの名前。 コレクションのすべてのインデックスを返すには、この値を省略します。 |
PyMongoドライバー v 4.7以降を使用してコレクションの Atlas Vector Search インデックスを表示するには、次の手順を実行します。
.py
ファイルを作成し、list_search_indexes()
メソッドを使用してコレクションのインデックスを取得します。
1 from pymongo.mongo_client import MongoClient 2 3 # Connect to your Atlas deployment 4 uri = "<connectionString>" 5 client = MongoClient(uri) 6 7 # Access your database and collection 8 database = client["<databaseName>"] 9 collection = database["<collectionName>"] 10 11 # Get a list of the collection's search indexes and print them 12 cursor = collection.list_search_indexes() 13 for index in cursor: 14 print(index)
詳しくは、 list_search_indexs() を参照してください 使用して複数のドキュメントを挿入できます。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | コレクションを含むデータベースの名前。 |
<collectionName> | コレクションの名前。 |
Atlas Vector Search インデックスの編集
既存の Atlas Vector Search インデックスのインデックス定義は、Atlas UI、Atlas Administration API、Atlas CLI、 mongosh
、またはサポートされているMongoDB ドライバーから変更できます。 インデックスの名前を変更したり、インデックス タイプを変更したりすることはできません。 インデックスの名前またはタイプを変更する必要がある場合は、新しいインデックスを作成し、古いインデックスを削除する必要があります。
重要
インデックスを編集すると、Atlas Vector Search はそのインデックスを再構築します。 インデックスの再ビルド中も、古いインデックス定義を使用してベクトル検索クエリを引き続き実行できます。 インデックスの再構築が完了すると、古いインデックスは自動的に置き換えられます。 このプロセスは、標準の Atlas Search インデックスと同じプロセスに従います。
必要なアクセス権
Atlas Vector Search インデックスを編集するには、 Project Search Index Editor
以上のロールが必要です。
注意
mongosh
コマンドまたはドライバーヘルパーメソッドを使用して、すべての Atlas クラスター階層の Atlas Search インデックスを編集できます。サポートされているドライバー バージョンのリストについては、 「サポートされているクライアント」 を参照してください。
手順
➤ [言語を選択 ] ドロップダウン メニューを使用して、インデックスの編集に使用するクライアントを選択します。
Atlas Administration API を使用してコレクションの Atlas Vector Search インデックスを編集するには、編集するインデックスの一意の ID または名前( 4行)を指定して Atlas Search indexes
エンドポイントにPATCH
リクエストを送信します。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest --include \ 2 --header "Accept: application/json" \ 3 --header "Content-Type: application/json" \ 4 --request PATCH "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{indexId} | https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{databaseName}/{collectionName}/{indexName|indexId}" \ 5 --data' 6 { 7 "database": "<name-of-database>", 8 "collectionName": "<name-of-collection>", 9 "type": "vectorSearch", 10 "name": "<index-name>", 11 "definition": { 12 "fields":[ 13 { 14 "type": "vector", 15 "path": <field-to-index>, 16 "numDimensions": <number-of-dimensions>, 17 "similarity": "euclidean | cosine | dotProduct" 18 }, 19 { 20 "type": "filter", 21 "path": "<field-to-index>" 22 }, 23 ... 24 } 25 ] 26 }'
エンドポイントの構文とパラメータの詳細については、「名前を使用して 1 つの更新 」および「 ID を使用して 1 つの更新 」を参照してください。
Atlas CLI を使用してコレクションの Atlas Vector Search インデックスを編集するには、次の手順を実行します。
.json
ファイルを作成し、ファイル内にインデックスへの変更を定義します。
インデックス定義は、次の形式のようになります。
1 { 2 "database": "<name-of-database>", 3 "collectionName": "<name-of-collection>", 4 "type": "vectorSearch", 5 "name": "<index-name>", 6 "fields":[ 7 { 8 "type": "vector", 9 "path": "<field-to-index>", 10 "numDimensions": <number-of-dimensions>, 11 "similarity": "euclidean | cosine | dotProduct" 12 }, 13 { 14 "type": "filter", 15 "path": "<field-to-index>" 16 }, 17 ... 18 ] 19 }
以下のプレースホルダー値を置き換えて、ファイルを保存します。
<name-of-database> | インデックスを作成するコレクションを含むデータベース。 |
<name-of-collection> | インデックスを作成するコレクション。 |
<index-name> | インデックスの名前。 インデックス名を省略すると、Atlas Vector Search はインデックスに vector_index という名前を付けます。 |
<number-of-dimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<field-to-index> | インデックスするベクトル フィールドとフィルター フィールド。 |
以下のコマンドを実行して、インデックスを更新します。
atlas clusters search indexes update <indexId> --clusterName [cluster_name] --file [vector-_index].json
コマンドで、次のプレースホルダー値を置き換えます。
cluster_name
- インデックスを更新するコレクションを含む Atlas クラスターの名前。vector_index
- Atlas Vector Search インデックスの変更されたインデックス定義を含むJSONファイルの名前
コマンド構文とパラメーターについて詳しくは、Atlas CLI ドキュメントのAtlas クラスター検索インデックス更新コマンド を参照してください。
AtlasGoClustersAtlas で、プロジェクトの ページにGoします。
まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーション バーのOrganizationsメニュー
まだ表示されていない場合は、ナビゲーション バーのProjectsメニューから目的のプロジェクトを選択します。
まだ表示されていない場合は、サイドバーの [Clusters] をクリックします。
[ Clusters (クラスター) ] ページが表示されます。
GoAtlas Searchクラスターの ページに します。
GoAtlas Searchページには、サイドバー、Data Explorer 、またはクラスターの詳細ページから できます。
サイドバーで、 Services見出しの下のAtlas Searchをクリックします。
[ Select data sourceドロップダウンからクラスターを選択し、[ Go to Atlas Search ] をクリックします。
Atlas Searchページが表示されます。
クラスターの [Browse Collections] ボタンをクリックします。
データベースを展開し、コレクションを選択します。
コレクションのSearch Indexesタブをクリックします。
Atlas Searchページが表示されます。
クラスタの名前をクリックします。
[Atlas Search] タブをクリックします。
Atlas Searchページが表示されます。
インデックスを編集します。
編集する
vectorSearch
型インデックスを見つけます。そのインデックスのActionsドロップダウンから [ Edit Indexをクリックします。
現在の構成設定を確認し、必要に応じて編集します。
Atlas Vector Search インデックスのフィールドの詳細については、 「ベクトル検索のフィールドにインデックスを作成する方法」 を参照してください。
変更を適用するには、 Saveをクリックします。
インデックスのステータスがActiveからBuildingに変わります。 この状態では、アップデートされたインデックスが使用可能になるまで、Atlas Vector Search が古いインデックスを削除しないため、古いインデックスを使用し続けることができます。 ステータスがActiveに戻ったら、変更されたインデックスは使用可能になります。
mongosh
を使用してコレクションの Atlas Vector Search インデックスを編集するには、次の手順を実行します。
mongosh
を使用して Atlas クラスターに接続します。
詳しくは、「 mongosh
経由で接続 」を参照してください。
db.collection.updateSearchIndex()
メソッドを実行します。
db.collection.updateSearchIndex()
メソッドの構文は次のとおりです。
1 db.<collectionName>.updateSearchIndex( 2 "<index-name>", 3 { 4 fields: [ 5 { 6 "type": "vector", 7 "numDimensions": <number-of-dimensions>, 8 "path": "<field-to-index>", 9 "similarity": "euclidean | cosine | dotProduct" 10 }, 11 { 12 "type": "filter", 13 "path": "<field-to-index>" 14 }, 15 ... 16 ] 17 } 18 );
MongoDB Go ドライバ v1.16.0 以降を使用してコレクションのAtlas Vector Search インデックスを更新するには、以下の手順を実行します。
go
ファイルを作成し、ファイル内にインデックスへの変更を定義します。
1 package main 2 3 import ( 4 "context" 5 "fmt" 6 "log" 7 8 "go.mongodb.org/mongo-driver/mongo" 9 "go.mongodb.org/mongo-driver/mongo/options" 10 ) 11 12 func main() { 13 ctx := context.Background() 14 15 // Replace the placeholder with your Atlas connection string 16 const uri = "<connection-string>" 17 18 // Connect to your Atlas cluster 19 clientOptions := options.Client().ApplyURI(uri) 20 client, err := mongo.Connect(ctx, clientOptions) 21 if err != nil { 22 log.Fatalf("failed to connect to the server: %v", err) 23 } 24 defer func() { _ = client.Disconnect(ctx) }() 25 26 // Set the namespace 27 coll := client.Database("<databaseName>").Collection("<collectionName>") 28 indexName := "<indexName>" 29 30 type vectorDefinitionField struct { 31 Type string `bson:"type"` 32 Path string `bson:"path"` 33 NumDimensions int `bson:"numDimensions"` 34 Similarity string `bson:"similarity"` 35 } 36 37 type vectorDefinition struct { 38 Fields []vectorDefinitionField `bson:"fields"` 39 } 40 41 definition := vectorDefinition{ 42 Fields: []vectorDefinitionField{{ 43 Type: "vector", 44 Path: "<fieldToIndex>", 45 NumDimensions: <numberOfDimensions>, 46 Similarity: "euclidean | cosine | dotProduct"}}, 47 } 48 err = coll.SearchIndexes().UpdateOne(ctx, indexName, definition) 49 50 if err != nil { 51 log.Fatalf("failed to update the index: %v", err) 52 } 53 54 fmt.Println("Successfully updated the search index") 55 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
MongoDB Java ドライバー v5.2.0 以降を使用してコレクションの Atlas Vector Search インデックスを編集するには、次の手順を実行します。
.java
ファイルを作成し、ファイル内にインデックスへの変更を定義します。
1 import com.mongodb.client.MongoClient; 2 import com.mongodb.client.MongoClients; 3 import com.mongodb.client.MongoCollection; 4 import com.mongodb.client.MongoDatabase; 5 import org.bson.Document; 6 import org.bson.conversions.Bson; 7 8 import java.util.Collections; 9 10 public class EditVectorIndex { 11 12 public static void main(String[] args) { 13 14 // Replace the placeholder with your Atlas connection string 15 String uri = "<connectionString>"; 16 17 // Connect to your Atlas cluster 18 try (MongoClient mongoClient = MongoClients.create(uri)) { 19 20 // Set the namespace 21 MongoDatabase database = mongoClient.getDatabase("<databaseName>"); 22 MongoCollection<Document> collection = database.getCollection("<collectionName>"); 23 24 // Define the index changes 25 String indexName = "<indexName>"; 26 Bson definition = new Document( 27 "fields", 28 Collections.singletonList( 29 new Document("type", "vector") 30 .append("path", "<fieldToIndex>") 31 .append("numDimensions", <numberOfDimensions>) 32 .append("similarity", "euclidean | cosine | dotProduct") 33 ) 34 ); 35 36 // Update the index 37 try { 38 collection.updateSearchIndex(indexName, definition); 39 System.out.println("Successfully updated the index"); 40 } catch (Exception e) { 41 throw new RuntimeException("Error creating index: " + e); 42 mongoClient.close(); 43 } 44 45 } catch (Exception e) { 46 throw new RuntimeException("Error connecting to MongoDB: " + e); 47 } 48 } 49 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
MongoDB Node ドライバーv 6.6.0以降を使用してコレクションの Atlas Vector Search インデックスを更新するには、次の手順を実行します。
.js
ファイルを作成し、ファイル内にインデックスへの変更を定義します。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connection-string>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("<databaseName>"); 11 const collection = database.collection("<collectionName>"); 12 13 // define your Atlas Search index 14 const index = { 15 name: "<indexName>", 16 type: "vectorSearch", 17 //updated search index definition 18 definition: { 19 "fields": [ 20 { 21 "type": "vector", 22 "numDimensions": <numberOfDimensions>, 23 "path": "<field-to-index>", 24 "similarity": "euclidean | cosine | dotProduct" 25 }, 26 { 27 "type": "filter", 28 "path": "<fieldToIndex>" 29 }, 30 ... 31 ] 32 } 33 } 34 35 // run the helper method 36 await collection.updateSearchIndex("<index-name>", index); 37 } finally { 38 await client.close(); 39 } 40 } 41 run().catch(console.dir);
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
PyMongoドライバー v 4.7以降を使用してコレクションの Atlas Vector Search インデックスを更新するには、次の手順を実行します。
.py
ファイルを作成し、ファイル内にインデックスへの変更を定義します。
1 from pymongo.mongo_client import MongoClient 2 3 # Connect to your Atlas deployment 4 uri = "<connectionString>" 5 client = MongoClient(uri) 6 7 # Access your database and collection 8 database = client["<databaseName>"] 9 collection = database["<collectionName>"] 10 11 definition = { 12 "fields": [ 13 { 14 "type": "vector", 15 "numDimensions": <numberofDimensions>, 16 "path": "<fieldToIndex>", 17 "similarity": "euclidean | cosine | dotProduct" 18 }, 19 { 20 "type": "filter", 21 "path": "<fieldToIndex>" 22 }, 23 ... 24 ] 25 } 26 27 # Update your search index 28 collection.update_search_index("<indexName>", definition)
詳しくは、 update_search_index() 使用して複数のドキュメントを挿入できます。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas接続string 。 詳しくは、「ドライバーによる接続 」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの構成。 インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
<numberOfDimensions> | Atlas Vector Search がインデックス作成時およびクエリ時に強制されるベクトル次元の数。 |
<fieldToIndex> | インデックスするベクトル フィールドとフィルター フィールド。 |
Atlas Vector Search インデックスの削除
Atlas Vector Search インデックスは、Atlas UI、Atlas Administration API、Atlas CLI、 mongosh
、またはサポートされているMongoDB ドライバーからいつでも削除できます。
必要なアクセス権
Atlas Vector Search インデックスを削除するには、 Project Search Index Editor
以上のロールが必要です。
注意
mongosh
コマンドまたはドライバーヘルパーメソッドを使用して、すべての Atlas クラスター階層上の Atlas Search インデックスを削除できます。サポートされているドライバー バージョンのリストについては、 「サポートされているクライアント」 を参照してください。
手順
➤ [言語を選択 ] ドロップダウン メニューを使用して、インデックスを削除するために使用するクライアントを選択します。
Atlas Administration API を使用してコレクションの Atlas Vector Search インデックスを削除するには、一意の ID または削除するインデックスの名前を指定して、Atlas Search indexes
エンドポイントにDELETE
リクエストを送信します。
1 curl --user "{PUBLIC-KEY}:{PRIVATE-KEY}" --digest \ 2 --header "Accept: application/json" \ 3 --include \ 4 --request DELETE "https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{indexId} | https://cloud.mongodb.com/api/atlas/v2/groups/{groupId}/clusters/{clusterName}/search/indexes/{databaseName}/{collectionName}/{indexName|indexId}"
エンドポイントの構文とパラメータの詳細については、「名前を使用して1 つの検索インデックスを削除 」および「 ID を使用して 1 つの検索インデックスを削除 」を参照してください。
Atlas CLI を使用してコレクションの Atlas Vector Search インデックスを削除するには、次の手順を実行します。
コマンドを実行してインデックスを削除します。
atlas clusters search indexes delete <indexId> [options]
コマンドで、 indexId
プレースホルダー値を削除するインデックスの一意の識別子に置き換えます。
コマンド構文とパラメーターについて詳しくは、Atlas CLI ドキュメントのAtlas クラスター検索インデックス削除コマンドを参照してください。
AtlasGoClustersAtlas で、プロジェクトの ページにGoします。
まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーション バーのOrganizationsメニュー
まだ表示されていない場合は、ナビゲーション バーのProjectsメニューから目的のプロジェクトを選択します。
まだ表示されていない場合は、サイドバーの [Clusters] をクリックします。
[ Clusters (クラスター) ] ページが表示されます。
GoAtlas Searchクラスターの ページに します。
GoAtlas Searchページには、サイドバー、Data Explorer 、またはクラスターの詳細ページから できます。
サイドバーで、 Services見出しの下のAtlas Searchをクリックします。
[ Select data sourceドロップダウンからクラスターを選択し、[ Go to Atlas Search ] をクリックします。
Atlas Searchページが表示されます。
クラスターの [Browse Collections] ボタンをクリックします。
データベースを展開し、コレクションを選択します。
コレクションのSearch Indexesタブをクリックします。
Atlas Searchページが表示されます。
クラスタの名前をクリックします。
[Atlas Search] タブをクリックします。
Atlas Searchページが表示されます。
mongosh
を使用してコレクションの Atlas Vector Search インデックスを削除するには、次の手順を実行します。
mongosh
を使用して Atlas クラスターに接続します。
詳しくは、「 mongosh
経由で接続 」を参照してください。
db.collection.dropSearchIndex()
メソッドを実行します。
db.collection.dropSearchIndex()
メソッドの構文は次のとおりです。
1 db.<collectionName>.dropSearchIndex( "<index-name>" );
MongoDB Go ドライバー v1.16.0 以降を使用して、コレクションの Atlas Vector Search インデックスを削除するには、以下の手順を実行します。
.go
ファイルを作成し、SearchIndexes().DropOne()
メソッドを使用してインデックスを削除します。
1 package main 2 3 import ( 4 "context" 5 "fmt" 6 "log" 7 8 "go.mongodb.org/mongo-driver/mongo" 9 "go.mongodb.org/mongo-driver/mongo/options" 10 ) 11 12 func main() { 13 ctx := context.Background() 14 15 // Replace the placeholder with your Atlas connection string 16 const uri = "<connectionString>" 17 18 // Connect to your Atlas cluster 19 clientOptions := options.Client().ApplyURI(uri) 20 client, err := mongo.Connect(ctx, clientOptions) 21 if err != nil { 22 log.Fatalf("failed to connect to the server: %v", err) 23 } 24 defer func() { _ = client.Disconnect(ctx) }() 25 26 // Set the namespace 27 coll := client.Database("<databaseName>").Collection("<collectionName>") 28 indexName := "<indexName>" 29 30 err = coll.SearchIndexes().DropOne(ctx, indexName) 31 if err != nil { 32 log.Fatalf("failed to delete the index: %v", err) 33 } 34 35 fmt.Println("Successfully deleted the Vector Search index") 36 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
MongoDB Java ドライバー v5.2.0 以降を使用してコレクションの Atlas Vector Search インデックスを削除するには、次の手順を実行します。
.java
ファイルを作成し、collection.dropSearchIndex()
メソッドを使用してインデックスを削除します。
1 import com.mongodb.client.MongoClient; 2 import com.mongodb.client.MongoClients; 3 import com.mongodb.client.MongoCollection; 4 import com.mongodb.client.MongoDatabase; 5 import org.bson.Document; 6 7 public class DeleteIndex { 8 9 public static void main(String[] args) { 10 11 // Replace the placeholder with your Atlas connection string 12 String uri = "<connectionString>"; 13 14 // Connect to your Atlas cluster 15 try (MongoClient mongoClient = MongoClients.create(uri)) { 16 17 // Set the namespace 18 MongoDatabase database = mongoClient.getDatabase("<databaseName>"); 19 MongoCollection<Document> collection = database.getCollection("<collectionName>"); 20 21 // Specify the index to delete 22 String indexName = "<indexName>"; 23 24 try { 25 collection.dropSearchIndex(indexName); 26 } catch (Exception e) { 27 throw new RuntimeException("Error deleting index: " + e); 28 } 29 30 } catch (Exception e) { 31 throw new RuntimeException("Error connecting to MongoDB: " + e); 32 } 33 } 34 }
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
MongoDB Node ドライバーv 6.6.0以降を使用してコレクションの Atlas Vector Search インデックスを削除するには、次の手順を実行します。
.js
ファイルを作成し、dropSearchIndex()
メソッドを使用してインデックスを削除します。
1 const { MongoClient } = require("mongodb"); 2 3 // connect to your Atlas deployment 4 const uri = "<connectionString>"; 5 6 const client = new MongoClient(uri); 7 8 async function run() { 9 try { 10 const database = client.db("<databaseName>"); 11 const collection = database.collection("<collectionName>"); 12 13 // run the helper method 14 await collection.dropSearchIndex("<indexName>"); 15 16 } finally { 17 await client.close(); 18 } 19 } 20 run().catch(console.dir);
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | インデックスを作成するコレクションを含むデータベース。 |
<collectionName> | インデックスを作成するコレクション。 |
<indexName> | インデックスの名前。インデックス名を省略すると、Atlas Search はインデックスに vector_index という名前を付けます。 |
PyMongoドライバー v 4.7以降を使用してコレクションの Atlas Vector Search インデックスを削除するには、次の手順を実行します。
.py
ファイルを作成し、drop_search_index()
メソッドを使用してインデックスを削除します。
1 from pymongo.mongo_client import MongoClient 2 3 # Connect to your Atlas deployment 4 uri = "<connectionString>" 5 client = MongoClient(uri) 6 7 # Access your database and collection 8 database = client["<databaseName>"] 9 collection = database["<collectionName>"] 10 11 # Delete your search index 12 collection.drop_search_index("<indexName>")
詳細については、 drop_search_index() 使用して複数のドキュメントを挿入できます。
以下の値を置き換えて、ファイルを保存します。
<connectionString> | Atlas 接続文字列。詳しくは、「ドライバーによる接続」を参照してください。 |
<databaseName> | コレクションを含むデータベースの名前。 |
<collectionName> | コレクションの名前。 |
<indexName> | 削除するインデックスの名前。 |
インデックスのステータス
Atlas Vector Search インデックスを作成すると、 Status列にはクラスターのプライマリ ノードにおけるインデックスの現在の状態が表示されます。 クラスタ内のすべてのノードにおけるインデックスの状態を表示するには、ステータスの下にあるView status detailsリンクをクリックします。
Status 列が Active の場合、インデックスは使用可能です。そのほかの状態の場合は、インデックスに対するクエリに不完全な結果が返される場合があります。
ステータス | 説明 |
---|---|
開始前 | Atlas によるインデックスの構築は開始されていません。 |
最初の同期 | Atlas はインデックスを構築中、または編集したインデックスを再構築中です。インデックスがこの状態のとき、次の状況が発生します。
|
アクティブ | インデックスをいつでも使用できます。 |
リカバリ中 | レプリケーションでエラーが発生しました。この状態は通常、現在のレプリケーション ポイントが mongod oplog で使用できなくなった場合に発生します。既存のインデックスがアップデートされ、ステータスが Active に変わるまで、引き続き既存のインデックスをクエリできます。View status detailsモーダル ウィンドウのエラーを使用して、問題のトラブルシューティングを行います。詳しくは、「Atlas Search の問題の修正」を参照してください。 |
失敗 | Atlas によるインデックスの構築は失敗しました。View status details モーダル ウィンドウのエラーを使用して、問題のトラブルシューティングを行います。詳しくは、「Atlas Search の問題の修正」を参照してください。 |
削除中 | Atlas はクラスター ノードからインデックスを削除しています。 |
Atlas によるインデックスの構築中および構築の完了後、Documents 列にはインデックス済みドキュメントの割合と数が表示されます。また、この列には、コレクション内の総ドキュメント数も表示されます。