Docs Menu
Docs Home
/
MongoDB Atlas
/ / / /

ホワイトスペースアナライザ

whitespaceアナライザは、空白文字を見つけた場合、テキストを検索可能なターム(トークン)に分割します。 すべてのテキストは元の文字大文字と小文字のままになります。

アナライザが組み込み静的 用に作成するトークンは、whitespacestring AtlasUI 2}Visual Editor Refine Your Indexで確認できます。Index Configurationsセクションには、インデックスで使用するアナライザを選択するためにView text analysis of your selected index configurationを展開すると、 whitespaceアナライザが作成するインデックスと検索トークンが表示されます。

重要

Atlas Search は、アナライザ トークンのサイズが 32766 バイトを超える string フィールドのインデックスを作成しません。キーワード アナライザを使用する場合は、32766 バイトを超える string フィールドのインデックスを作成しません。

次のインデックス定義の例では、 whitespaceアナライザを使用して、 sample_mflix.moviesコレクションのtitleフィールドのインデックスを指定します。 コレクションをクラスターにロードした場合は、Atlas UI ビジュアル エディターまたは JSONエディターを使用してサンプル インデックスを作成できます。 ご希望の構成方法を選択したら、データベースとコレクションを選択します。

  1. インデックスを設定するには、 Refine Your Indexをクリックします。

  2. Field Mappingsセクションで、 Add FieldをクリックしてAdd Field Mappingウィンドウを開きます。

  3. Field Nameドロップダウンからtitleを選択します。

  4. [Customized Configuration] をクリックします。

  5. [ Data Type String選択されていない場合は選択します。

  6. String Propertiesを展開し、次の変更を加えます。

    インデックスアナライザ
    ドロップダウンから [lucene.whitespace] を選択します。
    searchAnalyzer
    ドロップダウンから [lucene.whitespace] を選択します。
    インデックス オプション
    デフォルトのoffsetsを使用します。
    Store
    デフォルトのtrueを使用します。
    上記を無視
    デフォルト設定のままにしてください。
    基準
    デフォルトのincludeを使用します。
  7. [Add] をクリックします。

  8. [Save Changes] をクリックします。

  9. [Create Search Index] をクリックします。

  1. デフォルトのインデックス定義を、以下のインデックス定義で置き換えます。

    {
    "mappings": {
    "fields": {
    "title": {
    "type": "string",
    "analyzer": "lucene.whitespace",
    "searchAnalyzer": "lucene.whitespace"
    }
    }
    }
    }
  2. [Next] をクリックします。

  3. [Create Search Index] をクリックします。

次のクエリは、 titleフィールドでLion'sというタームを検索します。

db.movies.aggregate([
{
"$search": {
"text": {
"query": "Lion's",
"path": "title"
}
}
},
{
"$project": {
"_id": 0,
"title": 1
}
}
])
[
{ title: 'Lion's Den' },
{ title: 'The Lion's Mouth Opens' }
]

Atlas Search これらのドキュメントを返すには、 lucene.whitespaceアナライザを使用してtitleフィールドのテキストに対して次の操作を実行します。

  • テキストの元の文字大文字と小文字を保持します。

  • 空白文字が見つかったテキストをトークンに分割します。

次の表は、結果内のドキュメントに対してホワイトスペース アナライザと、簡易アナライザキーワード アナライザを使用して Atlas Search が作成するトークン(検索可能なターム)を示しています。

タイトル
空白アナライザ トークン
簡易アナライザ トークン
キーワード アナライザ トークン
Lion's Den
Lion's, Den
lion, s, den
Lion's Den
The Lion's Mouth Opens
The, Lion's, Mouth, Opens
the, lion, s, mouth, opens
The Lion's Mouth Opens

whitespaceアナライザを使用するインデックスは大文字と小文字を区別します。 したがって、Atlas Search はクエリ用語Lion'swhitespaceアナライザによって作成されたトークンLion'sと照合できます。

戻る

簡単