結果で検索タームを強調表示
Atlas Search highlight
オプションは、検索タームを元のコンテキストで表示するフィールドを結果セットに追加します。 これをすべての $search演算子と組み合わせて使用すると、返されたドキュメントに現れる検索タームと、それに対応するテキスト コンテンツ(存在する場合)を表示できます。 highlight
の結果は$meta
フィールドの一部として返されます。
構文
highlight
の構文は次のとおりです。
{ $search: { "index": "<index name>", // optional, defaults to "default" "<operator>": { // such as "text", "compound", or "phrase" <operator-specification> }, "highlight": { "path": "<field-to-search>", "maxCharsToExamine": "<number-of-chars-to-examine>", // optional, defaults to 500,000 "maxNumPassages": "<number-of-passages>" // optional, defaults to 5 } } }, { $project: { "highlights": { "$meta": "searchHighlights" } } }
オプション
フィールド | タイプ | 説明 | 必須 |
---|---|---|---|
path | string | 検索するドキュメント フィールド。
詳細については、「 クエリ パスの構築」を参照してください。 | はい |
maxCharsToExamine | 整数 | フィールドを強調表示するときにドキュメントで確認する最大文字数。 省略した場合、デフォルトは 500,000 になります。つまり、Atlas Search は強調表示する各ドキュメントの検索フィールドの最初の 500,000 文字のみを検査します。 | no |
maxNumPassages | 整数 | 各フィールドの highlights 結果内のドキュメントごとに返す高スコア パスの数。 通過は、ほぼ文章の長さです。 省略した場合、デフォルトは 5 になります。つまり、各ドキュメントに対して、Atlas Search は検索テキストに一致する最高スコアのパスの上位 5 件を返します。 | no |
"$meta": "searchHighlights"
フィールドにはハイライトされた結果が含まれます。 そのフィールドは元のドキュメントの一部ではないため、クエリ出力に追加するには $projectパイプライン ステージを使用する必要があります。
出力
highlights
フィールドは、次の出力フィールドを含む配列です。
フィールド | タイプ | 説明 |
---|---|---|
path | string | 一致を返したドキュメント フィールド。 |
texts | ドキュメントの配列 | 各検索一致は、一致するテキストとその周囲のテキスト(存在する場合)を含む 1 つ以上の オブジェクトを返します。 |
texts.value | string | 一致を返したフィールドのテキスト。 |
texts.type | string | 結果のタイプ。 値は次のいずれかになります。
|
score | float | 一致する結果に割り当てられたスコア。 highlights スコアは、クエリに対するhighlights オブジェクトの関連性の測定値です。 複数のhighlights オブジェクトが返された場合、最も関連性の高いhighlights オブジェクトが最もスコアが高くなります。 |
前提条件
indexOptions
をoffsets
(デフォルト)に設定して、ハイライトするフィールドを Atlas Search stringタイプとしてインデックスする必要があります。
制限
Atlas Search highlight
オプションは、 embeddedDocument演算子と組み合わせて使用できません。
例
次の例は、Atlas Search Playground または Atlas クラスターで試すことができます。
サンプル コレクション
このページの例では、次のドキュメントを含むfruit
というコレクションを使用します。
{ "_id" : 1, "type" : "fruit", "summary" : "Apple varieties", "description" : "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.", "category": "organic" }, { "_id" : 2, "type" : "fruit", "summary" : "Banana", "description" : "Bananas are usually sold in bunches of five or six.", "category": "nonorganic" }, { "_id" : 3, "type" : "fruit", "summary" : "Pear varieties", "description" : "Bosc and Bartlett are the most common varieties of pears.", "category": "nonorganic" }
サンプル インデックス
fruit
コレクションには、 英語 の アナライザ と 動的フィールドマッピング を使用する インデックス定義 もあります。
{ "analyzer": "lucene.english", "searchAnalyzer": "lucene.english", "mappings": { "dynamic": true } }
注意
強調表示の便利な点の 1 つは、検索クエリによって返される元のテキストが表示されることです。このテキストは、検索タームと完全に一致しない場合もあります。 たとえば、 言語固有のアナライザ を使用すると、テキスト検索ではすべての 語幹 付き 検索タームのバリエーション。
強調表示のもう 1 つの便利な面は、クエリpath
内または外部で任意のフィールドを強調表示するために使用できることです。 たとえば、 というタームを検索する場合、クエリ フィールドとhighlight
オプションを使用して指定したその他のフィールドのクエリ用語を強調表示できます。 詳細については、「マルチフィールドの例 」を参照してください。
サンプル クエリ
次のクエリは、Atlas Search クエリの$search
highlight
オプションを示しています。
基本的な例
次のクエリは、 fruit
コレクションのdescription
フィールドでvariety
とbunch
を検索し、 highlight
オプションを有効にします。
$projectパイプライン ステージは、出力をdescription
フィールドに制限し、ハイライト情報を含むhighlights
という新しいフィールドを追加します。
1 db.fruit.aggregate([ 2 { 3 $search: { 4 "text": { 5 "path": "description", 6 "query": ["variety", "bunch"] 7 }, 8 "highlight": { 9 "path": "description" 10 } 11 } 12 }, 13 { 14 $project: { 15 "description": 1, 16 "_id": 0, 17 "highlights": { "$meta": "searchHighlights" } 18 } 19 } 20 ])
1 { 2 "description" : "Bananas are usually sold in bunches of five or six. ", 3 "highlights" : [ 4 { 5 "path" : "description", 6 "texts" : [ 7 { 8 "value" : "Bananas are usually sold in ", 9 "type" : "text" 10 }, 11 { 12 "value" : "bunches", 13 "type" : "hit" 14 }, 15 { 16 "value" : " of five or six. ", 17 "type" : "text" 18 } 19 ], 20 "score" : 1.2841906547546387 21 } 22 ] 23 } 24 { 25 "description" : "Bosc and Bartlett are the most common varieties of pears.", 26 "highlights" : [ 27 { 28 "path" : "description", 29 "texts" : [ 30 { 31 "value" : "Bosc and Bartlett are the most common ", 32 "type" : "text" 33 }, 34 { 35 "value" : "varieties", 36 "type" : "hit" 37 }, 38 { 39 "value" : " of pears.", 40 "type" : "text" 41 } 42 ], 43 "score" : 1.2691514492034912 44 } 45 ] 46 } 47 { 48 "description" : "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith. ", 49 "highlights" : [ 50 { 51 "path" : "description", 52 "texts" : [ 53 { 54 "value" : "Apples come in several ", 55 "type" : "text" 56 }, 57 { 58 "value" : "varieties", 59 "type" : "hit" 60 }, 61 { 62 "value" : ", including Fuji, Granny Smith, and Honeycrisp. ", 63 "type" : "text" 64 } 65 ], 66 "score" : 1.0330637693405151 67 }, 68 { 69 "path" : "description", 70 "texts" : [ 71 { 72 "value" : "The most popular ", 73 "type" : "text" 74 }, 75 { 76 "value" : "varieties", 77 "type" : "hit" 78 }, 79 { 80 "value" : " are McIntosh, Gala, and Granny Smith. ", 81 "type" : "text" 82 } 83 ], 84 "score" : 1.0940992832183838 85 } 86 ] 87 }
検索タームbunch
は、 _id: 2
を含むドキュメントに一致を返します。これは、 description
フィールドにbunches
という単語が含まれているためです。 検索タームvariety
は、 _id: 3
と_id: 1
を含むドキュメントに一致します。これは、 description
フィールドにvarieties
という単語が含まれているためです。
➤ Atlas Search Playground でこれを試してみてください。
高度な例
次のクエリは、 fruit
コレクションのdescription
フィールドでvariety
とbunch
を検索し、 highlight
オプションを有効にし、検索する最大文字数を40
に設定し、 1
のみを検索します。ドキュメントごとに返される高スコアのパス。
$projectパイプライン ステージは、出力をdescription
フィールドに制限し、ハイライト情報を含むhighlights
という新しいフィールドを追加します。
1 db.fruit.aggregate([ 2 { 3 $search: { 4 "text": { 5 "path": "description", 6 "query": ["variety", "bunch"] 7 }, 8 "highlight": { 9 "path": "description", 10 "maxNumPassages": 1, 11 "maxCharsToExamine": 40 12 } 13 } 14 }, 15 { 16 $project: { 17 "description": 1, 18 "_id": 0, 19 "highlights": { "$meta": "searchHighlights" } 20 } 21 } 22 ])
1 { 2 "description" : "Bananas are usually sold in bunches of five or six. ", 3 "highlights" : [ 4 { 5 "path" : "description", 6 "texts" : [ 7 { 8 "value" : "Bananas are usually sold in ", 9 "type" : "text" 10 }, 11 { 12 "value" : "bunches", 13 "type" : "hit" 14 }, 15 { 16 "value" : " of f", 17 "type" : "text" 18 } 19 ], 20 "score" : 1.313065767288208 21 } 22 ] 23 } 24 { 25 "description" : "Bosc and Bartlett are the most common varieties of pears.", 26 "highlights" : [ ] 27 } 28 { 29 "description" : "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.", 30 "highlights" : [ 31 { 32 "path" : "description", 33 "texts" : [ 34 { 35 "value" : "Apples come in several ", 36 "type" : "text" 37 }, 38 { 39 "value" : "varieties", 40 "type" : "hit" 41 }, 42 { 43 "value" : ", includ", 44 "type" : "text" 45 } 46 ], 47 "score" : 0.9093900918960571 48 } 49 ] 50 }
上記の結果の 2 番目のドキュメントには、検索フィールドに検索用語varieties
が含まれているにもかかわらず空のhighlights
配列が含まれています。これは、Atlas Search が強調表示するために40
文字のみを検査したためです。 同様に、 includ
という単語も切り捨てられます。このコマンドは、Atlas Search が強調表示する検索フィールドの40
文字のみを検査したためです。 3 番目のドキュメントでは、複数のパスに 検索タームが含まれていますが、Atlas Search はhighlights
結果の 1 つのパスのみを返します。クエリでは、 highlights
結果では 1 ドキュメントあたり1
パスのみが必要であったためです。
➤ Atlas Search Playground でこれを試してみてください。
マルチフィールドの例
varieties
description
fruit
次のクエリは、 コレクションの フィールドでhighlight
を検索し、description
summary
フィールドと フィールドの両方で オプションを有効にします。
$projectパイプライン ステージには、 highlights
という新しいフィールドが追加されます。このフィールドには、 highlight
オプションのすべてのフィールドにわたるクエリ用語の強調表示情報が含まれます。
1 db.fruit.aggregate([ 2 { 3 $search: { 4 "text": { 5 "path": "description", 6 "query": "varieties" 7 }, 8 "highlight": { 9 "path": ["description", "summary" ] 10 } 11 } 12 }, 13 { 14 $project: { 15 "description": 1, 16 "summary": 1, 17 "_id": 0, 18 "highlights": { "$meta": "searchHighlights" } 19 } 20 } 21 ])
1 { 2 "summary" : "Pear varieties", 3 "description" : "Bosc and Bartlett are the most common varieties of pears.", 4 "highlights" : [ 5 { 6 "path" : "summary", 7 "texts" : [ 8 { 9 "value" : "Pear ", 10 "type" : "text" 11 }, 12 { 13 "value" : "varieties", 14 "type" : "hit" 15 } 16 ], 17 "score" : 1.3891443014144897 }, 18 { 19 "path" : "description", 20 "texts" : [ 21 { 22 "value" : "Bosc and Bartlett are the most common ", 23 "type" : "text" 24 }, 25 { 26 "value" : "varieties", 27 "type" : "hit" 28 }, 29 { 30 "value" : " of pears.", 31 "type" : "text" 32 } 33 ], 34 "score" : 1.2691514492034912 35 } 36 ] 37 } 38 { 39 "summary" : "Apple varieties", 40 "description" : "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.", 41 "highlights" : [ 42 { 43 "path" : "summary", 44 "texts" : [ 45 { 46 "value" : "Apple ", 47 "type" : "text" 48 }, 49 { 50 "value" : "varieties", 51 "type" : "hit" 52 } 53 ], 54 "score" : 1.3859853744506836 55 }, 56 { 57 "path" : "description", 58 "texts" : [ 59 { 60 "value" : "Apples come in several ", 61 "type" : "text" 62 }, 63 { 64 "value" : "varieties", 65 "type" : "hit" 66 }, 67 { 68 "value" : ", including Fuji, Granny Smith, and Honeycrisp. ", 69 "type" : "text" 70 } 71 ], 72 "score" : 1.0330637693405151 73 }, 74 { 75 "path" : "description", 76 "texts" : [ 77 { 78 "value" : "The most popular ", 79 "type" : "text" 80 }, 81 { 82 "value" : "varieties", 83 "type" : "hit" 84 }, 85 { 86 "value" : " are McIntosh, Gala, and Granny Smith.", 87 "type" : "text" 88 } 89 ], 90 "score" : 1.0940992832183838 91 } 92 ] 93 }
検索タームvarieties
は、 _id: 1
と_id: 3
を含むドキュメントに一致を返します。両方のドキュメントのクエリ フィールドdescription
にクエリ用語varieties
が含まれているためです。 さらに、 highlights
配列にはsummary
フィールドが含まれます。このフィールドにはクエリ用語varieties
が含まれているためです。
➤ Atlas Search Playground でこれを試してみてください。
ワイルドカードの例
次のクエリは、 fruit
コレクション内のdes
で始まるフィールドでvarieties
というタームを検索し、 des
で始まるフィールドではhighlight
オプションを有効にします。
$projectパイプライン ステージには、ハイライト情報を含むhighlights
という新しいフィールドが追加されます。
1 db.fruit.aggregate([ 2 { 3 "$search": { 4 "text": { 5 "path": {"wildcard": "des*"}, 6 "query": ["variety"] 7 }, 8 "highlight": { 9 "path": {"wildcard": "des*"} 10 } 11 } 12 }, 13 { 14 "$project": { 15 "description": 1, 16 "_id": 0, 17 "highlights": { "$meta": "searchHighlights" } 18 } 19 } 20 ])
1 { 2 "description" : "Bosc and Bartlett are the most common varieties of pears.", 3 "highlights" : [ 4 { 5 "path" : "description", 6 "texts" : [ 7 { 8 "value" : "Bosc and Bartlett are the most common ", 9 "type" : "text" 10 }, 11 { 12 "value" : "varieties", 13 "type" : "hit" 14 }, 15 { 16 "value" : " of pears.", 17 "type" : "text" 18 } 19 ], 20 "score" : 1.2691514492034912 21 } 22 ] 23 }, 24 { 25 "description" : "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.", 26 "highlights" : [ 27 { 28 "path" : "description", 29 "texts" : [ 30 { 31 "value" : "Apples come in several ", 32 "type" : "text" 33 }, 34 { 35 "value" : "varieties", 36 "type" : "hit" 37 }, 38 { 39 "value" : ", including Fuji, Granny Smith, and Honeycrisp. ", 40 "type" : "text" 41 } 42 ], 43 "score" : 1.0330637693405151 44 }, 45 { 46 "path" : "description", 47 "texts" : [ 48 { 49 "value" : "The most popular ", 50 "type" : "text" 51 }, 52 { 53 "value" : "varieties", 54 "type" : "hit" 55 }, 56 { 57 "value" : " are McIntosh, Gala, and Granny Smith.", 58 "type" : "text" 59 } 60 ], 61 "score" : 1.0940992832183838 62 } 63 ] 64 }
Atlas Search の結果では、 des
で始まるフィールドが強調表示されます。
➤ Atlas Search Playground でこれを試してみてください。
複合例
次のクエリは、 category
フィールドでorganic
を検索し、 description
フィールドでvariety
という用語を検索します。 $search
複合クエリのhighlight
オプションは、 description
フィールドに対するテキストクエリのみの情報を強調表示するリクエストです。 ただし、 $search
ステージ内のhighlight
オプションは$search
ステージの子であり、 $search
ステージ内の演算子であってはなりません。
$projectパイプライン ステージには、ハイライト情報を含むhighlights
という新しいフィールドが追加されます。
1 db.fruit.aggregate([ 2 { 3 "$search": { 4 "compound": { 5 "should": [{ 6 "text": { 7 "path": "category", 8 "query": "organic" 9 } 10 }, 11 { 12 "text": { 13 "path": "description", 14 "query": "variety" 15 } 16 }] 17 }, 18 "highlight": { 19 "path": "description" 20 } 21 } 22 }, 23 { 24 "$project": { 25 "description": 1, 26 "category": 1, 27 "_id": 0, 28 "highlights": { "$meta": "searchHighlights" } 29 } 30 } 31 ])
1 [ 2 { 3 description: 'Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.', 4 category: 'organic', 5 highlights: [ 6 { 7 score: 1.0330637693405151, 8 path: 'description', 9 texts: [ 10 { value: 'Apples come in several ', type: 'text' }, 11 { value: 'varieties', type: 'hit' }, 12 { 13 value: ', including Fuji, Granny Smith, and Honeycrisp. ', 14 type: 'text' 15 } 16 ] 17 }, 18 { 19 score: 1.0940992832183838, 20 path: 'description', 21 texts: [ 22 { value: 'The most popular ', type: 'text' }, 23 { value: 'varieties', type: 'hit' }, 24 { 25 value: ' are McIntosh, Gala, and Granny Smith.', 26 type: 'text' 27 } 28 ] 29 } 30 ] 31 }, 32 { 33 description: 'Bosc and Bartlett are the most common varieties of pears.', 34 category: 'nonorganic', 35 highlights: [ 36 { 37 score: 1.2691514492034912, 38 path: 'description', 39 texts: [ 40 { 41 value: 'Bosc and Bartlett are the most common ', 42 type: 'text' 43 }, 44 { value: 'varieties', type: 'hit' }, 45 { value: ' of pears.', type: 'text' } 46 ] 47 } 48 ] 49 } 50 ]
➤ Atlas Search Playground でこれを試してみてください。
オートコンプリートの例
この例では、 fruit
コレクションには次のインデックス定義もあります。
{ "mappings": { "dynamic": false, "fields": { "description": [ { "type": "autocomplete", "tokenization": "edgeGram", "minGrams": 2, "maxGrams": 15, "foldDiacritics": true } ] } } }
次のクエリは、fruit
コレクションの description
フィールドで var
の文字を検索し、description
フィールドで highlight
オプションを有効にします。
$projectパイプライン ステージには、ハイライト情報を含むhighlights
という新しいフィールドが追加されます。
重要
パスのオートコンプリート インデックス バージョンを強調表示するには、オートコンプリート演算子がクエリ内でそのパスを使用する唯一の演算子である必要があります。
1 db.fruit.aggregate([ 2 { 3 "$search": { 4 "autocomplete": { 5 "path": "description", 6 "query": ["var"] 7 }, 8 "highlight": { 9 "path": "description" 10 } 11 } 12 }, 13 { 14 "$project": { 15 "description": 1, 16 "_id": 0, 17 "highlights": { "$meta": "searchHighlights" } 18 } 19 } 20 ])
1 { 2 "description": "Apples come in several varieties, including Fuji, Granny Smith, and Honeycrisp. The most popular varieties are McIntosh, Gala, and Granny Smith.", 3 "highlights": [ 4 { 5 "score": 0.774385392665863, 6 "path": "description", 7 "texts": [ 8 { "value": "Apples come in several ", "type": "text" }, 9 { "value": "varieties, including Fuji", "type": "hit" }, 10 { "value": ", Granny Smith, and Honeycrisp. ", "type": "text" } 11 ] 12 }, 13 { 14 "score": 0.7879307270050049, 15 "path": "description", 16 "texts": [ 17 { "value": "The most popular ", "type": "text" }, 18 { "value": "varieties are McIntosh", "type": "hit" }, 19 { "value": ", Gala, and Granny Smith.", "type": "text" } 20 ] 21 } 22 ] 23 }, 24 { 25 "description": "Bosc and Bartlett are the most common varieties of pears.", 26 "highlights": [ 27 { 28 "score": 0.9964432120323181, 29 "path": "description", 30 "texts": [ 31 { 32 "value": "Bosc and Bartlett are the most common ", 33 "type": "text" 34 }, 35 { "value": "varieties of pears", "type": "hit" }, 36 { "value": ".", "type": "text" } 37 ] 38 } 39 ] 40 }
Atlas Searchがクエリstring var
に対して _id: 1
と id_: 2
を含むドキュメントに一致を返すのは、fruit
コレクションの description
フィールドに単語の先頭に文字 var
が含まれているためです。 強調表示されたパスが強調表示されたクエリのオペレーターでのみ参照されている場合、Atlas Search は強調表示されたhit
を、より大まかにクエリタームと一致させます。
➤ Atlas Search Playground でこれを試してみてください。