Docs Menu

Docs Homeアプリケーションの開発Python ドライバーPyMongo

1 対 1 の結合

項目一覧

  • はじめに
  • 集計タスクの概要
  • 始める前に
  • Tutorial
  • 2020 年注文の一致ステージを追加します
  • コレクションをリンクするためにルックアップ ステージを追加します
  • 新しいドキュメントフィールドを作成するにはセットステージを追加します
  • 不要なフィールドを削除するために設定されていない ステージを追加します
  • 集計パイプラインの実行
  • 結果の解釈

このチュートリアルでは、PyMongo を使用して集計パイプラインを構築し、コレクションに対して集計を実行し、サンプル アプリを完了して実行して結果を出力する方法を学習できます。

この集計では 1 対 1 の結合が実行されます。 1 対 1 の結合は、1 つのコレクション内のドキュメントの フィールド値が、同じフィールド値を持つ別のコレクション内の単一のドキュメントと一致する場合に行われます。 集計は フィールド値でこれらのドキュメントを照合し、両方のソースからの情報を 1 つの結果に結合します。

Tip

1 対 1 の結合では、ドキュメントに 1 対 1 の関係がある必要はありません。 このデータ関係の詳細については、Wikipedia で 1 対 1(データモデル)に関するエントリを参照してください。

このチュートリアルでは、製品情報を記述するコレクションのデータと、カスタマーの注文を記述する別のコレクションのデータを組み合わせる方法を説明します。 結果には、2020 年に行われたすべての注文のリストが表示され、各注文に関連付けられた製品の詳細が含まれます。

この例では、2 つのコレクションを使用します。

  • orders: 店舗内の製品の個々の注文を説明するドキュメントが含まれています

  • products: 店舗が販売する商品を説明するドキュメントが含まれています

注文には1つの製品しか含めることができないため、集計では 1 対 1 の結合を使用して注文ドキュメントと製品のドキュメントを照合します。 コレクションは、両方のコレクションのドキュメントに存在するproduct_idというフィールドによって結合されます。

このチュートリアルを開始する前に、集計テンプレートアプリの手順を完了して、動作する Python アプリケーションを設定してください。

ordersproductsアプリを設定したら、次のコードをアプリケーションに追加して、 コレクションと コレクションにアクセスします。

orders_coll = agg_db["orders"]
products_coll = agg_db["products"]

次のコードに示すように、既存の データを削除し、サンプル データをordersコレクションに挿入します。

orders_coll.delete_many({})
order_data = [
{
"customer_id": "elise_smith@myemail.com",
"orderdate": datetime(2020, 5, 30, 8, 35, 52),
"product_id": "a1b2c3d4",
"value": 431.43
},
{
"customer_id": "tj@wheresmyemail.com",
"orderdate": datetime(2019, 5, 28, 19, 13, 32),
"product_id": "z9y8x7w6",
"value": 5.01
},
{
"customer_id": "oranieri@warmmail.com",
"orderdate": datetime(2020, 1, 1, 8, 25, 37),
"product_id": "ff11gg22hh33",
"value": 63.13
},
{
"customer_id": "jjones@tepidmail.com",
"orderdate": datetime(2020, 12, 26, 8, 55, 46),
"product_id": "a1b2c3d4",
"value": 429.65
}
]
orders_coll.insert_many(order_data)

次のコードに示すように、既存の データを削除し、サンプル データをproductsコレクションに挿入します。

products_coll.delete_many({})
product_data = [
{
"id": "a1b2c3d4",
"name": "Asus Laptop",
"category": "ELECTRONICS",
"description": "Good value laptop for students"
},
{
"id": "z9y8x7w6",
"name": "The Day Of The Triffids",
"category": "BOOKS",
"description": "Classic post-apocalyptic novel"
},
{
"id": "ff11gg22hh33",
"name": "Morphy Richardds Food Mixer",
"category": "KITCHENWARE",
"description": "Luxury mixer turning good cakes into great"
},
{
"id": "pqr678st",
"name": "Karcher Hose Set",
"category": "GARDEN",
"description": "Hose + nosels + winder for tidy storage"
}
]
products_coll.insert_many(product_data)
1

2020での注文に一致する$matchステージを追加します。

pipeline.append({
"$match": {
"orderdate": {
"$gte": datetime(2020, 1, 1, 0, 0, 0),
"$lt": datetime(2021, 1, 1, 0, 0, 0)
}
}
})
2

次に、 $lookupステージを追加します。 $lookupステージは、 ordersコレクションのproduct_idフィールドをproductsコレクションのidフィールドに結合します。

pipeline.append({
"$lookup": {
"from": "products",
"localField": "product_id",
"foreignField": "id",
"as": "product_mapping"
}
})
3

次に、パイプラインに 2 つの$setステージを追加します。

最初の$setステージは、 product_mappingフィールドを、前の$lookupステージで作成されたproduct_mappingオブジェクトの最初の要素に設定します。

2 つ目の$setステージでは、 product_mappingオブジェクト フィールドの値から 2 つの新しいフィールド ( product_nameproduct_category )が作成されます。

pipeline.extend([
{
"$set": {
"product_mapping": {"$first": "$product_mapping"}
}
},
{
"$set": {
"product_name": "$product_mapping.name",
"product_category": "$product_mapping.category"
}
}
])

Tip

これは 1 対 1 の結合であるため、 $lookupステージは入力ドキュメントに 1 つの配列要素のみを追加します。 パイプラインは$first演算子を使用して、この要素からデータを検索します。

4

最後に、 $unsetステージを追加します。 $unsetステージは、ドキュメントから不要なフィールドを削除します。

pipeline.append({"$unset": ["_id", "product_id", "product_mapping"]})
5

次のコードをアプリケーションの末尾に追加して、 ordersコレクションで集計を実行します。

aggregation_result = orders_coll.aggregate(pipeline)

最後に、shell で次のコマンドを実行してアプリケーションを起動します。

python3 agg_tutorial.py
6

集計された結果には 3 つのドキュメントが含まれます。 ドキュメントは、注文製品のproduct_nameproduct_categoryを含む、2020 年に発生したカスタマーの注文を表します。

{
'customer_id': 'elise_smith@myemail.com',
'orderdate': datetime.datetime(2020, 5, 30, 8, 35, 52),
'value': 431.43,
'product_name': 'Asus Laptop',
'product_category': 'ELECTRONICS'
}
{
'customer_id': 'oranieri@warmmail.com',
'orderdate': datetime.datetime(2020, 1, 1, 8, 25, 37),
'value': 63.13,
'product_name': 'Morphy Richardds Food Mixer',
'product_category': 'KITCHENWARE'
}
{
'customer_id': 'jjones@tepidmail.com',
'orderdate': datetime.datetime(2020, 12, 26, 8, 55, 46),
'value': 429.65,
'product_name': 'Asus Laptop',
'product_category': 'ELECTRONICS'
}

結果は、 ordersコレクションとproductsコレクション内のドキュメントのフィールドを含むドキュメントで構成されており、各元のドキュメントに存在するproduct_idフィールドを一致させて結合されます。

このチュートリアルの完全なコードを表示するには、「 完了した 1 対 1 の結合アプリ Github」を参照してください。 .

← 配列とグループを解凍