集計フレームワーク
集計パイプラインは、データ処理パイプラインの概念をモデル化したデータ集計のフレームワークです。
集計の詳細については、サーバー マニュアルの集計パイプラインを参照してください。
前提条件
このガイドのコード例を実行するには、次のコンポーネントを設定する必要があります。
test.restaurants
ドキュメントrestaurants.json
アセット の ファイルのドキュメントが入力された {0 コレクション。Github次のインポート ステートメントは次のとおりです。
import org.mongodb.scala._ import org.mongodb.scala.model.Aggregates._ import org.mongodb.scala.model.Accumulators._ import org.mongodb.scala.model.Filters._ import org.mongodb.scala.model.Projections._
注意
このガイドでは、 クイック スタート プライマリで説明されているObservable
暗黙を使用します。
MongoDB 配置への接続
まず、MongoDB 配置に接続し、 インスタンスとMongoDatabase
MongoCollection
インスタンスを 宣言して定義します。
次のコードは、ポート27017
のlocalhost
で実行されているスタンドアロンの MongoDB 配置に接続します。 次に、 test
データベースを参照するためのdatabase
変数と、 restaurants
コレクションを参照するためのcollection
変数を定義します。
val mongoClient: MongoClient = MongoClient() val database: MongoDatabase = mongoClient.getDatabase("test") val collection: MongoCollection[Document] = database.getCollection("restaurants")
MongoDB 配置への接続の詳細については、「 MongoDB への接続」チュートリアルを参照してください。
集計の実行
集計を実行するには、集計ステージのリストをMongoCollection.aggregate()
メソッドに渡します。 このドライバーは、集計ステージのビルダを含むAggregates
ヘルパー クラスを提供します。
この例では、集計パイプラインは次のタスクを実行しています。
$match
ステージを使用して、categories
配列フィールドに要素"Bakery"
を含むドキュメントをフィルタリングします。 この例では、Aggregates.filter()
を使用して$match
ステージを構築しています。
$group
ステージを使用して、一致するドキュメントをstars
フィールドでグループ化し、stars
の個別の値ごとにドキュメントの数を累積します。 この例では、Aggregates.group()
を使用して$group
ステージを構築し、Accumulators.sum()
を使用してアキュムレータ式を構築します。$group
ステージ内で使用するアキュムレータ式の場合、ドライバーはAccumulators
ヘルパー クラスを提供します。
collection.aggregate(Seq( Aggregates.filter(Filters.equal("categories", "Bakery")), Aggregates.group("$stars", Accumulators.sum("count", 1)) )).printResults()
集計式の使用
$group
アキュムレータ式の場合、ドライバーはAccumulators
ヘルパー クラスを提供します。 その他の集計式は、 Document
クラスを使用して式を手動で構築します。
次の例では、集計パイプラインは$project
ステージを使用して、 name
フィールドと、値がcategories
配列の最初の要素である計算フィールドfirstCategory
のみを返します。 この例では、 Aggregates.project()
とさまざまなProjections
クラスのメソッドを使用して$project
ステージを構築します。
collection.aggregate( Seq( Aggregates.project( Projections.fields( Projections.excludeId(), Projections.include("name"), Projections.computed( "firstCategory", Document("$arrayElemAt"-> Seq("$categories", 0)) ) ) ) ) ).printResults()
集計の説明
集計パイプラインを$explain
するには、 AggregatePublisher.explain()
メソッドを呼び出します。
collection.aggregate( Seq(Aggregates.filter(Filters.eq("categories", "Bakery")), Aggregates.group("$stars", Accumulators.sum("count", 1))) ).explain().printResults()