$binarySize（集計）

項目一覧

定義
動作
例

定義

$binarySize

指定された文字列またはバイナリデータ値の内容のサイズをバイト単位で返します。

$binarySizeの構文は次のとおりです。

{ $binarySize: <string or binData> }

引数は、string またはバイナリデータ値のいずれかに解決される限り、任意の有効な式にすることができます。式の詳細については、「式」を参照してください。

動作

$binarySizeの引数は次のいずれかに解決される必要があります。

string、
バイナリデータ値、または
null。

引数が string またはバイナリデータ値の場合、式は引数のサイズをバイト単位で返します。

引数が null の場合、式は null を返します。

引数が他のデータ型に解決される場合、 $binarySizeはエラーを返します。

string サイズの計算

$binarySizeの引数が string の場合、演算子は各文字が 1 バイトから 4 バイトの間を使用できる string 内の UTF- 8でエンコードされたバイト数をカウントします。

たとえば、US-ASCII 文字は 1 バイトを使用してエンコードされます。発音区別符号を持つ文字と追加のラテン文字（アルファベットの外のラテン文字）を持つ文字は、2 バイトを使用してエンコードされます。中国語、日本語、韓国語の文字は通常 3 バイト必要であり、Unicode の他のプレーン（文字列、数学記号など）には 4 バイトが必要です。

次の例について考えてみます。

例

結果

ノート

{ $binarySize: "abcde" }

5

各文字は 1 バイトを使用してエンコードされます。

{ $binarySize: "Hello World!" }

12

各文字は 1 バイトを使用してエンコードされます。

{ $binarySize: "cafeteria" }

9

各文字は 1 バイトを使用してエンコードされます。

{ $binarySize: "cafétéria" }

11

éは 2 バイトを使用してエンコードされています。

{ $binarySize: "" }

0

空の文字列は 0 を返します。

{ $binarySize: "$€λG" }

7

€は 3 バイトを使用してエンコードされています。 λは 2 バイトを使用してエンコードされています。

{ $binarySize: "寿司" }

6

各文字は 3 バイトを使用してエンコードされます。

例

mongoshでは、次のドキュメントを含むimagesという名前のサンプルコレクションが作成されます。

db.images.insertMany([
  { _id: 1, name: "cat.jpg", binary: new BinData(0, "OEJTfmD8twzaj/LPKLIVkA==")},
  { _id: 2, name: "big_ben.jpg", binary: new BinData(0, "aGVsZmRqYWZqYmxhaGJsYXJnYWZkYXJlcTU1NDE1Z2FmZCBmZGFmZGE=")},
  { _id: 3, name: "tea_set.jpg", binary: new BinData(0, "MyIRAFVEd2aImaq7zN3u/w==")},
  { _id: 4, name: "concert.jpg", binary: new BinData(0, "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlzIHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2YgdGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGludWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRoZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=")},
  { _id: 5, name: "empty.jpg", binary: new BinData(0, "") }
])

次の集計 projects:

name フィールド
imageSizeフィールド。 $binarySizeを使用してドキュメントのbinaryフィールドのサイズをバイト単位で返します。

db.images.aggregate([
  {
    $project: {
      "name": "$name",
      "imageSize": { $binarySize: "$binary" }
    }
  }
])

この操作では、次の結果を返します。

{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }

最大バイナリデータの検索

次のパイプラインは、バイナリデータサイズが最大のイメージを返します。

db.images.aggregate([
   // First Stage
   { $project: { name: "$name", imageSize: { $binarySize: "$binary" } }  },
   // Second Stage
   { $sort: { "imageSize" : -1 } },
   // Third Stage
   { $limit: 1 }
])

第 1 ステージ

パイプラインの第一ステージ projects:

name フィールド
imageSizeフィールド。 $binarySizeを使用してドキュメントのbinaryフィールドのサイズをバイト単位で返します。

このステージでは、次のドキュメントを次のステージに出力します。

{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }

第 2 ステージ

第二ステージでは、sorts のドキュメントを imageSizeで降順で並べ替えます。

このステージでは、次のドキュメントを次のステージに出力します。

{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }
{ "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 }
{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 }
{ "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 }
{ "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }

第 3 ステージ

第三ステージ limits では、出力ドキュメントをソート順で最初に表示されるドキュメントのみ返します。

{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }

以下も参照してください。

戻る

$avg

$bottom

$binarySize（集計）

定義

動作

string サイズの計算

例

最大バイナリ データの検索

最大バイナリデータの検索