データのビン化、ソート、制限
チャート内のデータをビン化、ソート、制限することで、データの重要な要素を強調表示できます。
Bin Data
Atlas Chartsは、データのビン化日付、数値、およびstringフィールドをサポートします。 ビン化により、連続データはビンと呼ばれる個別のグループに分割されます。各ビンには元の値の連続したサブセットが含まれます。 たとえば、ユーザーを出た10年ごとにビン化したり、タイムスタンプ付きの暦上のイベントを開始日の月別にグループ化したりできます。
例
連続データと個別データ
連続データは、連続した範囲にわたる任意の値を占有することができます。 連続データの例には、高さ、温度、人が失われた時刻などがあります。
あるいは、個別のデータとは、分類に分類された特定の値のみを持つデータです。 個別のデータの例には、目の色やクラスの生徒数などがあります。
日付を処理する場合、このデータは多くの場合連続した形式になります。 このデータを特定の時間単位で分割すると、追加の傾向やパターンを特定できWindows 。 Atlas Charts は日付に対して次のビンをサポートしています。
|
|
日付にビン化を使用するには、次のようにします。
日付フィールド(チャートビルダの Fieldsセクションの暦アイコンによって識別)をcategory エンコーディング チャンネルにドラッグします。
デフォルトでは、ビン化は有効になっており、 Binning Onトグルで示されています。
ドロップダウンを使用して、日付のビン化サイズを選択します。
必要に応じてPeriodic設定を切り替えます。
有効にすると、Atlas Charts は次に高い期間を基準とするビン化を作成し、各ビン化を繰り返してデータ フィールドにまたがる時間枠をカバーします。
無効にすると、Charts が作成するビン化は繰り返されません。
例
5 年間にわたるデータを含む日付フィールドと、 Monthのビン化を検討します。 Periodicが無効になっている場合、Charts はデータセット内の 60 か月を可視化に追加します。
あるいは、 Periodicが有効になっている場合、Charts は 12 暦月のみをプロットし、各暦月からの集計結果の合計を可視化します。
注意
Day of the Weekのビン化サイズを選択すると、 Periodic設定は常に有効になります。
バイナリ サイズとしてYearを選択すると、 Periodic設定は常に無効になります。これは、年が Charts で使用可能な最大の期間であるためです。
ビン化を無効にするには、 Binning設定をオフに切り替えます。 この場合、 フィールドの各日付は、グループ化は実行されずに可視化に追加されます。
例
次のチャートは、事務用品店の履歴販売データを表示しています。 すべての売上は supplySales
コレクション内のドキュメントによって表されます。 コレクション内の各ドキュメントには、 salesDate
としての販売日と、 items
配列としての販売に含まれるアイテムのリストが含まれています。
saleDate
フィールドにはの連続タイムスタンプ データが含まれています。 フィールドはPeriodic設定が有効になっているDate of the Monthによってビン化されています。 つまり、データが存在する数年にわたって、Atlas Charts は月の個々の日付の売上のmean値をプロットします。
期間の比較
ビン化された日付データを使用する場合、一定期間にわたるデータを比較するオプションがあります。 値の累積合計または変化を表示できます。
期間の比較 機能を使用するには、チャートに次のものが必要です。
ビン化された非定期日付フィールドが エンコードされた カテゴリ チャンネル 。
集計チャンネル。
条件が満たされている場合、集計カードにはCompare Periodsというラベルの付いた切り替えスイッチが含まれます。 をオンに切り替えると、 Cumulative TotalとChange in Valueのオプションを含むドロップダウン メニューが表示されます。
Cumulative Totalチャートでは、連続する各データ ポイントは、先行する時系列データ ポイントに追加された各データ ポイントを加算することによって計算されます。 累積合計の初期値として機能するベースライン値を指定することもできます。 デフォルトのベースライン値は0
です。
Change in Valueチャートでは、連続する各データ ポイントがその前の時系列データ ポイントとの差を示します。 比較する前の期間がないため、チャートの最初のデータ ポイントは常に空白になります。
次のタイプのチャートは、期間比較機能を使用できます。
注意
累積データ オプションは複数系列チャートでは使用できません。
例
次の縦棒チャートでは、事務用品店の年間売上を 5 年間の累計として可視化しています。 コレクション内の各ドキュメントには、販売日がsalesDate
と、販売に含まれる商品の数を含むquantity
フィールドが含まれています。
saleDate
フィールドは年ごとにビン化されています。 items
フィールドは、各アイテムがSUM
集計操作で累積合計に追加されるquantity
フィールドを持つ配列です。
空のバイナリ
ビン化が有効になっている場合、Charts には、チャートが表示する最小データ範囲と最大データ範囲内の空のビンのエントリが表示されます。
注意
例外
Charts では、チャート上の一意なバイナリが 5000 を超える場合、空のバイナリは表示されません。
Charts が空のビンに使用する値は、選択した集計関数によって異なります。
集計関数 | 推論値 |
---|---|
count or distinct | 0 |
他のすべての関数 | null |
Charts では、チャートタイプに基づいて、 null
値を持つビン化されたファイルが異なる方法で表示されます。
チャートの種類 | Charts での null ビン化の表示方法 |
---|---|
高さが 0 のバーです。 Charts では、有効であっても、 null ビンのデータ ラベルは表示されません。 | |
線形補間。 null ビンにはデータマークはありません。 Charts では、有効であっても、 null ビンのデータ ラベルは表示されません。 |
Atlas Charts では、連続セットの数値フィールドを指定したサイズのグループに分割できます。
数値フィールドにビン化を使用するには:
数値フィールド(チャートビルダのFieldsセクションの数字記号アイコンで示される)をcategoryエンコーディング チャンネルにドラッグします。
デフォルトでは、トグルがBinning Onを表示するように、ビン化は有効になっています。
Bin Size入力に任意のバイナサイズを入力します。
ビン化を無効にするには、 Binning設定をオフに切り替えます。 この場合、フィールドの個々の値は、ビン化されるのではなく、可視化に追加されます。
例
次のチャートは、事務用品店の履歴販売データを表示しています。 すべての売上はsupplySales
コレクション内のドキュメントによって表されます。 各販売ドキュメントにはcustomer
オブジェクトが含まれています。このオブジェクトには、商品を購入する顧客に関する情報が含まれています。
次のチャートはcustomer.age
フィールドにビン化を適用します。 age
フィールドには連続した数値データが含まれ、10進数単位でビン化されています。 各age
値は適切なビン化され、Charts では各バイナリの経過時間数をカウントして、店舗カスタマーの年数分布の概要を把握できます。
空のバイナリ
ビン化が有効になっている場合、Charts には、チャートが表示する最小データ範囲と最大データ範囲内の空のビンのエントリが表示されます。
注意
例外
Charts では、チャート上の一意なバイナリが 5000 を超える場合、空のバイナリは表示されません。
Charts が空のビンに使用する値は、選択した集計関数によって異なります。
集計関数 | 推論値 |
---|---|
count or distinct | 0 |
他のすべての関数 | null |
Charts では、チャートタイプに基づいて、 null
値を持つビン化されたファイルが異なる方法で表示されます。
チャートの種類 | Charts での null ビン化の表示方法 |
---|---|
高さが 0 のバーです。 Charts では、有効であっても、 null ビンのデータ ラベルは表示されません。 | |
線形補間。 null ビンにはデータマークはありません。 Charts では、有効であっても、 null ビンのデータ ラベルは表示されません。 |
チャートでデータをグループ化する方法の柔軟性を高めるために、string カテゴリを および ビン化できます。 ビンにカテゴリを追加すると、Atlas Charts は選択した各カテゴリのデータを集計して、そのビンのデータをレンダリングします。
ユースケース
選択したカテゴリ文字列をビン化することで、基礎データを変更することなく、共通のテーマを持つアイテムをグループ化できます。 固定された大きな値のセットを、小さく、より管理しやすいセットに統合できます。
次の例を考えてみてください。
世界的に国に関する情報を含むデータセットで、国を大陸ごとにグループ化したいとします。
履歴全体のさまざまなアーティストに関するデータセットを、アーティスト期間ごとにグループ化します(たとえば、ルネアンス、ロール、モダンなど)。
詳細なバージョン番号(例:
2.3.0
、2.3.1
、2.3.2-rc1
、2.4.0
)、より大きな粒度のグループで分析したい(例:2.3
、2.4
)。
string値からのビン化の作成
string フィールドをCategoryエンコーディング チャンネルにドラッグします。
フィールドのBinningをOnに切り替えます。
[Add Bin] をクリックします。
Add Binウィンドウで、ビン化にタイトルを付けます。
この時点で、カテゴリ文字列のリストからビン化を作成するか、 string値に一致する正規表現を定義することができます。 各ビンの正確な値を選択する場合は、カテゴリ文字列のリストを使用できます。 より大きな範囲の潜在的な値をパターン一致させる場合は、正規表現を使用する方が適しています。
選択したカテゴリ文字列からバイナリを作成するには、次の手順に従います。
Selectラジオボタンをクリックします。
ビン化に含めるカテゴリを選択します。
[ Saveをクリックします。 Binsウィンドウには、作成したビン化と、各ビン化に属するカテゴリの数が表示されます。
注意
各値は 1 つのビンにのみ追加できます。 他のビンにすでに追加されている値はすべて無効として表示され、追加されたビンの名前が追加されます。
チェックボックスと値のリストはデータのサンプルから取得されており、データに存在するすべての値が含まれるわけではありません。 リストに手動で別の値を追加できます。
正規表現からビン化を作成するには
Regexラジオボタンをクリックします。
Insert regexテキスト ボックスに正規表現を入力します。
テキストボックスの右側にあるドロップダウンメニューから任意のフラグを選択します。 使用可能な 4 つのフラグを任意に組み合わせて使用できます。
Flag説明i
大文字と小文字を区別しない検索m
複数行モードx
拡張モードs
単一行モード一致するドキュメントのサンプルが表示されます。 一致するドキュメントがない場合は、ビンを保存できます。
[ Saveをクリックします。 Binsウィンドウには、作成したビン化が表示されます。 正規式から作成されたビンは.*アイコンで表示されます。
Add Binリンクをクリックして別のビン化を追加するか、右上隅のXをクリックしてBinsウィンドウを閉じることができます。
既存のビン化の編集と削除
既存のカテゴリ ビンを編集するには、 Binningトグルの横にあるEditボタンをクリックします。 Binsウィンドウが表示されます。 各ビンの横にあるバッジは、そのビンに属するカテゴリの数を示します。
ビンを編集するには、 Pencil Iconをクリックします。 ビンの名前を変更し、そのビンに属するカテゴリを変更することができます。
ビンを削除するには、 Trashアイコンをクリックします。
例
次のチャートは、映画サンプル データのジャンルをより幅広いビン化にグループ化します。
Historical Moviesこれには、ドキュメント、人物、履歴、警告の各ジャンルが含まれます。
Light-Hearted Movies、これには管理されているジャンル、ランダム、ファミリーのジャンルが含まれます。
Scary Moviesこれには、「」、「 」、「 」、「 」というジャンルが含まれます。
これらのビンに含まれていないジャンルの映画はOther Valuesビンにグループ化されます。
グラフには、各ビン化に属する映画の平均imdb.rating
評価が表示されています。 チャートは、カテゴリ名がアルファベット順にソートされています。
次のグラフでは、 sample_airbnb.listingsAndReviews
コレクションのdescription
フィールドで特定の単語を検索し、平均価格を比較しています。 バイナリを使用して、 description
フィールドに正規表現で指定されたパターンに一致する string が含まれているかどうかに基づいてドキュメントをグループ化します。
動作
値はカテゴリ バイナリの 1 つのみにのみ属することができますが、任意の数の正規表現バイナリに属することができます。
どのバイナリにも追加されていないチャートに表示されている値は、 Other Valuesと呼ばれるデフォルトのバイナリに自動的に追加されます。
Binsウィンドウに表示されるビン化の順序は重要です。 各値は、表示される最高ランクのビンの一部としてチャートにレンダリングされます。
注意
Binsウィンドウでビン化してドロップすることで、ビン化されたアイテムを並べ替えることができます。
Sort Data
チャートビルダ のSort Byドロップダウンを使用して、次のいずれかでチャートデータをソートします。
カテゴリ
値
系列フィールド(複数系列チャート用)
複数系列グラフを、特定の系列でソートせずにValueで通常ソートすると、Atlas Charts は系列内のすべての値の合計に基づいてデータをソートします。
昇順または降順の並べ替え順序を切り替えるには、 Sort Byドロップダウンの右側にあるa-z
ボタンをクリックします。
デフォルトでは、Charts はValueに基づいてデータを降順でソートします。
複数系列Chartsを系列値でソート
系列ごとに異なるフィールドを使用して複数系列チャートを作成する場合、特定の系列フィールドでチャートをソートすることができます。
例
次のチャートは、「サンプル データ: 映画 」のデータソースを使用して、各ジャンルの映画のfresh
とrotten
のローテーション メソッドの平均評価を比較します。
このグラフは、平均fresh
値の降順でソートされています。
このグラフは、平均rotten
値の昇順でソートされています。
Limit Data
Categoryエンコーディング チャンネルに制限を適用して、可視化に指定された数のカテゴリのみを含めることができます。 含まれるカテゴリは、指定された ソート順 に基づいて 最初 に一致するカテゴリです。カテゴリが多すぎると、意味のあるチャートを作成するのが困難になる場合、データを制限すると便利です。
データを制限する場合は、制限によって省略されたカテゴリの値を組み合わせた「すべてのその他」という新しいカテゴリを追加するために、 Show "All Others"を有効にすることができます。
例
次のグラフは、平均 IMDb を示しています。 特定の国の映画の評価:
データセットには多くの国の映画が含まれていますが、どの国が最も評価の高い映画を認証しているかを確認するのが最も重要です。 これを実現するには、映画の平均評価が 10 番目に高い国のみを表示するという制限を適用します。
Limit ResultsトグルをOn
に切り替え、 Show入力はデフォルト値の 10 のままにします。
Show "All Others"をオンにして、上位 10 地域がない国の映画の平均評価を表す 11 番目の列を作成します。
チャートがはるかに理解しやすくなり、最高評価の映画がある国が明確に表示されるようになりました。