Atlas Stream Processing には次の制限が適用されます。
ストリーム プロセッサの
state.stateSizeは、そのポッドで利用可能な RAM の 80% を超えることはできません。例えば、8GB の RAM を備えたSP30階層のストリーム プロセッサの最大サイズは 6.4GB です。ストリーム プロセッサのいずれかのstate.stateSizeが使用可能な RAM の 80% に近づいている場合は、プロセッサを停止し、より高い階層で再起動することを検討してください。ストリーム プロセッサが Stream Processing ワークスペースで有効になっている最大階層ですでに実行されている場合は、より高階層のストリームプロセッサを有効にするために Stream Processing ワークスペースの設定を調整することを検討してください。ストリーム プロセッサが 80% の RAM のしきい値を超えると、
stream processing workspace out of memoryエラーで失敗します。各ストリーム プロセッサのstate.stateSize値はsp.processor.stats()コマンドで確認できます。詳しくは、「ストリームプロセッサの統計を表示する」をご覧ください。Stream Processing ワークスペースは、ソースまたはシンクと同じプロジェクト内のクラスターのみを使用できます。
Atlas Stream Processing パイプラインの定義は16 MB を超えることはできません。
Project OwnerまたはAtlas adminロールを持つユーザーのみが Atlas Stream Processing を使用できます。Atlas Stream Processing は現在、次の接続タイプのみをサポートしています。
接続タイプ使用法Source または Sink
Atlas Database
Source または Sink
サンプル接続
ソースのみ
Apache Kafka を$source として使用する Atlas Stream Processing の場合、実行中のプロセッサに $source として機能するApache Kafkaトピックがパーティションを追加すると、Atlas Stream Processing はパーティションを読み込まずに実行中を続行します。プロセッサは、障害後にチェックポイントから復元した後に新しいパーティションを検出するか、停止してから再起動すると失敗します。新しく追加されたパーティションを使用して、トピックから読み取るプロセッサを再作成する必要があります。
Atlas Stream Processing は現在、JSON 形式のデータのみをサポートしています。 現在、Avro やプロトコル バッファーなどの代替直列化はサポートされていません。
Apache Kafka接続の場合、Atlas Stream Processing は現在、次のセキュリティ プロトコルのみをサポートしています。
SASL_PLAINTEXTSASL_SSLSSL
SASLの場合、Atlas Stream Processing は次のメカニズムをサポートしています。PLAINSCRAM-SHA-256SCRAM-SHA-512OAUTHBEARER
の場合、Atlas
SSLStream Processing とのApache Kafkaシステムの相互 TLS認証用に次のアセットを提供する必要があります。認証局(デフォルトのApache Kafka CA 以外を使用している場合)
クライアントTLS 証明書
TLS 証明書に署名するために使用される TLS キーファイル
Atlas Stream Processing は$function JavaScript UTFをサポートしていません。
Atlas Stream Processing は、Atlas で利用可能な 集計パイプライン ステージ のサブセットをサポートしており、保管中のデータで実行できる操作をストリーミング データに対して多数実行できます。 サポートされている集計パイプライン ステージの完全なリストについては、ストリーム集計 のドキュメントを参照してください。
Atlas Stream Processing は集計変数
$$NOW、$$CLUSTER_TIME、$$USER_ROLES、および$SEARCH_METAをサポートしていません。