Amazon SageMaker Unified Studioがデータ品質ルールの作成と評価に対応
Amazon SageMaker Unified Studio now supports data quality rule authoring and evaluation
概要
Amazon SageMaker Unified StudioがAWS Glue Data Qualityを活用したデータ品質ルールの作成と評価機能をサポートしました。データエンジニア、アナリスト、データサイエンティストがカタログテーブルの静止データと Visual ETL ジョブ内の動的データの両方に対して、データ品質ルールを定義し、ルールセット評価を実行して結果を確認できます。SageMaker Unified Studio が利用可能なすべての AWS リージョンで、IAM Identity Center ベースおよび IAM ベースのドメインの両方で利用可能です。
何が変わったか
- ・SageMaker Unified Studio でデータカタログ資産に専用の Data Quality タブが追加され、ルール作成、オンデマンド/スケジュール評価、ルール単位の合否結果表示が可能になった
- ・Visual ETL ジョブに Evaluate Data Quality トランスフォーム を追加でき、ジョブ実行の詳細結果としてデータ品質結果を確認できるようになった
- ・AWS Glue Data Quality が使用する DQDL を SageMaker Unified Studio で直接使用でき、完全性、一意性、鮮度、精度などのデータ品質ディメンションのルール作成が可能になった
影響
既存ユーザーは新機能を利用するための追加の移行作業は不要で、SageMaker Unified Studio 内で統一されたデータ品質管理が可能になります。
対象ユーザー
SageMaker Unified Studio を利用するデータエンジニア、データアナリスト、データサイエンティスト
まとめ
SageMaker Unified Studio で AWS Glue Data Quality を活用したデータ品質ルールの作成・評価がネイティブサポートされるようになった。
原文タイトル
Amazon SageMaker Unified Studio now supports data quality rule authoring and evaluation
AWS公式アナウンスを読む →