Cloud Data Validation
Summary
TLDRこのビデオでは、クラウドデータ検証(CDV)の重要な機能と利点について説明されています。CDVは、データ移行中にデータの検証を自動化し、異なるシステム間でのデータ一致を確認するために使用されます。具体的には、PowerCenterとIDMCの間でマッピング結果を比較することができ、さまざまな検証ルールを設定できます。データ検証サービス、プロセッサ、メタデータストア、レポートデータストアなど、システムの主要コンポーネントやテストケース作成方法が紹介され、データの一致、不一致、欠損レコードなどの詳細レポート生成が可能です。さらに、サンプルデータに基づいた検証や集約関数の使用方法、テストスイート作成も説明されています。
Takeaways
- 😀 クラウドデータ検証は、データ移行中にテストや検証を行うためのサービスで、特にPowerCenterとIDMCの間で出力結果を比較する機能を提供します。
- 😀 テストケースは、マッピングの出力を比較するために作成でき、データのサンプリングやエラーレコードの制限を設定することができます。
- 😀 データ検証サービスでは、テストケースやテストスイートを設定し、スケジュール実行や通知機能を提供できます。
- 😀 クラウドデータ検証は、データの一致、不一致、追加、欠損などをレポートとして表示します。
- 😀 ライセンスとパッケージには、データ検証プロセッサとデータ検証サービスが含まれており、必要なエンドポイントもサポートされています。
- 😀 データ検証の主要なコンポーネントには、UIで操作するデータ検証サービス、処理を行うデータ検証プロセッサ、テストケース定義とレポートを保存するメタデータストア、レポートデータストアが含まれます。
- 😀 テストケースで使用される用語には、一致したレコード、不一致レコード、追加されたレコード、欠損したレコードが含まれ、これらをレポートで確認できます。
- 😀 具体的なテストケースの例として、文字列検証、データサンプリングを使った検証、集計関数による検証などがあります。
- 😀 文字列検証では、データに対して空白のトリミングやケース感度を無視するオプションを設定することができます。
- 😀 集計関数によるテストケースでは、最小値、最大値、平均値、合計などを計算し、両方の接続データセットで比較できます。
Q & A
クラウドデータバリデーションとは何ですか?
-クラウドデータバリデーションは、インフォマティカのIDMCサービスの一部で、データ移行時に出力結果を比較して検証を行うために設計されたツールです。これにより、異なるシステム間でのデータの整合性を確認することができます。
クラウドデータバリデーションの主な機能は何ですか?
-主な機能には、データセット間の比較、バッドレコードの制限、文字列のバリデーション(スペース削除や大文字・小文字の区別無視)、データサンプリング、テストケースのスケジューリング、通知の送信、テストスイートの実行などがあります。
クラウドデータバリデーションを使用する利点は何ですか?
-このツールは、異なるシステム間でのデータ比較を自動化し、手動で行う場合に比べて大幅に効率を向上させ、検証作業を簡素化します。特に、データ移行プロジェクトにおいて重要な役割を果たします。
クラウドデータバリデーションのライセンスとパッケージについて教えてください。
-クラウドデータバリデーションは、スターターパックおよびアドオンパックに含まれており、PowerCenterエディションのCDVが利用可能です。ライセンスには、データバリデーションサービスとプロセッサーが含まれ、必要なパーツがライセンスに含まれている場合に有効になります。
データバリデーションの主要なコンポーネントは何ですか?
-主要なコンポーネントには、データバリデーションサービス(UIを通じてテストケースとテストスイートを定義する)、データバリデーションプロセッサ(実行とレポート作成を担当)、メタデータストア(テストケース定義とサマリーレポート保存)、レポートデータストア(レポートの生データを保存)があります。
テストケースとテストスイートの違いは何ですか?
-テストケースは、個別のデータ検証を行う単一の検証単位ですが、テストスイートは複数のテストケースを含むもので、定義した順序で実行されます。テストスイートは、複数のテストケースをまとめて実行するための便利な機能です。
データ比較における「一致するレコード」と「不一致のレコード」の違いは何ですか?
-「一致するレコード」は、比較対象のデータセット間で同じ内容のレコードを指し、「不一致のレコード」は、内容が異なるレコードを指します。また、「余分なレコード」は、一方にしか存在しないレコードで、「欠落したレコード」は、片方に存在し、もう片方には存在しないレコードです。
サンプリングオプションとは何ですか?
-サンプリングオプションは、全データセットを比較するのではなく、特定のサンプルデータのみを比較するための設定です。これにより、大規模なデータセットに対して効率的にテストを実行できます。
集約関数の検証をどのように行いますか?
-集約関数の検証は、最小値、最大値、平均値、合計などの集約関数を特定の列に適用し、異なるデータセット間で一致するかどうかを比較します。例えば、顧客IDの最小値と最大値、注文金額の合計を比較することができます。
テストケースの実行結果を通知する方法はありますか?
-はい、テストケースの実行後にメール通知を送信することができます。通知は、組織のデフォルト設定またはカスタム通知リストを使って、特定の人々に送信できます。成功・失敗の通知を個別に設定することも可能です。
Outlines

This section is available to paid users only. Please upgrade to access this part.
Upgrade NowMindmap

This section is available to paid users only. Please upgrade to access this part.
Upgrade NowKeywords

This section is available to paid users only. Please upgrade to access this part.
Upgrade NowHighlights

This section is available to paid users only. Please upgrade to access this part.
Upgrade NowTranscripts

This section is available to paid users only. Please upgrade to access this part.
Upgrade Now5.0 / 5 (0 votes)