Cloud Data Validation
Summary
TLDRこのビデオでは、クラウドデータ検証(CDV)の重要な機能と利点について説明されています。CDVは、データ移行中にデータの検証を自動化し、異なるシステム間でのデータ一致を確認するために使用されます。具体的には、PowerCenterとIDMCの間でマッピング結果を比較することができ、さまざまな検証ルールを設定できます。データ検証サービス、プロセッサ、メタデータストア、レポートデータストアなど、システムの主要コンポーネントやテストケース作成方法が紹介され、データの一致、不一致、欠損レコードなどの詳細レポート生成が可能です。さらに、サンプルデータに基づいた検証や集約関数の使用方法、テストスイート作成も説明されています。
Takeaways
- 😀 クラウドデータ検証は、データ移行中にテストや検証を行うためのサービスで、特にPowerCenterとIDMCの間で出力結果を比較する機能を提供します。
- 😀 テストケースは、マッピングの出力を比較するために作成でき、データのサンプリングやエラーレコードの制限を設定することができます。
- 😀 データ検証サービスでは、テストケースやテストスイートを設定し、スケジュール実行や通知機能を提供できます。
- 😀 クラウドデータ検証は、データの一致、不一致、追加、欠損などをレポートとして表示します。
- 😀 ライセンスとパッケージには、データ検証プロセッサとデータ検証サービスが含まれており、必要なエンドポイントもサポートされています。
- 😀 データ検証の主要なコンポーネントには、UIで操作するデータ検証サービス、処理を行うデータ検証プロセッサ、テストケース定義とレポートを保存するメタデータストア、レポートデータストアが含まれます。
- 😀 テストケースで使用される用語には、一致したレコード、不一致レコード、追加されたレコード、欠損したレコードが含まれ、これらをレポートで確認できます。
- 😀 具体的なテストケースの例として、文字列検証、データサンプリングを使った検証、集計関数による検証などがあります。
- 😀 文字列検証では、データに対して空白のトリミングやケース感度を無視するオプションを設定することができます。
- 😀 集計関数によるテストケースでは、最小値、最大値、平均値、合計などを計算し、両方の接続データセットで比較できます。
Q & A
クラウドデータバリデーションとは何ですか?
-クラウドデータバリデーションは、インフォマティカのIDMCサービスの一部で、データ移行時に出力結果を比較して検証を行うために設計されたツールです。これにより、異なるシステム間でのデータの整合性を確認することができます。
クラウドデータバリデーションの主な機能は何ですか?
-主な機能には、データセット間の比較、バッドレコードの制限、文字列のバリデーション(スペース削除や大文字・小文字の区別無視)、データサンプリング、テストケースのスケジューリング、通知の送信、テストスイートの実行などがあります。
クラウドデータバリデーションを使用する利点は何ですか?
-このツールは、異なるシステム間でのデータ比較を自動化し、手動で行う場合に比べて大幅に効率を向上させ、検証作業を簡素化します。特に、データ移行プロジェクトにおいて重要な役割を果たします。
クラウドデータバリデーションのライセンスとパッケージについて教えてください。
-クラウドデータバリデーションは、スターターパックおよびアドオンパックに含まれており、PowerCenterエディションのCDVが利用可能です。ライセンスには、データバリデーションサービスとプロセッサーが含まれ、必要なパーツがライセンスに含まれている場合に有効になります。
データバリデーションの主要なコンポーネントは何ですか?
-主要なコンポーネントには、データバリデーションサービス(UIを通じてテストケースとテストスイートを定義する)、データバリデーションプロセッサ(実行とレポート作成を担当)、メタデータストア(テストケース定義とサマリーレポート保存)、レポートデータストア(レポートの生データを保存)があります。
テストケースとテストスイートの違いは何ですか?
-テストケースは、個別のデータ検証を行う単一の検証単位ですが、テストスイートは複数のテストケースを含むもので、定義した順序で実行されます。テストスイートは、複数のテストケースをまとめて実行するための便利な機能です。
データ比較における「一致するレコード」と「不一致のレコード」の違いは何ですか?
-「一致するレコード」は、比較対象のデータセット間で同じ内容のレコードを指し、「不一致のレコード」は、内容が異なるレコードを指します。また、「余分なレコード」は、一方にしか存在しないレコードで、「欠落したレコード」は、片方に存在し、もう片方には存在しないレコードです。
サンプリングオプションとは何ですか?
-サンプリングオプションは、全データセットを比較するのではなく、特定のサンプルデータのみを比較するための設定です。これにより、大規模なデータセットに対して効率的にテストを実行できます。
集約関数の検証をどのように行いますか?
-集約関数の検証は、最小値、最大値、平均値、合計などの集約関数を特定の列に適用し、異なるデータセット間で一致するかどうかを比較します。例えば、顧客IDの最小値と最大値、注文金額の合計を比較することができます。
テストケースの実行結果を通知する方法はありますか?
-はい、テストケースの実行後にメール通知を送信することができます。通知は、組織のデフォルト設定またはカスタム通知リストを使って、特定の人々に送信できます。成功・失敗の通知を個別に設定することも可能です。
Outlines

此内容仅限付费用户访问。 请升级后访问。
立即升级Mindmap

此内容仅限付费用户访问。 请升级后访问。
立即升级Keywords

此内容仅限付费用户访问。 请升级后访问。
立即升级Highlights

此内容仅限付费用户访问。 请升级后访问。
立即升级Transcripts

此内容仅限付费用户访问。 请升级后访问。
立即升级5.0 / 5 (0 votes)