Building and training ML models with Vertex AI

Google Cloud Tech

31 May 202112:36

Summary

TLDRビデオの要約では、Priyanka VergadiaがAI Simplifiedというシリーズで、データセットの管理からモデルの構築・トレーニング、評価、展開、予測までをカバーするVertex AIというプラットフォームを紹介しています。このエピソードでは、AutoMLとカスタムモデルトレーニングの選択肢と、それぞれの適用状況について解説しています。また、信用カード詐欺検出モデルの構築手順を紹介し、データセットのアップロード、モデルのトレーニングオプションの設定、そしてモデルの評価指標を解説しています。さらに、AutoMLモデルのトレーニング方法と、モデルのデプロイとテスト方法についても説明しています。最後に、カスタムモデルの構築に焦点を当てた次のエピソードへの期待をかき立てています。

Takeaways

📈 Vertex AIは、機械学習のワークフローの各ステップに必要なツールを提供するプラットフォームです。
🔍 Vertex AIは、画像、テーブル、テキスト、ビデオデータを扱うマネージドデータセットをサポートしています。
🤖 AutoMLは、最小限の労力で高品質なカスタムモデルを作成できる機能です。
💡 カスタマーコードを使用すると、クラウド上でカスタムトレーニングアプリケーションを実行できます。
📚 AutoMLは、画像分類、ビデオ分類、テキスト分類など、特定のユースケースに適しています。
🔧 カスタムモデルは、モデルのアーキテクチャやフレームワークに特定の要件がある場合に適しています。
👥 チームの機械学習の専門知識が限られている場合は、AutoMLが最適な選択です。
🚀 小規模なデータサイエンスチームは、AutoMLを通じて迅速な初期モデルを開発することが推奨されます。
🛠️ カスタマーモデルを使用すると、既存の基準を改善したり、ヒューリスティクスをテストしたりできます。
📊 Vertex AIを使用してAutoMLモデルを構築・トレーニングする手順は、データセットの作成から開始されます。
📝 モデルの評価指標として、混同行列と特徴重要性が重要です。
🔬 Vertex AIでは、個々の予測だけでなく、バッチ全体の特徴重要性を取得できます。
🌐 モデルのデプロイメント後、エンドポイントを作成し、トラフィックを分割して複数のエンドポイントに配布できます。
📘 UIとAPIの両方を使って、デプロイされたモデルから予測を得ることができます。

Q & A

AutoMLとは何ですか？
-AutoMLは、最小限の労力と機械学習の専門知識で高品質のカスタムモデルを作成できるツールです。AutoMLは、画像、ビデオの分類、テキストの分類、エンティティ抽出、センチメント分析、テーブル形式の回帰や分類などのユースケースに適しています。
カスタムモデルトレーニングコードとは何ですか？
-カスタムモデルトレーニングコードとは、クラウド上で事前に構築されたコンテナを使用して、独自のトレーニングアプリケーションを実行できるオプションです。これは、モデルのアーキテクチャやフレームワーク、出力モデルアセットについて制御する必要がある場合に適しています。
AutoMLを選択するべき状況は何ですか？
-AutoMLは、サポートされているAutoMLオファリングに適合するユースケースの場合、またはチームが機械学習の専門知識が限られている場合、また小規模なデータサイエンスチームで素早く初期モデルを開発する必要がある場合に適しています。
カスタムモデルを使用するべき状況は何ですか？
-カスタムモデルは、AutoMLがサポートしていないユースケースに適しています。また、モデルが混合型の入力タイプをとる場合や、モデルの背後にある要件に特定の制御が必要な場合にも適しています。
データセットの管理とは何ですか？
-データセットの管理とは、Vertex AIが提供する機能で、画像、テーブル、テキスト、ビデオデータのデータセットを管理することができます。管理されたデータセットは、モデルの構築とトレーニングに直接フィードされます。
モデルのトレーニング時に、AutoMLとカスタムトレーニングのどちらを選ぶべきですか？
-モデルのトレーニング時に使用するオプションは、ユースケースやチームの専門知識、チームの規模、そしてモデルの要件によって決まります。AutoMLは、専門知識が限られている場合や素早く初期モデルを開発する必要がある場合に適しています。一方、カスタムトレーニングは、より高度な制御が必要で、より専門的な知識を持つチームに適しています。
モデルの評価指標として、コンフュージョンマトリクスとは何ですか？
-コンフュージョンマトリクスは、テストセットの各クラスの例について、モデルが正しく予測した割合を示す指標です。これは、データセットが極端に偏っている場合に、全体の精度よりもモデルのパフォーマンスを測定するのに適した方法です。
特徴量の重要性とは何ですか？
-特徴量の重要性は、モデルが予測を行っているときに最も大きな信号を提供する特徴を示す指標です。これは、説明可能なAIのフィールドの一部であり、モデルが予測を行っている仕組みをより深く理解するのに役立ちます。
モデルのデプロイメントとは何ですか？
-モデルのデプロイメントとは、トレーニングされたモデルをエンドポイントに展開し、それから予測を得られるようにすることです。Vertex AIでは、モデルリソースに複数のエンドポイントを関連付け、エンドポイント間のトラフィックを分割することができます。
Vertex AIのUIとAPIのどちらを使用してモデルの予測を得ることができますか？
-Vertex AIでは、UIとAPIの両方を使ってモデルの予測を得ることができます。UIは、デプロイされたエンドポイントが期待通りに動作していることを確認するのに便利です。一方、APIは、プログラムから動的に予測を得るために使用されます。
トレーニングデータが偏っている場合、モデルのパフォーマンスを向上させるために何を試すことができますか？
-トレーニングデータが偏っている場合、モデルのパフォーマンスを向上させるためには、より多くのコンピュート時間をトレーニングに使用したり、より多くのトレーニングデータを収集することができます。また、特徴量の重要性を分析して、最も重要な特徴を特定し、モデルの性能を改善するのに役立てることができます。
Vertex AIを使用してモデルをトレーニングした後、次に何をすべきですか？
-Vertex AIを使用してモデルをトレーニングした後、次のステップはエンドポイントの作成です。その後、UIやAPIを通じてモデルの予測を得ることができます。また、モデルの評価指標を分析し、特徴量の重要性に基づいてモデルを改善することができます。