How to accelerate machine learning development with BigQuery ML

Google Cloud

11 Oct 202218:20

Summary

TLDRAbhinav KhushrajとCandice Chenは、Google CloudのBigQuery MLについて語りました。2018年にリリースされてから、さまざまな企業やスタートアップ、個人データ専門家から好評を得ています。BigQuery MLは、データサイエンスを誰にでも簡単にできるようにすることで、強力なML機能を解き放すというミッションを持ち続けています。BigQuery MLは、データ管理の簡易化、インフラstractureの扱いを避け、デプロイの容易さを提供します。また、MLOpsの統合、非構造化データの活用、TensorFlow LiteやXGBoostなどのモデルのインポート、リモートモデルでの推論、予測の向上、特徴工学的強化など、新機能が紹介されました。特にTwiddyの事例では、非構造化データと構造化データの組み合わせが、検索結果の向上に寄与し、コンテンツチームの意思決定をデータ駆動型に変えました。

Takeaways

🚀 BigQuery MLは、2018年にリリースされて以来、多くの顧客から好評を得ており、大小様々な企業やスタートアップ、個人のデータ専門家が革新的な方法で活用している。
📈 BigQuery MLのミッションは、誰もがデータサイエンティストになることができるように、強力な機械学習（ML）機能を簡単に解き放すことです。
🔧 従来のMLワークフローでは、データの移動やインフラストラクチャの整備、スキルセットの確保など多くの課題がありましたが、BigQuery MLはこれらを解決する。
💡 BigQuery MLでは、単純なSQLクエリでモデルをトレーニングし、BigQuery内の既存データセットを指し示してモデルを構築できます。
📊 BigQuery MLは、ビッグデータのスケールとコンピュート能力を活用して、1,000行から数百만行までのデータを扱うことができます。
🔗 MLOpsは、企業規模での機械学習を実行する上で不可欠であり、BigQuery MLはVertex AI Model Registryと緊密に統合されています。
🧠 BigQuery MLは、ビジョンモデルを導入し、非構造化データ（画像、テキスト、ドキュメントなど）の価値を解き放すことができます。
🔌 BigQuery MLは、TensorFlow、TensorFlow Lite、XGBoostなどの他のプラットフォームでトレーニングされたモデルをインポートできるようになりました。
📉 ARIMA Plusと呼ばれる単変量時系列予測モデルに加えて、BigQuery MLは今、外部回帰子を用いた多変量時系列予測をサポートします。
⚙️ 特徴エンジニアリングは、優れた機械学習の核心であり、BigQuery MLは新しい数値およびカテゴリカル関数を導入することで、これに貢献します。
🌟 Twiddyの事例では、BigQuery MLを使用して、非構造化データと構造化データを組み合わせて、クリックスルー率を予測し、マーケティング分析を劇的に変革しました。
📝 Twiddyは、BigQuery MLを活用して、データドリブンなアプローチでコンテンツチームが写真の選択と編集を行うことができます。

Q & A

BigQuery MLはいつから利用可能になったのですか？
-BigQuery MLは2018年にリリースされました。
BigQuery MLの導入により、どのような新しい機能が提供される予定ですか？
-BigQuery MLは、MLOpsの統合、非構造化データの分析、TensorFlow LiteやXGBoostなどのモデルのインポート、リモートモデルでの推論、予測機能の強化、およびフィーチャーエンジニアリングの向上など、多くの新機能を提供する予定です。
MLOpsとは何ですか？なぜ重要なのでしょうか？
-MLOpsは、機械学習のエンタープライズ規模での運用を支援するプロセスです。モデルの管理や比較、監視などを行うことで、機械学習の質と効率を保証します。
BigQuery MLが提供する非構造化データの分析とは何ですか？
-非構造化データの分析では、画像やテキスト、ドキュメントなどのデータを扱えます。BigQuery MLは、これらのデータをモデル予測に活用できるように、画像からオブジェクトを特定するなど、ビジョンモデルを導入しています。
TensorFlow LiteやXGBoostなどの外部でトレーニングされたモデルをBigQuery MLで使用するにはどうすればよいですか？
-外部でトレーニングされたモデルをBigQuery MLで使用するためには、CREATE OR REPLACE MODELを使用してモデルをインポートし、ML.PREDICTで推論を行うことができます。
リモートモデルでの推論とは何ですか？
-リモートモデルでの推論とは、すでに他のプラットフォーム（例：Vertex AIやCloud Functions）にデプロイされているモデルに対して、BigQuery MLから推論を実行できる機能です。これにより、BigQuery MLでサポートされていないモデルタイプも使用できます。
BigQuery MLの多変量時系列予測とは何ですか？
-多変量時系列予測は、過去の売上だけでなく、売上に影響を与える他の要因も考慮して未来の売上を予測する機能です。ARIMA Plus XREGを使用することで、ターゲットメトリックだけでなく、追加の特徴量も入力できます。
BigQuery MLで提供されるフィーチャーエンジニアリングの新しい機能は何ですか？
-BigQuery MLでは、新しい数値型とカテゴリー型の関数の導入、そしてモデルのエクスポート時に変換句が一緒にエクスポートされることで、オンライン展開でのモデルの使いやすさが向上します。
Twiddyの事例ではどのようにBigQuery MLを使用してクリックスルー率を予測しましたか？
-Twiddyは、Google Cloud Storageに保存された家の画像を指すオブジェクトテーブルを作成し、ビジョンモデルをインポートして画像を数値データに変換しました。その後、ビジネスデータと組み合わせて、機械学習モデルを構築し、クリックスルー率を予測しました。
Twiddyはどのようにして画像の選択と編集を改善しましたか？
-Twiddyは、機械学習モデルの結果をもとに、ユーザーがクリックする可能性が高い画像の特徴を理解し、コンテンツチームが写真の選択と編集にデータ駆動型のアプローチを取るようになりました。
BigQuery MLの新機能に興味を持っていたらどうすればよいですか？
-興味を持っていたら、ページ下部に表示されるリンクから興味を表明するフォームにアクセスし、登録することができます。登録後、Google Cloudチームから連絡がくる予定です。