Bloomberg's Journey to a Multi-Cluster Workflow Orchestration Platform - Yao Lin & Reinhard Tartler
Summary
TLDRRina TartlerとYaolinは、Bloombergのマルチクラスターワークロードオーケストレーションプラットフォームへの旅についてのプレゼンテーションを行います。彼らは、内部エンジニア向けに提供されるワークフローオーケストレーションプラットフォームの背景、使用されている技術、そして直面した課題と解決策について詳しく説明します。特に、Argo Workflowsを利用した実装や、データセンター間のレジリエンスを強化するための静的リソース管理に焦点を当てます。彼らは、クロスデータセンターの一貫性と、複数のクラスターにわたる静的リソースの管理に関する独自のアプローチを共有し、参加者からの質問に答えながら、この技術的な旅路が業界の他の人々にとっても有益であることを願っています。
Takeaways
- 🌐 Bloombergのクラウドネイティブコンピューティングサービスグループは、内部エンジニア向けのワークフローオーケストレーションプラットフォームを提供している。
- 🚀 プラットフォームは「Argo Workflows」というCNCFプロジェクトを基盤としており、ユーザーはこれを使用してワークフローの進行を視覚的に追跡できる。
- 🔒 Bloombergはデータアクセス要件が厳格で、特定のデータへのアクセスにはRBACなどの制御が必要である。
- 🛠 プラットフォームは機械学習、CICD、メンテナンスタスク、金融分析など、さまざまな用途に使用されている。
- ⚖️ マルチクラスターソリューションには機能的および非機能的な追加要件があり、これがBloombergの旅の方向性を決定した。
- 🌍 クロスデータセンターレジリエンスは大きな課題であり、少なくともデータセンターごとに1つのArgo Workflowsインストールが必要である。
- 💡 彼らは、マネジメントサービスを導入することで、ユーザーが直面するデータセンター選択の課題を解決した。
- 📦 静的リソースとワークフローランの管理は異なり、前者はクラスター間で一貫して展開および更新される必要がある。
- 🔄 彼らは、ポストグレSQLを使用してクロスデータセンターの一貫性を実現し、KINDというKubernetesのAPIサーバーを使用してこれをKubernetesエコシステムに統合した。
- 🤖 この新しいアーキテクチャは、リソース管理のための「仮想コントロールプレーン」を作成し、クラスター間での統一されたリソースの展開と管理を可能にする。
Q & A
Bloombergのワークフローオーケストレーションプラットフォームの目的は何ですか?
-Bloombergのワークフローオーケストレーションプラットフォームは、内部エンジニア向けに提供されているプラットフォームであり、一般的なユーティリティコンピュートを提供することで、実行までのジョブを自動化することを目的としています。
Argo Workflowsが重要な役割を果たる理由は何ですか?
-Argo Workflowsは、Bloombergのクライアントが主に使用するワークフローオーケストレーションのコア機能を提供しているCNCFプロジェクトであり、2022年12月に卒業した成熟度レベルに達しています。
Bloombergのプラットフォームが支持する様々なユースケースには何がありますか?
-Bloombergのプラットフォームは、機械学習オーケストレーション、AIモデルのトレーニングとチューニング、CI/CDソリューションのトリガー、物理的および仮想インフラストラクチャのメンテナンスタスク、金融分析タスクのオーケストレーションなど、多様なユースケースをサポートしています。
Bloombergのデータアクセス要件にはどのような特徴がありますか?
-Bloombergはデータ会社であり、データは独自で大規模であり、非常に特定のアクセス要件を持っています。ユーザーは一般的にBloombergのUIとAPIを使用して、ワークフロー、POD、入力、ワークフローログを追跡します。
Bloombergのワークフローオーケストレーションプラットフォームでスケジュールされたワークフローはどのように機能しますか?
-Bloombergのプラットフォームでは、ユーザーがCronストリングを指定することや外部トリガーに関連付けた独自のカスタムスケジュールを持って、ワークフローをスケジュールすることができます。
データセンター間の弾力性とは何を意味しますか?
-データセンター間の弾力性は、アプリケーションチームが複数のデータセンター間で弾力性を開発する必要があることを意味し、これは私たちの視点からは、Argo Workflowsを各データセンターで少なくとも1回実行する必要性を意味します。
Bloombergのチームがデータセンター間での一貫性の問題を解決するために採用した方法は何ですか?
-Bloombergのチームは、管理サービスを導入することで、データセンターの現在の利用状況やオーバーロードを考慮してワークフローの配置を決定するようにしました。
静的リソースとは何ですか?
-静的リソースとは、ワークフローが開始および終了時に必要である、一時的に必要但不必要なリソースを指します。これには、データベースへの接続文字列を含むConfig Mapsや認証資格情報を含むSecretsが含まれます。
Bloombergのチームが採用したk3sとは何ですか?
-k3sは、外部データベースをストレージバックエンドとして使用できる軽量Kubernetesディストリビューションであり、制約されたハードウェアやエッジノード、実験環境などの場で使用されます。
Postgresのストリーミングレプリケーションを使用することの利点は何ですか?
-Postgresのストリーミングレプリケーションを使用することにより、リーダーレプリカがすべてのリーダーリクエストを受け入れ、トランザクションログが他のレプリカにストリームされることで、最終的にすべてのレプリカが一貫性を持ち、リーダー-electionプロセスが発生しても迅速に復旧できるようになります。
Bloombergのチームが採用したソリューションのコスト効率はどのように評価されていますか?
-Bloombergのチームは、Postgresのストリーミングレプリケーションを使用することで、データセンター間での弾力性を実現するコスト効率が高いソリューションを得ることができ、データベースをストレージバックエンドとして使用することで、KubernetesのAPIサーバーの利点を活用することができました。
Outlines

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。
今すぐアップグレードMindmap

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。
今すぐアップグレードKeywords

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。
今すぐアップグレードHighlights

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。
今すぐアップグレードTranscripts

このセクションは有料ユーザー限定です。 アクセスするには、アップグレードをお願いします。
今すぐアップグレード関連動画をさらに表示

「7年YouTube動画作り続けてようやく気づいた動画撮影の基本中の基本」第2253話

なぜ水星へ行くのは最も難しいのか?全惑星へのアクセス時間比較【JST 午後正午】

ブッダの生涯 14 (佐々木閑「仏教哲学の世界観」第2シリーズ)

SpaceX's plan to fly you across the globe in 30 minutes | Gwynne Shotwell

Academic Skills - Presenting Effectively - Part 1

【要約】アルケミスト 夢を旅した少年/あなたが今すぐ行動できない理由8選【パウロ・コエーリョ】

マイアミ34歳ひとり旅🇺🇸宿は安いが飯高いアメリカ屈指のリゾート地。【北米#18】2023年10月20日〜11月3日
5.0 / 5 (0 votes)