AutoDev|マイクロソフトが発表した「AI エンジニア軍団」をつくる自動開発フレームワーク【Devin に驚いている場合じゃない!】
Summary
TLDRMicrosoftが発表した革新的な自動開発フレームワーク「オートデブ」について解説。この框架は複数のAIエージェントを管理し、タスクを自動化することができる。AI同士が会話しながらタスクを進め、セキュリティとプライバシーを確保するドッカーコンテナ技術を利用している。高いパフォーマンス評価を示し、将来的には人間のITエンジニアの仕事に大きな影響を与える可能性がある。
Takeaways
- 🤖 Microsoftが発表したオートデブは、AIエージェントを複数管理し、自動開発フレームワークを提供する技術です。
- 🔧 従来のAIエージェントと異なり、オートデブは開発プロセス全体を自動化することが可能です。
- 🛡️ セキュリティとプライバシーの保護も重要視し、適切な設定で問題が軽減されるとされています。
- 💬 AIエージェント同士がコラボレーションし、会話しながらタスクを進めることが特徴です。
- 🔍 既存のAI技術を活用して、コード生成やテスト自動化、リファクタリングなどが期待される自動化タスクの1つです。
- 📈 評価において、オートデブは高いパフォーマンスを発揮しており、1つのソースコードに対して高い確率でテストを通過することが示されています。
- 🔄 ドッカーコンテナ技術を利用し、環境構築や実行環境の分離を行います。
- 🔄 コマンドや権限を適切に設定することで、AIの自動化が安全に行われることが期待されます。
- 👥 将来的には、エンジニアリングスキルを持つ一般の人が増え、AIを管理・扱うための専門知識がますます必要になるでしょう。
- 🔄 ドキュメンテーションの自動化やソースコードレビューなど、AIが取り組めるタスクの範囲はさらに広がる可能性があります。
- 🌐 現在、オートデブは一般公開されていないが、将来的には一般公開され、多くのエンジニアが触れることが期待されます。
Q & A
オートデブとは何ですか?
-オートデブは、Microsoftが発表した自動開発フレームワークで、複数のAIエージェントを管理し、自分だけのAIエンジニアチームを持ち、開発プロセス全体を自動化することができる技術です。
オートデブの主な特徴は何ですか?
-オートデブの主な特徴は、複数のAIエージェントを管理して役割を与えること、AIエージェント同士が会話してタスクを進めること、全体の情報制御やAIの権限を設定し、Dockerを利用することでセキュリティも担保が可能であることです。
オートデブでAIエージェントはどのように機能しますか?
-AIエージェントは、エージェントスケジューラーを使い、AIモデルの選択や役割の割り当てを行います。また、会話管理ツールを通じて、人間のユーザーからの指示を受け取り、タスクを実行します。AIエージェント同士は、トークコマンドやアスクコマンドを用いて、会話をしながらタスクを進めます。
オートデブのパフォーマンスはどの程度評価されていますか?
-オートデブのパフォーマンスは、高い評価されています。ヒューマンイバルというベンチマークで、コード生成タスクに対して1つの回答を用意して、その回答が正しいかどうかをチェックしました。その結果、高い生徒率を示しており、コード生成だけでなくテストも生成でき、高い正確度でタスクをこなすことができています。
オートデブを使うことで、どのようなタスクを自動化できますか?
-オートデブを使うことで、コード生成、テストコード生成、リファクタリング、既存コードの改善点の調査、ドキュメンテーションの自動化、ソースコードのレビュー、不具合分析や修正、バージョン管理の自動化などが自動化できます。
オートデブが開発プロセスに与える影響はどのようなものですか?
-オートデブが開発プロセスに与える影響は、従来の作業の中でAIに置き換わる部分がどんどん増えることであり、自動化が進むことで生産性の向上やエラーの減少、品質の向上が期待できます。一方で、AIを管理する側のポジションも増え、エンジニアリングの専門知識がより必要になるでしょう。
Dockerとは何ですか?
-Dockerは、コンテナ技術を利用して、アプリケーションをパッケージ化し、異なる環境でも動かすることができる技術です。コンテナは、アプリケーションやその依存関係を含んだ、移植可能な実行環境を提供し、OSのバージョンやプラットフォームに依存しない実行が可能になります。
Dockerはどのようにオートデブに役立っていますか?
-Dockerは、オートデブで実際のAIの作業が行われる実行環境として使用されます。Dockerコンテナを使って、クローズドな環境で作業が行われ、セキュリティやプライバシーの問題をクリアにできるようになります。また、環境構築の手間を省き、柔軟な開発環境を提供することができます。
オートデブにおける「強調型AIエージェント」とは何を意味しますか?
-「強調型AIエージェント」とは、AIエージェントが互いに会話をしながらタスクを進め、タスクをこなす際に協力し合うことを意味します。AIエージェント同士が情報を共有し、フィードバックを求め合い、問題解決に向けて協力することで、より効率的かつ正確な開発プロセスを実現することができます。
オートデブが一般公開されたら、どのような変化が起こると思いますか?
-オートデブが一般公開された場合、開発プロセスの自動化が進み、生産性の向上や品質の向上が期待されます。また、AI技術を活用した新しいサービスや製品が登場し、エンジニアリングの分野がさらに発展する可能性があります。さらに、エンジニアリングスキルを持つ一般の人が増え、AIに関する知識や技術がより一般的になるでしょう。
現在のITエンジニアにおすすめのスキルは何ですか?
-現在のITエンジニアには、AI技術に関する知識やスキルが必要です。AIの学習と実践を通じて、自動化やデータ分析、機械学習などの分野に精通することが重要です。また、バージョン管理システムやコンテナ技術などの基礎的な知識も維持し、最新の技術動向に追随していくことが求められます。
Outlines
🤖 MicrosoftのAI開発フレームワーク「オートデブ」とは?
Microsoftが発表したAI開発フレームワーク「オートデブ」について説明します。このフレームワークは、エンジニア軍団を作ることで自動開発を可能にし、ITエンジニアの仕事が変わる可能性があるという内容です。また、この動画では個人の意見や感想も含まれていることをご留意ください。
📄 論文投稿サイト「arXiv」とオートデブの紹介
論文投稿サイト「arXiv」にMicrosoftが投稿した「オートデブ」の論文について説明します。この論文はAI駆動の自動開発フレームワークを提案しており、IT業界で注目されています。オートデブは自律型AIエージェントを用いて開発プロセスを自動化し、セキュリティやプライバシーの保護も可能としています。
🛠️ gitとDockerの技術とオートデブの関係
バージョン管理技術のgitとコンテナ技術のDockerについて説明し、オートデブがこれらの技術をどのように利用するかを解説します。gitはプログラムのバージョン管理を、Dockerはコンテナを用いてプログラムの実行環境を管理します。オートデブはこれらの技術を用いて、AIエージェントを効率的に管理し、セキュリティを確保しています。
🔧 オートデブの4つのツールとAIエージェントの役割
オートデブのフレームワークは4つのツールから成り立っています。AIエージェントスケジューラー、会話管理ツール、ツール群、実行環境です。AIエージェントはプロジェクトのゴールを達成するために役割が割り当てられ、会話を通じてタスクを進めます。このフレームワークはAIエージェント同士が協力してタスクを遂行できるように設計されています。
📈 オートデブのパフォーマンス評価とITエンジニアの未来
オートデブのパフォーマンスはHumanEvalというベンチマークで評価されており、高い正確度でタスクをこなすことが示されています。この技術の発展により、ITエンジニアの仕事は大きく変わることが予想されます。AIに置き換わる部分が増え、エンジニアリングスキルがより必要になる一方で、AIを管理する新たなポジションも増えることが予想されます。
🎥 まとめと今後の展望
オートデブはMicrosoftが発表した革新的なAI開発フレームワークで、複数のAIエージェントを管理し、自動開発を可能にします。この技術は既存のタスクに置き換わる可能性が高いと評価されており、ITエンジニアの仕事には新たなスキルが必要になるでしょう。今後、AIに関する知識を持ち、エンジニアリングスキルを活かした新たな技術者が増える時代が到来するでしょう。
Mindmap
Keywords
💡オートデブ (AutoDev)
💡AIエージェント
💡コンテナ技術 (Docker)
💡バージョン管理 (Git)
💡テスト自動化
💡プログラムのリファクタリング
💡ドキュメンテーション自動化
💡AIのコマンド
💡セキュリティ
💡プライバシー
💡エンジニアリングスキル
Highlights
Microsoftが発表したAIソフトウェアエンジニアの概要
オートデブの紹介
エンジニアのタスクが自動化される可能性
オートデブの論文投稿
アーカイブの説明
オートデブのAIエージェント
セキュリティやプライバシーの保護
ドッカーとgitの技術
AIエージェント同士のコラボレーション
オートデブのパフォーマンス
人間のITエンジニアの仕事の変化
AIの学習とエンジニアリングスキルの重要性
オートデブの公開期待
ドッカーコンテナの使用
AIのテストコード生成能力
AIのコードレビューと改善提案
AIのドキュメンテーション自動化
AIのバージョン管理自動化
AIの不具合分析と修正提案
Transcripts
[音楽]
富蔵ハチへようこそ今回はトレンド編で
Microsoftが発表したAI
エンジニア軍団を作る自動開発
フレームワークデブについて説明して
いこうと思いますこちらチャンネル共通の
告知事項です気になる方は一時停止して
ご覧くださいえ今回の内容ですがえデブと
いうですねま自動開発フレームワークこと
でまたエンジニアのタスクがですねま自動
化されていくという内容ですで最後の方は
また定番のですね人間のITエンジニアの
仕事今後どうなってくんでしょうという話
もしていこうと思いますえ今回の動画は今
まで以上に特にえ個人の意見感想を含み
ますのでご留意くださいそれでは参り
ましょうではまずオートデブの概要につい
て説明していこうと思いますえ先日私は
ですねこんな動画を投稿しましたえ中身
ですねえっと2024年の3月12日にえ
新しいAIデビが出ましたよとで何かって
言うとITエンジニアの実務が実際にでき
ちゃう世界初のAIソフトウェア
エンジニアですという話でしたねでこちら
の内容は結構反響が大きくてですね元々
海外でもバってましたしまブロン記事も
結構閲覧がすごい増えてですね私自身も
驚いてましたでこれからエンジの仕事も
色々また変わっていくなと思っていたん
ですが
えっとこれ系の話でさらに大きいのがまた
出てきたのでこちら紹介しようと思います
ことの発端はですねえっとまアーカイブと
いう論文投稿サイトがあってこちらに
Microsoftがえっとま測ってか
測らずか2020年3月13日まデビの
発表の翌日ですねこちらに投稿された論文
がえっとありましたタイトルはですね
オートデブオートメAIドリブン
デベロップメントてことでですね威すると
えデブAI駆動の自動開発と衝撃的な
タイトルで出ておりましたでこのなんたら
ドリブンデベロップメントまずこちらは
IT業界でよく使う単語でま何をトリガー
に何を起因に開発をしていくかすべきかっ
て時によく使われる言葉なんですけどもま
今回はAIドリブンデベロプメントAI
駆動開発となんと素敵な名前でしょうで
こちらに
オートメーティッドはい結構これに驚き
ましてまそもそもですねアーカイブ知ら
ない方もいると思うんで説明していこうと
思いますでアーカイブってえっとまあ
2000あ1990年ま91年頃にえ
始まったえ簡単に言うと無料で論文を投稿
閲覧できるウェブサイトですとま学術論文
ですねで学術論文のジャンルは色々あって
ま物理数学経済えまコンピューター
サイエンスえ金融電気工学電子工学ま色々
とあるんですけどもその学術論文をえ投稿
できるところでまPDFでえっと投稿が
できるしダウンロードもできると無料です
ねで特徴はですねさ前の論文を取り扱って
いるえサービスまプレプリントサーバーっ
て言んですけどもこのプレプリントサー
バーっていうものの先駆けですまプレ
プリントサーバーといえばアーカイブが
1番有名って感じですねはいで同じような
サービスは日本にもあってJ回部とかあと
海外でえっと生物系ならバイオアーカイブ
科学系ならケムアーカイブとか色々あるん
ですねでこのプレプリントってのは左前の
論文ですけどもさってそもそも何ですかっ
て話を一応しとくとえ学術論文を何か出版
しようと思った時にさというプロセスを
通るんですねでまえっと論文書人が執筆を
して実際にえっと出版したいよとなった時
にまその出版社のえっと編集とかがえっと
チェックをしてままずはえっと定Sとか
文書として成立してるかとかま色々と
チェックをしますとでそのチェックを通過
するとやっとサドというところに通って
サドはまその専門家とかその界隈の詳しい
人とかが色々とチェックをしてま審査する
ところですねでこのサドを見事通過すると
その学術師とかに乗るという感じなんです
けれどもまこのえサドのレベルはですね
出版社によって全然違うんですけども
例えば有名なサイエンスとかネイチャー
みたいな1の学術師だと砂のレベルは高
すぎてですねなかなか通らないま仮に内容
が合ってたとしてもそれがもう求める
レベルの驚けなもんじゃないと上げないよ
とかまそういうのがあったりするんですね
なのでそこはま出発によってバラバラです
なんですけど所得はそもそも時間がかかる
んですねえっと平均して数ヶ月長くて1年
以上かかったりもしますまつまり遅いん
ですよねなのでえっと発明とか発見って
いうのはま発表してから時間かっちゃうと
古くなっちゃうんでえまスピードが遅いと
いうところでえっとさ前の論文を早めに
公開できるスピーディな情報共有目的をし
たのがアーカイブですじゃあ砂通ってない
から信用ないかってことはそんなことは
なくてですねえ結構使われておりまして皆
さんご存知OpenAIとかまApple
GoogleMicrosoftもよく
このアーカイブを使っておりますしま
例えば数学のま難しい定理まポアンから
予想とかですねこういうの定理に対する
証明論文とかそういうのもまここに上がっ
たりするんですねなんか乗る前にでま結構
ここにもう乗せるのが定番になってきてい
てえまさく前に実際アーカイブで公表し
ちゃってでそこで専門家がああでもない
こうでもないと意見を出してきてそれを
参考に水行つまり修正をしてで本家の砂に
持っていくという流れがだんだん一般的に
なってきてるようですまあとはですね
メリットがあって左って遅いのでえ砂でま
あの遅いとですねチプ化するってもあるん
ですけれどもそもそも里の時にですね
アイデア盗まれるとかそういうのも実際
あったらしいんですよねなのでえっと
アーカイブ載せていつ誰がどんなことを
出したのかを明らかにするこれでまえっと
パクられたりとかするのを防ぐって意味で
アーカイブはよく利用されてるようです
ただえ砂じゃ通ってないから信用ない
かっていうとそんなことはなくてですね
一応所得前もちゃんとチェックはされてい
てままずその界隈の専門家がアーカイブ見
てますしあとはあの閲覧者がですねこの
内容おかしいっていうのを報する機能も
ありますであとは作の論文まサの論文が
実際おかしすぎた場合はリジェクトつまり
削除されたりすることもありますしえ登録
分野が間違ってれば直されますしあまりに
もアカウント含めひどかった場合はえっと
アカウントま停止ま赤板ですねとかもする
ことがあるようですはいなんでねえっと
アーカイブ結構使われているのでえこの
機会に是非アーカイブ見て興味があるある
方はえっと見てみて
くださいでこのアーカの論文は1個1個が
識別できるIDが振られていましてその
振られるルールも共有しますねえっと
ルールはですねアーカイブコ投稿の年月を
示す数字ド投稿数番号を示す数字そして
バージョンがつって書かれていますでこれ
に加えて登録分野とか投稿Bが補足される
ような感じですで今回の実際の
MicrosoftのえっとIDはこちら
ですねえっとアーカイブコロ2403これ
は2024年の3月の投稿ですとでド
0829これはえっと3月のえ投稿された
論文の中の
8299番目のアーカイブ論文ですと
すごい数が月刊で上がってますねでそれの
えっと第一般V1ですという意味ですねで
後ろの補足がえっとcsseつまり
コンピューターサイエンス分野の中のえ
ソフトウェアエンジニアリングの分野の
論文ですと実際投稿日はえ2020年の3
月13日というのが分かりますでこちらの
IDは実際にあの調べれば論文が見れます
ま概要欄にもね実際の論文のリンク貼って
おきますので是非興味ある方はご覧
くださいで論文見ますと中にですねえっと
ま投稿者の名前のところに全員皆さん立
この名前がえ下についてましてえ名前の下
にえ所属ですねMicrosoftLM
USAと書いてますでこれはえっと
Microsoftの本社の住所ですねえ
本社はえっとアメリカのワシントン州の
レドモンドにあるのでま本社の人はこう
やって書くんですねつまりえっとこの投稿
者はMicrosoft本社の人たちの
論文ですよということが分かりますで論文
のえっとインデックス目次がえっとこんな
感じで書かれてありましたま
アブストラクトから始まって最後結論まで
書いていて今回のオートデブの内容ですね
で今回はこの中身を全部詳細には威しませ
んがこの中身をえっとざっくりとえっとま
噛み砕いて分かるレベルにまとめてえ日本
語でえっとま意見も踏まえてえ説明して
いこうと思いますでまだこの動画制作時点
ではですねこの論文の内容説明してる日本
語の動画なかったんですよね1個もなので
今回多分初めてになると思うんで是非え
興味ある方は最後までご覧くださいでは
ですねえざっくりと説明するとですねまず
先に結論ですねえ今回の論文中身はえ
こんなことが書いてありますえ自立型の
AIエージェントを複数用意する自動開発
のフレームワークを提案しますとでその
フレームワークを使うとですねま
セキュリティやプライバシーの保護も
ちゃんと対策ができますよとでえしかも
えっとフレームワークってこの論文では
表現しててもっぽくないんですけどもま
ぶっちゃけですねもうテストを実際に実施
してえっと評価が何パーとかっていう風に
出してるんで多分なんかもがもうあるん
でしょうね開発中でおそらくそれをベース
に喋ってんだと思いますはいでこれを今回
まちょっとIT初心者向の人も踏まえて
ですねえ補足しながら説明していこうと
思い
ますえ今回の論文は非常にボリュームで
ですねだいぶ削ったんですけれどもそれで
も量が多いので少し長くなるかもしれませ
んがお付き合いくださいではまずオート
デブの特徴からまとめていきますえ冒頭の
アブストラクトイントロダクションまとめ
たらこんなことが書いておりましたえ自律
型AIエージェントによって完全に自動化
された開発フレームワークオートデブを
提案しますとで従来のAIエージェント
これ具体的な名前も出てましたねえgit
HUBコパイロットとかそういったものは
支援型であってえ自動化できる範囲も限定
的ですけれどもオーデブは開発プロセス
全体を自動化できますよとでオートデブは
全ての作業がま後で説明しますがコンテナ
に閉じられていてえ権限制御も可能なので
えセキュリティやプライバシーもちゃんと
確保できますよとですでにパフォーマンス
もテスト済みでえ素晴らしい評価があると
こちらも後で説明しますまこんなことは
書いてありますでえっと今回のえオーデの
オートデブの構造をえ図にしてるものが
ありましてそちらを書き直したのはこちら
ですねこんな感じになってましたでこれ
少し英語分かりづらいので日本語に威して
みましたま少しえ言葉の意味も変わっ
ちゃいますけどもこんな感じですでこの
説明する前にどうしても避けてれない専門
用が2個ありましてこちらを補足する必要
がありますそれがこのドッカーとギット
ですねでこの今回ですね2個説明するん
ですがすでにエンジニアで知ってる方は
飛ばしてもらっていいので補足と書いてる
チャプターを飛ばしてください知らない方
はご覧くださいではこのこちらのギットと
特化説明していこうと思いますえ先に
さらっと触れておきますとギットっていう
のはバージョン管理ができる技術です
そしてドッカーっていうのはコンテナって
ものが使える技術ですより詳しく説明して
いきますまずgitはですねえバージョ
ンってものを管理する技術です身近な例で
言うとですねえっとアプリにはバージョン
の数字がありますよねあとはスマホ自体に
もOSのバージョンの数字ありますで
ゲームにもバージョンがあってよくアプデ
したらえっと数字が上がってま新しい
ステージが増えるとかキャラが増えるとか
ありますねで紙の本とか電子書籍こちらも
バージョンがありましてま初犯とか第1般
第2半とかまそういったものがありますよ
ねま要は中身が変わったら上がっていく
数字みたいな感じですねでこのえ
バージョンはプログラムにもありましてま
プログラムが一定の規模を変わった場合は
バージョンをつけてそれを変えたりして
管理していきますでそのえっとバージョン
として目印を不要してえっと管理してます
よとまV1.とかそういうのがバージョン
ですねま今回のアーカイブでも一応例で
言うとあれもバージョンですえ識別史とし
てま与えられたIDに最後にV1とかV2
とかありますねあのもバージョンですで
バージョン管理の技術を使うと何がいい
かって言うとえっとバージョン管理の技術
を使った場合管理領域ってところがあって
その管理領域の中でえっとファイルを監視
して変更を見ていきますでもし技術が使わ
れていなかった場合普通にえっと
バージョン管理なしで運用しちゃうとま
右上みたいにですね似たようなファイルが
いっぱい出来上がって管理しづらくなり
ますまコピーコピーでどんどん作られてく
感じですねなんですけれどもちゃんと
バージョン管理技術を活用すると下のよう
にえすっきりと常に1個だけのファイルに
なりえそして変更の履歴とかがちゃんと
管理されていてえま綺麗になりますとで
この管理領域のところこれ名前がちゃんと
ついていましてえっとリポジトリーと言い
ますでリポジトリーという領域の中で
ファイルをいじることによってちゃんと
管理ができますよでこのリポジトリーって
いうのはま差分変更の利益を全部持ってい
ていつ誰がどのファイルをどんな風に何行
目を変えたかとかが全部記録されていて
履歴に残りますただし勝手に履歴に残る
わけじゃなくて自分が確定したタイミング
この時点の変更で保存しますみたいなこと
を宣言するとえ前の状態からその宣言状態
までの間で差分を管理するというような
仕組みになってますでまバージョン管理が
できるとですね例えばえっと古い
バージョンに1回戻そうとかちょっと
新しくしようとかができるようになります
まバージョン管理のえっと具体的なえま
商品名と言いますか有名なサービス名が
gitですとでまとめますとgitって
いうのはえっとバージョン管理つまり文章
やプログラムの中身の状態を管理できる
技術ですと何がどう変わったか誰が書いた
のかを記録できますでそれぞれの
バージョンに目印Vいくつとかがつけれ
ますとでえっとこれらの履歴のデータを
管理する場所をリポジトリーと言いますと
で過去の状態に戻したりとかできる
メリットがあります他人とも共有できるの
でチーム作業に向いてますでギットって
いうのはそのバージョン管理技術の中の1
個に過ぎませんで前回ですねデビの時に
あのまgitハブて説明しましたけども
gitHUBとGは一応違いましてえっと
gitハブっていうのはま前回説明で言う
とえプログラムの中身を他人と共有し
合えるIT業界定番のサービスと言いまし
たただこのgitハブっていうのはgit
の技術を利用しているウブサービスの1個
に過ぎませんま要はGって元々画面がない
のでえ仕組みだけなのでその仕組みを利用
して画面くっつけたやつがGハブって感じ
ですねはいまこれ以外にもGとか
バージョン管理詳しい説明はまた別の動画
作りますので気になる方は是非えっと
チャンネル登録お願いいたします次は
ドッカーですがドッカーっていうのは
えっとコンテナ仮想化またはコンテナて
ものを利用できる技術ですでコンティナっ
て何かって言うとちょっと難しい説明なの
で今回は超ざっくり言っちゃいますけどえ
ざっくり言うとMacとWindowsが
あったとした時にえMacで動く
プログラムこれは通常Windowsでは
動きませんなぜかというとOSが違うから
ですなんですけどえコンテナてもので
包み込んであげてこのコンテナって技術を
使うとですねなんとWindowsでも
Macのプログラムが動くんですねま要は
環境サを気にしなくても済むのがえっと
コンテナって技術ですでそのえコンテナを
利用できるようにするための中で有名な
ものがドッカーですドッカーを使うとこれ
ができるってことですねで別にOSの際
だけじゃなくてえ例えばですねえっとある
MacからRMacにえっとま
アプリケーションのソースコードとか移動
する時にですねえっと前のMACはえっと
バージョンがま新しくて次のMACは
たまたま古かったりとかする場合ですねえ
本来古いバージョンなら動かないはずの
ものがコンテに入れてあると動くんですよ
ねとかえっとPHPのえっと開発環境前の
マックは作ってたけども新しいMacは
まだPHPの環境を作ってないやとそう
いう場合でもえっとプログラムを
パッケージとしてコンテナーに閉じておけ
ば動くんですよねあとはえっとまそもそも
え開発環境構築が面倒な手順で結構色んな
手順を叩くのが面倒くさいでやっとそれが
終わって出来上がるこ環境っていうのが
あったとしたらその環境ごと体に
パッケージしてしまえばえ環境構築をする
ことなく出来上がった状態のものが渡せ
ますまこういった風な使い方もできるのが
えっとコンテナ技術ですじゃあ元々
パソコンにあるものとの関係はって言うと
えっとパソコンで元々動いてるプログラム
や元々あるファイルとかそういった
リソースとコンテナは切り離されますなの
でえっとコンテナで何が起きてるかって
いうのは元々のPC外側には影響しないん
ですねえコンテナはあくまでもホストの
PCまそのコンテナが動いているベースの
え下地のPCにとってはただの位置処理に
過ぎませんま要はですねコンテナっていう
のはえっと影響範囲が制御できてえ何もし
なければ外に影響は及ぼしませんしま設定
すれば影響はえっと変えられますが基本的
には切り離すことができるんですねえで
今回のオートデブっていうのはこの
コンテナ技術を使っていてそこでえ対応を
全部済ますからえセキュリティとかの問題
もちゃんと設定すればクリアできるよって
ことを言いたいわけですはいで今回のえ
説明したドッカーコンテナこちらも別の
動画で説明していきますので気になる方は
是非チャンネル登録をお願いいたしますで
は補足が終わりましたのでオートデブの
実際のえっとまフレームワークの中身を
説明していきますまずオートデブという
フレームワークは大きく4つのえツールで
成り立っていてえ右側説明していきますと
まずAIエージェントこちらはですね
エージェントスケジューラーなるえ仕組み
が用意されていてまAIモデルの選択
そしてどういう役割なのかっていうの
割り当てえこれをえっと管理し複数のAI
エージェントを作れるようになっています
で次に会話管理ツールですねこちらは全体
のまコントロール制御はもちろんのことえ
プロンプトで指示を出してタスクをやって
もらうとかあとはAIの状況を把握したり
とかAIからフィードバックを受けるとか
いろんなことができるまメインのユーザー
が使う領域ですねえ次にツール群これは
AIエージェントが利用するツールが揃っ
ていますよということですでまファイルを
いじったりえ開発をしたりテストをしたり
えなんか動かしたり検索したりバージョン
管理をするツールこれがえっとあるとで
これ英語の論文で気になったのがえ検索の
ところにですねリトリバルって書いてたん
ですねでリトリーバルてのはリトリブって
いう同士のま活用系ですけれどもえっと
サーチとの違いはサーチの方がまネットと
かも含むえ情報からえ情報を検索して
探し出すというニュアンスがあると思って
いてえリトリーブはですねすでにある情報
リソースの中からえ回収取得するという
ニュアンスがあると思っていますなので
もしかしたらですねえっとデビみたいに
Webブラウザー使ってオンライン上の
ものを探してきてとかやらないかもしれ
ません事前にこちらが用意する必要がある
かもしれませんただネットのオンラインも
できるかもしれませんこちらは今後要
チェックですねで次実行環境こちらは
えっとまちょっと置き換えちゃったんです
けどプログラムとログとでこちらは実際に
AIが行う全作業はこの中で行われますと
いうことですねでドッカーっていう
コンテナを使いますのでえクローズな環境
の中でセキアに作業が行われますよという
ことでしたでは実際にオートデブを使う際
の1つのサンプルというか事例というか
どういう流れで使うってのを説明して
いこうと思い
ますデブをまず使う時にはまず全体設定
から行いますこれ人間のユーザーがまず
えっとプロジェクトのゴールつまり何を
作りたいかとか何をして欲しいかっていう
のを先に決めるってことですね
えその次にルールズアクションズ
オブジェクティブコンフィギュレーション
を決めていきますまつまりえAI
エージェントに対して何ができるのかどこ
までできるのかどういう権限があるの
かっていう細かいところをコントロール
制御できますで次にえっと実際処理が行わ
れる実行環境とかシステム全体の中でえ
流れていく情報に対してま機密情報もれ
ちゃまずいものとかがあればそれが保護さ
れるような設定をする必要がありますで
こういった定義はですねえっとやる
ファイルで行われるようですヤルファイ
ルっていうのはまファイルの種類の1つで
えファイルの名前の後ろにドットなん
ちゃらってあると思うんですけどもこのド
なんちゃらがえっとヤるとかymlって
書いてやつがヤるファイルです他に人気の
やつはえっとドJSっていうJSON
ファイルがありますけれどもま要はえ設定
系でよく使われる人気のえファイル
ジャンルですで具体的には右側のように
書きますが要はコロン区切りで左側に
えっと何をえ対象に設定したいのか右側に
どういう値をま当てるのかっていう感じで
えキーとバリューを当てはめてえ管理し
ますでインデンと字下げを使って回送構造
を作れますまこんな感じでえっと設定系の
内容を定義することができるま人気の
ファイルこれがやるファイルですねで次に
えっとエージェントスケラーって
ものを使ってAIエージェントを管理でき
ますでこのえっとAIエージェント
スケジューラーで具体的には何のAI
モデルを使うのかをちゃんと選んでえその
AIエージェントには何をして欲しいの
かって役割を決めます例えばえっとテスト
をして欲しいレビューして欲しいえ行動を
書いて欲しいとかファイルを操作して
欲しいとかっていうのを自分が欲しい専門
家を用意する感じですねこれを複数作れ
ますまこれがAIエージェント軍団たる
遊園ですねで次にこのオートではですねえ
特有のえ機能を元々用意されていてですね
それがえトークコマンドアスクコマンド
ストップコマンドですこれは人間じゃなく
てAIが使うコマンドですで何かって言う
とトークコマンドはえっとAIが人間に
対して報告や進捗状況の共有とか情報共有
をするためのえコマンドですで次にアスク
コマンドこれもえ人間の有罪に対してAI
が相談してくるフィードバックを求めて
くるためのコマンドつまりこれからどうし
ますかとかこんな結果だけどどうすると
かっていうのをAIが聞くためのコマンド
が用意されてますで次にストップコマンド
これはタスクが終わったとかもしくは
エラーで止まったとかなんか止まる理由が
あった時にAIが投げてくるコマンドです
まこのコマンドがオートデブは初めから
用意されてるということでした次に全体
設定とAIスケジューリングが終わったら
いよいよタスクを実行してもらいますで
これは会話管理ツールを使って実際に指示
をしてくんですけれどもえっとAIが複数
いますのでこの会話管理ツールの中では
ですねなんと複数のAI同士が会話をして
いくんですね会話をしながら応答内容を
解析してタスクを進めていくとえただ
えっと会話終了条件を事前に設定すること
ができてまストップコマンドが何回行った
とかえどういう条件でストップしたとかま
色々とこう条件をつけてタスクが終わる
区切る条件とかを作ることができますえ次
にえっと元々の論文ではパーサーって書い
てあんですけどもま要は変換ツールですね
えパーサーを使ってえっとそれぞれの出力
内容っていうのをAIが解析してタスクを
するしないとかを判断していきますよとで
パースっていうのは簡単に言うとえ情報を
まAIエージェントが理解可能な状態に
えっとま活変換していって解析するって
いう感じですまイメージで言うとリンゴ2
つ買ってねっていうまテキストがあったら
えそのテキストをえっとまパースしてえ
同士は買う対象はリンゴ数は2だという風
に解析できますまこんな感じで文章を
ちゃんといい感じに変換できるものだと
思ってくださいでこのパースが適切なのか
どうかっていうのをちゃんとえっとAI
エジンとが理解して足りない情報があれば
足りてないとえ警告を出してくるし足りて
いれば次のフェーズにぎますちなみに
パースが終わったら次はですねえっと検証
した後え自分の権限はどこまであるのか
どこのコマンドが使えるのかっていうのを
確認して次のフェーズに移っていきます
えっと最後に出てたのが出力ツールですね
アウトプットオーガナイザーこれはえっと
ま単純にえ作業する実行環境からの結果を
受け取る場所とか何かしらのえっと出力を
する機能ですねこの出力ツールがあるから
ま我々の状況把握もできますしえAI同士
の会も成立するという感じですこれらの
ツールをを使ってタスクが進めていかいき
ますま今回の特徴はですねまえっと
コラボレティブって単語が論文でぱ出て
くるんですねコラボレ強調性というかま
コラボレーションですねなのでえっと今回
の特徴はコラボレエージェントま強調型
エアエージェントと私は名前をつけました
でこれはAIエージェント同士がえっと
会話をしていくまさにチーム開発を実現
するためのスキームかなと思っております
で最後に設定した内容で実際タスクを実行
してもらってその動くととがこの実行環境
ですとえ論文ではイバルインバイメントて
書いてますけども正確には
エバリュエーションインバイ実行環境です
ねでこちらの中で全ての処理が行われて
いきますこの中でアプリが動くしログが
あったらこちらに蓄積しますよってこと
ですねでえっとドッカーのコンテナの中で
動作しますのでえっとま他の処理とは
切り離して動きますなので適切に設定を
すればセキュリティも守られるし
プライバシーの方がも問題ないですよって
いうような感じのえ内容が書れておりまし
たで総合しますとオートデブの特徴って
いうのはえっと複数のAIエージェントを
管理して役割を与えられますよとでAI
エージェント同士が会話をしてタスクを
進めていきますえ全体の情報制御やaiの
権限等を設定しドッカーを利用するので
セキュリティも担保が可能ですとでえっと
AIが人間のユーザーにフィードバックを
求めてくるこれも特徴的でしたで開発
プロセス全体をそれを通して自動化でき
ますとま一言で言うと自分専用のAI
エンジニアチームを持つことができるそれ
がオートデブのすごいところてところです
ねはいでは肝心のパフォーマンスこちらも
説明していきましょうえオートテブの全体
のコンセプト基本方針とかま仕組みすご
そうなのは分かったと思うんですけれども
じゃ実力はどうなんですかて話ですねで
今回ですねえっとヒューマンイバルという
ものでえっと評価をしているみたいです
ちょっと毎回ねあのAI系は全く知らない
テスト方法とかが出てくるんで大変です
けれども今回はヒーマンイバルです
2021年にOpenAIが公開したもの
でえっとま大規模言語モデルllmの
えっとベンチマークをする中では標準的な
ものの1つらしいですでえっと164個の
Pythonのま問題集と回答集でえ初級
から上級まで難度カバーしていてま結構
使われているらしいですとこれはgit
HUBで公開してますので無料で入手が
可能ですでえっとこの中身を簡単に説明し
ますとえっとまずAIのモデルにある問題
を与えますとその問題を解くプログラム
コードを書いてもらいますとでその書いた
コードがえ稽古ま何個かあった場合その
えっと何かか書いたコードそれぞれを
テストしますでそのテストがちゃんと通る
か通らないかってところでえっと判断する
評価モデルらしいですでこれをPASS@
Kという指標でえっと判定していてええ何
個のコードを書けばどんぐらいの確率で
テストが通るらしいそういう性能です
みたいなことが分かるらしいですで今回は
このえっとオートデブっていうのがえっと
この問題を使ってえ今回は1個ですね
えっと1個のえ作ったソースコードこれが
どんだけ通りやすいかっていうのをえ
チェックしておりましたなんで今回は
PASS@1ですねえODデブがその問題
に対してたった1個の回答を用意してその
回答が合ってるか合ってないかみたいな
感じですねでそれがなんと生徒率が高かっ
たよという話ですで今回はそもそもえっと
アプリケーションの行動を作る問題として
もえパス1で991.5の評価を出してい
てえそれとは別でえテストを作ることも
できるようでま要は既存のえっとソース
コードプログラムに対してこういうテスト
をすべきでしょうというようなテストも
行ってそれも正当率がえっと一発で87.
%ま要するに一発合格の確率が高かっ
たってことですねなのでえっとコード生成
だけじゃなくてテストもえ生成できる
らしいですえつまり自分のえっとま
プログラムを読んでもらってじゃこういう
テストした方がいいねとかっていう理解
コンテキストの多分理解もできるん
でしょうねなんでえっと結果的には非常に
高い精度でタスクをこなすことができた
らしいことが書かれておりましたま要は
えっとコンテナでセキアにえ作業ができる
ししかも制度も悪くないよみたいな話です
ねでは最後定番ですがえ我々人間のIT
エンジニア今後仕事どうなるんでしょう
かっていう話をしていこうと思いますで
結論ですがえっと現役ITエンジニアの
観点も含めて個人的感想ですがやっぱり
従来に作業の中でAIに置き換わる部分
ってのはこれどんどん今後増えてくと思っ
ていますオートデブができることを考えた
時にですねこんなことできそうですね例え
ば単純にアプリを作らせるまコードの生成
ですねこれはできそうですとでテスト
コードが生成できるってことはテストの
自動化もできそうですテストコドかけ
るってことはえプログラムの背景
コンテキストが理解できるのでえつまり
リファクタリングとかですねえ既存コドの
改善点の調査とかこの辺がまできそう修正
とか改善もできそってことですねあとは
ドキュメンテーションの自動化まつまり
ですねよくIT現場であるこの現場えっと
プログラムはあるけれども詳細積書がない
とかねそういう現場結構あると思うしそれ
やってるエンジニアもいると思うんです
けどもまそれも任せられそうですね1番
結構厄介な作業でしたであとはですね
えっとソースコードのレビューこれもでき
そうですしあとはなんか不具合があった時
にどこがおかしいのなんで起きたのどう
直したら良さそうっていうのもえ任せ
られる可能性が出てきますあとは
バージョン管理できるんでギットのタスク
も自動化できそうな感じがしますま色々
想像が深りますけれどもえっと一方で
やっぱりですねえっとAIを管理する側
扱う側のポジションもやっぱり増えそうだ
なと思いましたえ特に今回のオードデブは
デフォルトでアクコマンドがありますよね
アスクコマンドじゃあそのアスクコマンド
でAIに聞かれますよとえ今こういう状況
でここまでやりましたどうしますかとか
こんなエラーがあったけどどうしますかっ
て言われた時に答えられますかて話ですね
はいあとはえっとコマンドや権限を適切に
付与すると石はに安全に使えますよって
言いましたけどもじゃそもそもコマンド
権限って分かってますかとどう使いますか
何がありますかって知ってますかみたいな
感じですねやるファイルかけますかとなの
でやっぱりエンジニアリングのスキルって
絶対に必要なんですよねでどちらかと言う
と今のエンジニアがどこっていうよりかは
エンジニアと呼べる技術者これがえっと
スキル持ってる人が増えるってイメージ
ですエンジニアは消えるんじゃなくって
エンジニアスキルを持ってる普通の人が
増えるみたいな感じですそれはもはや
エンジニアですねだってスキルあるんだ
からだしあやっぱりAIのことについて今
のエンジニアもっと勉強すべきだと思い
ましたね改めてえ例えばですねまえっとソ
とかgimとか経理の人でWord
Excel使えないってちょっと今厳しい
時代じゃないですかやっぱり時代によって
その技術が使えるのが当たり前えって時が
来ると思うんで今後はやっぱりエンジニア
もAIのことは多少触れて当たり前使えて
当たり前知ってて当然っていう風な時代が
来ると思うんでそれに備えてもやっぱり
エンジニアももう少しAIのことをえま
学習すべきですねえとにかくですねどっち
にしても個人的には早く一般公開して
欲しい触りたいですねはいていうのは感想
でしたではまとめですえ今回紹介したオー
debはですねMicrosoftが新た
に論文発表した自動開発フレームワーク
ですま気になる方はえっとこちらの論文
是非ご覧くださいでえっと複数のAI
エージェントを管理して自分だけのAI
エンジニアチームを持てるようなそんな
技術ですねまデビがいっぱいいるって感じ
ですねでえっと強調型のAIエージェント
がえ互いになんと会話をしながらですね
タスクをこなしていくというものですえ
ドッカーを利用することで適切な設定も
することでえっとセキュリティもえ安全性
もちゃんと担保ができそうですとでコド
生成やテスト生成といったところで高い
パフォーマンス評価を既に発揮している
みたいですで既存のタスクはやっぱりこう
いったAIに今後置き換わっていく可能性
が高いんじゃないかなと思ってます一方で
人間のユーザーはこういったものを扱う
ためのエンジニアリングの専門知識は今後
必要になってくると思いますで動画投稿日
現在はまだこの技術は一般公開はされてい
ませんはい今回の動画はこちらで終わり
です長い時間お付き合いありがとうござい
ましたえ今回の内容が面白かった参考に
なったら是非高評価をお願いいたします
また違う動画見てもいいかもと思った方は
是非チャンネル登録もよろしくお願いし
ますまた違う動画でお会いしましょうそれ
では
[音楽]
また
5.0 / 5 (0 votes)