AutoDev|マイクロソフトが発表した「AI エンジニア軍団」をつくる自動開発フレームワーク【Devin に驚いている場合じゃない!】
Summary
TLDRThe video script introduces 'AutoDev', an innovative AI-driven automated development framework developed by Microsoft. AutoDev is designed to streamline the software development process by utilizing multiple self-governing AI agents, which collaborate through conversation, enhancing the efficiency of the development workflow. The framework ensures security and privacy by encapsulating all operations within a controlled Docker container environment. Highlighting its capabilities, AutoDev has demonstrated impressive performance in code generation and test case creation, as evaluated by the HumanEval benchmark. The script also contemplates the future of human IT engineers, suggesting that while certain tasks may become automated, the demand for engineering expertise, particularly in managing and leveraging AI technologies, is likely to grow. The video concludes by expressing anticipation for the public release of such transformative AI frameworks.
Takeaways
- 🤖 Microsoft has introduced an AI-driven automated development framework called AutoDev, which is designed to automate the entire development process.
- 📈 AutoDev has been evaluated using the HumanEval benchmark and has demonstrated high performance in code generation and test creation.
- 🔒 The framework utilizes Docker containers to ensure secure and privacy-preserving development environments.
- 🤝 AutoDev emphasizes collaborative AI agents that communicate with each other to perform tasks, simulating a team of AI engineers.
- 📚 The system includes a conversation management tool for human users to interact with AI agents, providing instructions and receiving feedback.
- 🛠️ AutoDev comes with a set of tools for AI agents to perform various development tasks such as file manipulation, testing, and version control.
- 📝 YAML files are used for configuration, allowing users to define settings and rules for AI agents, including their capabilities and permissions.
- 🧐 AI agents in AutoDev use commands like Talk, Ask, and Stop to interact and manage tasks, with humans managing command and permission settings.
- 📉 The introduction of AutoDev suggests that certain IT engineering tasks may become increasingly automated, potentially reducing the need for human intervention in those areas.
- 🌐 The framework is built with an emphasis on security and privacy, allowing for controlled and safe AI operations within a defined environment.
- 🔍 AutoDev's approach to development with AI agents could lead to a future where human engineers work alongside AI, requiring a new set of engineering skills to manage AI effectively.
Q & A
What is the main topic of the video script?
-The main topic of the video script is the introduction and explanation of 'AutoDev', an AI-driven automated development framework announced by Microsoft.
What is AutoDev and what does it aim to achieve?
-AutoDev is an automated development framework that aims to automate the entire development process using multiple self-governing AI agents, ensuring security and privacy.
How does the AutoDev framework utilize Docker?
-AutoDev uses Docker to create a closed environment where all operations are conducted securely and independently, allowing for proper control over security and privacy.
What is the significance of the 'Ask', 'Talk', and 'Stop' commands in AutoDev?
-These commands are used by AI agents within the AutoDev framework for different purposes: 'Talk' for reporting and information sharing, 'Ask' for seeking feedback or consultation from humans, and 'Stop' to signal the end of a task or when an error occurs.
How does AutoDev ensure the security and privacy of the development process?
-AutoDev ensures security and privacy by conducting all operations within a Docker container, which isolates the development environment and allows for fine-grained control over access and permissions.
What is the role of Git in the context of AutoDev?
-Git is a version control system that is likely used within AutoDev to manage different versions of the code, track changes, and collaborate among AI agents or with human developers.
How does AutoDev facilitate the collaboration among AI agents?
-AutoDev facilitates collaboration among AI agents by allowing them to have conversations, share information, and work together to complete tasks, emulating a team development environment.
What kind of performance evaluation did AutoDev undergo?
-AutoDev underwent performance evaluation using the HumanEval benchmark, which tests the ability of AI models to solve a range of Python problems with varying difficulty levels.
What is the potential impact of AutoDev on the future of IT engineers' jobs?
-The potential impact of AutoDev on IT engineers' jobs could be significant, as it may automate many tasks that are currently performed by humans, requiring engineers to adapt their skills to manage and work alongside AI systems.
How does the presenter suggest IT engineers should prepare for the future with AI technologies like AutoDev?
-The presenter suggests that IT engineers should study and learn more about AI, as understanding and being able to work with AI technologies will become increasingly important in the future.
What is the current status of AutoDev in terms of public availability?
-As of the video script's knowledge cutoff date, AutoDev has not been publicly released and is still in the research and development phase.
Outlines
📖 Introduction to AutoDev Framework by Microsoft
The video introduces AutoDev, an automated development framework by Microsoft. It discusses the implications of AI-driven development and how it could potentially automate tasks currently performed by engineers. The video also mentions a paper posted on arXiv, which details the framework that allows for AI-driven development with a focus on security and privacy.
📄 The Role of arXiv in Academic and AI Development
The paragraph explains the significance of arXiv as a platform for sharing academic papers and how it's utilized by major tech companies like OpenAI, Apple, Google, and Microsoft. It highlights the credibility of arXiv despite not being a peer-reviewed journal and its role in preventing idea theft by providing a timestamped record of submissions.
🤖 Features and Structure of AutoDev
This section outlines the key features of AutoDev, including the use of multiple autonomous AI agents, security and privacy measures, and performance evaluations. It also provides a simplified explanation of the framework's structure, mentioning the use of Docker and Git, and emphasizes the framework's capability for fully automated development processes.
💼 Git and Docker: Essential Technologies for AutoDev
The video discusses two fundamental technologies for AutoDev: Git for version control and Docker for containerization. It explains how Git helps manage different versions of code and how Docker allows for the creation, deployment, and running of applications in isolated environments called containers, which is crucial for AutoDev's security and privacy features.
🔍 AutoDev's Toolset and Execution Environment
The paragraph delves into the specific tools within AutoDev, including an AI agent scheduler, conversation management tools, a suite of development tools, and an execution environment. It also introduces unique commands like Talk, Ask, and Stop, which facilitate interaction and control between AI agents and the system.
📈 Performance Evaluation of AutoDev
The video presents the performance evaluation of AutoDev, highlighting its high success rate in tasks such as code generation and test creation using the HumanEval benchmark. It emphasizes the framework's ability to understand and manipulate code contextually, suggesting that tasks traditionally performed by engineers may increasingly be automated.
🌟 The Future of Human IT Engineers in the Age of AI
The final paragraph contemplates the future role of human IT engineers as AI frameworks like AutoDev become more prevalent. It suggests that while certain engineering tasks may be automated, the need for engineering skills to manage and interact with AI systems will likely increase. The video concludes by expressing hope for the public release of AutoDev and the opportunity to explore its capabilities further.
Mindmap
Keywords
💡AutoDev (オートデブ)
💡AI Engineer Army
💡Containers (コンテナ)
💡Version Control (バージョン管理)
💡Docker (ドッカー)
💡Human IT Engineers
💡Git
💡GitHub
💡AI-Driven Development (AIドリブンデベロップメント)
💡Performance Evaluation
💡Collaborative AI Agents
Highlights
Microsoft has introduced an AI-driven automatic development framework called AutoDev (オートデブ)
AutoDev aims to automate the entire development process with AI agents, potentially transforming the role of human engineers
The framework allows for the creation of multiple autonomous AI agents, each with specific roles and capabilities
Security and privacy are integral parts of the AutoDev framework, ensuring safe development practices
AutoDev's performance has been tested and received high evaluation, showcasing its potential in practical applications
The framework utilizes Docker containers to encapsulate development tasks, enhancing security and control
AutoDev incorporates Git for version control, allowing for efficient management of code changes and collaboration
AI agents in AutoDev can communicate with each other, simulating a team of human engineers working together
The framework includes a conversation management tool for humans to interact with and direct AI agents
AutoDev uses a set of predefined commands (Talk, Ask, Stop) for AI agents to communicate and manage tasks
The framework has been evaluated using the HumanEval benchmark, demonstrating high accuracy in code generation
AutoDev's approach to development suggests that tasks traditionally performed by human engineers may increasingly be automated
The framework's design allows for the possibility of AI agents conducting code reviews and suggesting improvements
The role of human engineers may shift towards managing and directing AI agents, requiring new skill sets and knowledge
AutoDev represents a significant step towards integrating AI into software development, potentially reshaping the industry
The technology is not yet publicly available, but its implications for the future of engineering and development are profound
The video provides a comprehensive overview of AutoDev, including its theoretical foundations, practical applications, and potential impact on the IT industry
Transcripts
[音楽]
富蔵ハチへようこそ今回はトレンド編で
Microsoftが発表したAI
エンジニア軍団を作る自動開発
フレームワークデブについて説明して
いこうと思いますこちらチャンネル共通の
告知事項です気になる方は一時停止して
ご覧くださいえ今回の内容ですがえデブと
いうですねま自動開発フレームワークこと
でまたエンジニアのタスクがですねま自動
化されていくという内容ですで最後の方は
また定番のですね人間のITエンジニアの
仕事今後どうなってくんでしょうという話
もしていこうと思いますえ今回の動画は今
まで以上に特にえ個人の意見感想を含み
ますのでご留意くださいそれでは参り
ましょうではまずオートデブの概要につい
て説明していこうと思いますえ先日私は
ですねこんな動画を投稿しましたえ中身
ですねえっと2024年の3月12日にえ
新しいAIデビが出ましたよとで何かって
言うとITエンジニアの実務が実際にでき
ちゃう世界初のAIソフトウェア
エンジニアですという話でしたねでこちら
の内容は結構反響が大きくてですね元々
海外でもバってましたしまブロン記事も
結構閲覧がすごい増えてですね私自身も
驚いてましたでこれからエンジの仕事も
色々また変わっていくなと思っていたん
ですが
えっとこれ系の話でさらに大きいのがまた
出てきたのでこちら紹介しようと思います
ことの発端はですねえっとまアーカイブと
いう論文投稿サイトがあってこちらに
Microsoftがえっとま測ってか
測らずか2020年3月13日まデビの
発表の翌日ですねこちらに投稿された論文
がえっとありましたタイトルはですね
オートデブオートメAIドリブン
デベロップメントてことでですね威すると
えデブAI駆動の自動開発と衝撃的な
タイトルで出ておりましたでこのなんたら
ドリブンデベロップメントまずこちらは
IT業界でよく使う単語でま何をトリガー
に何を起因に開発をしていくかすべきかっ
て時によく使われる言葉なんですけどもま
今回はAIドリブンデベロプメントAI
駆動開発となんと素敵な名前でしょうで
こちらに
オートメーティッドはい結構これに驚き
ましてまそもそもですねアーカイブ知ら
ない方もいると思うんで説明していこうと
思いますでアーカイブってえっとまあ
2000あ1990年ま91年頃にえ
始まったえ簡単に言うと無料で論文を投稿
閲覧できるウェブサイトですとま学術論文
ですねで学術論文のジャンルは色々あって
ま物理数学経済えまコンピューター
サイエンスえ金融電気工学電子工学ま色々
とあるんですけどもその学術論文をえ投稿
できるところでまPDFでえっと投稿が
できるしダウンロードもできると無料です
ねで特徴はですねさ前の論文を取り扱って
いるえサービスまプレプリントサーバーっ
て言んですけどもこのプレプリントサー
バーっていうものの先駆けですまプレ
プリントサーバーといえばアーカイブが
1番有名って感じですねはいで同じような
サービスは日本にもあってJ回部とかあと
海外でえっと生物系ならバイオアーカイブ
科学系ならケムアーカイブとか色々あるん
ですねでこのプレプリントってのは左前の
論文ですけどもさってそもそも何ですかっ
て話を一応しとくとえ学術論文を何か出版
しようと思った時にさというプロセスを
通るんですねでまえっと論文書人が執筆を
して実際にえっと出版したいよとなった時
にまその出版社のえっと編集とかがえっと
チェックをしてままずはえっと定Sとか
文書として成立してるかとかま色々と
チェックをしますとでそのチェックを通過
するとやっとサドというところに通って
サドはまその専門家とかその界隈の詳しい
人とかが色々とチェックをしてま審査する
ところですねでこのサドを見事通過すると
その学術師とかに乗るという感じなんです
けれどもまこのえサドのレベルはですね
出版社によって全然違うんですけども
例えば有名なサイエンスとかネイチャー
みたいな1の学術師だと砂のレベルは高
すぎてですねなかなか通らないま仮に内容
が合ってたとしてもそれがもう求める
レベルの驚けなもんじゃないと上げないよ
とかまそういうのがあったりするんですね
なのでそこはま出発によってバラバラです
なんですけど所得はそもそも時間がかかる
んですねえっと平均して数ヶ月長くて1年
以上かかったりもしますまつまり遅いん
ですよねなのでえっと発明とか発見って
いうのはま発表してから時間かっちゃうと
古くなっちゃうんでえまスピードが遅いと
いうところでえっとさ前の論文を早めに
公開できるスピーディな情報共有目的をし
たのがアーカイブですじゃあ砂通ってない
から信用ないかってことはそんなことは
なくてですねえ結構使われておりまして皆
さんご存知OpenAIとかまApple
GoogleMicrosoftもよく
このアーカイブを使っておりますしま
例えば数学のま難しい定理まポアンから
予想とかですねこういうの定理に対する
証明論文とかそういうのもまここに上がっ
たりするんですねなんか乗る前にでま結構
ここにもう乗せるのが定番になってきてい
てえまさく前に実際アーカイブで公表し
ちゃってでそこで専門家がああでもない
こうでもないと意見を出してきてそれを
参考に水行つまり修正をしてで本家の砂に
持っていくという流れがだんだん一般的に
なってきてるようですまあとはですね
メリットがあって左って遅いのでえ砂でま
あの遅いとですねチプ化するってもあるん
ですけれどもそもそも里の時にですね
アイデア盗まれるとかそういうのも実際
あったらしいんですよねなのでえっと
アーカイブ載せていつ誰がどんなことを
出したのかを明らかにするこれでまえっと
パクられたりとかするのを防ぐって意味で
アーカイブはよく利用されてるようです
ただえ砂じゃ通ってないから信用ない
かっていうとそんなことはなくてですね
一応所得前もちゃんとチェックはされてい
てままずその界隈の専門家がアーカイブ見
てますしあとはあの閲覧者がですねこの
内容おかしいっていうのを報する機能も
ありますであとは作の論文まサの論文が
実際おかしすぎた場合はリジェクトつまり
削除されたりすることもありますしえ登録
分野が間違ってれば直されますしあまりに
もアカウント含めひどかった場合はえっと
アカウントま停止ま赤板ですねとかもする
ことがあるようですはいなんでねえっと
アーカイブ結構使われているのでえこの
機会に是非アーカイブ見て興味があるある
方はえっと見てみて
くださいでこのアーカの論文は1個1個が
識別できるIDが振られていましてその
振られるルールも共有しますねえっと
ルールはですねアーカイブコ投稿の年月を
示す数字ド投稿数番号を示す数字そして
バージョンがつって書かれていますでこれ
に加えて登録分野とか投稿Bが補足される
ような感じですで今回の実際の
MicrosoftのえっとIDはこちら
ですねえっとアーカイブコロ2403これ
は2024年の3月の投稿ですとでド
0829これはえっと3月のえ投稿された
論文の中の
8299番目のアーカイブ論文ですと
すごい数が月刊で上がってますねでそれの
えっと第一般V1ですという意味ですねで
後ろの補足がえっとcsseつまり
コンピューターサイエンス分野の中のえ
ソフトウェアエンジニアリングの分野の
論文ですと実際投稿日はえ2020年の3
月13日というのが分かりますでこちらの
IDは実際にあの調べれば論文が見れます
ま概要欄にもね実際の論文のリンク貼って
おきますので是非興味ある方はご覧
くださいで論文見ますと中にですねえっと
ま投稿者の名前のところに全員皆さん立
この名前がえ下についてましてえ名前の下
にえ所属ですねMicrosoftLM
USAと書いてますでこれはえっと
Microsoftの本社の住所ですねえ
本社はえっとアメリカのワシントン州の
レドモンドにあるのでま本社の人はこう
やって書くんですねつまりえっとこの投稿
者はMicrosoft本社の人たちの
論文ですよということが分かりますで論文
のえっとインデックス目次がえっとこんな
感じで書かれてありましたま
アブストラクトから始まって最後結論まで
書いていて今回のオートデブの内容ですね
で今回はこの中身を全部詳細には威しませ
んがこの中身をえっとざっくりとえっとま
噛み砕いて分かるレベルにまとめてえ日本
語でえっとま意見も踏まえてえ説明して
いこうと思いますでまだこの動画制作時点
ではですねこの論文の内容説明してる日本
語の動画なかったんですよね1個もなので
今回多分初めてになると思うんで是非え
興味ある方は最後までご覧くださいでは
ですねえざっくりと説明するとですねまず
先に結論ですねえ今回の論文中身はえ
こんなことが書いてありますえ自立型の
AIエージェントを複数用意する自動開発
のフレームワークを提案しますとでその
フレームワークを使うとですねま
セキュリティやプライバシーの保護も
ちゃんと対策ができますよとでえしかも
えっとフレームワークってこの論文では
表現しててもっぽくないんですけどもま
ぶっちゃけですねもうテストを実際に実施
してえっと評価が何パーとかっていう風に
出してるんで多分なんかもがもうあるん
でしょうね開発中でおそらくそれをベース
に喋ってんだと思いますはいでこれを今回
まちょっとIT初心者向の人も踏まえて
ですねえ補足しながら説明していこうと
思い
ますえ今回の論文は非常にボリュームで
ですねだいぶ削ったんですけれどもそれで
も量が多いので少し長くなるかもしれませ
んがお付き合いくださいではまずオート
デブの特徴からまとめていきますえ冒頭の
アブストラクトイントロダクションまとめ
たらこんなことが書いておりましたえ自律
型AIエージェントによって完全に自動化
された開発フレームワークオートデブを
提案しますとで従来のAIエージェント
これ具体的な名前も出てましたねえgit
HUBコパイロットとかそういったものは
支援型であってえ自動化できる範囲も限定
的ですけれどもオーデブは開発プロセス
全体を自動化できますよとでオートデブは
全ての作業がま後で説明しますがコンテナ
に閉じられていてえ権限制御も可能なので
えセキュリティやプライバシーもちゃんと
確保できますよとですでにパフォーマンス
もテスト済みでえ素晴らしい評価があると
こちらも後で説明しますまこんなことは
書いてありますでえっと今回のえオーデの
オートデブの構造をえ図にしてるものが
ありましてそちらを書き直したのはこちら
ですねこんな感じになってましたでこれ
少し英語分かりづらいので日本語に威して
みましたま少しえ言葉の意味も変わっ
ちゃいますけどもこんな感じですでこの
説明する前にどうしても避けてれない専門
用が2個ありましてこちらを補足する必要
がありますそれがこのドッカーとギット
ですねでこの今回ですね2個説明するん
ですがすでにエンジニアで知ってる方は
飛ばしてもらっていいので補足と書いてる
チャプターを飛ばしてください知らない方
はご覧くださいではこのこちらのギットと
特化説明していこうと思いますえ先に
さらっと触れておきますとギットっていう
のはバージョン管理ができる技術です
そしてドッカーっていうのはコンテナって
ものが使える技術ですより詳しく説明して
いきますまずgitはですねえバージョ
ンってものを管理する技術です身近な例で
言うとですねえっとアプリにはバージョン
の数字がありますよねあとはスマホ自体に
もOSのバージョンの数字ありますで
ゲームにもバージョンがあってよくアプデ
したらえっと数字が上がってま新しい
ステージが増えるとかキャラが増えるとか
ありますねで紙の本とか電子書籍こちらも
バージョンがありましてま初犯とか第1般
第2半とかまそういったものがありますよ
ねま要は中身が変わったら上がっていく
数字みたいな感じですねでこのえ
バージョンはプログラムにもありましてま
プログラムが一定の規模を変わった場合は
バージョンをつけてそれを変えたりして
管理していきますでそのえっとバージョン
として目印を不要してえっと管理してます
よとまV1.とかそういうのがバージョン
ですねま今回のアーカイブでも一応例で
言うとあれもバージョンですえ識別史とし
てま与えられたIDに最後にV1とかV2
とかありますねあのもバージョンですで
バージョン管理の技術を使うと何がいい
かって言うとえっとバージョン管理の技術
を使った場合管理領域ってところがあって
その管理領域の中でえっとファイルを監視
して変更を見ていきますでもし技術が使わ
れていなかった場合普通にえっと
バージョン管理なしで運用しちゃうとま
右上みたいにですね似たようなファイルが
いっぱい出来上がって管理しづらくなり
ますまコピーコピーでどんどん作られてく
感じですねなんですけれどもちゃんと
バージョン管理技術を活用すると下のよう
にえすっきりと常に1個だけのファイルに
なりえそして変更の履歴とかがちゃんと
管理されていてえま綺麗になりますとで
この管理領域のところこれ名前がちゃんと
ついていましてえっとリポジトリーと言い
ますでリポジトリーという領域の中で
ファイルをいじることによってちゃんと
管理ができますよでこのリポジトリーって
いうのはま差分変更の利益を全部持ってい
ていつ誰がどのファイルをどんな風に何行
目を変えたかとかが全部記録されていて
履歴に残りますただし勝手に履歴に残る
わけじゃなくて自分が確定したタイミング
この時点の変更で保存しますみたいなこと
を宣言するとえ前の状態からその宣言状態
までの間で差分を管理するというような
仕組みになってますでまバージョン管理が
できるとですね例えばえっと古い
バージョンに1回戻そうとかちょっと
新しくしようとかができるようになります
まバージョン管理のえっと具体的なえま
商品名と言いますか有名なサービス名が
gitですとでまとめますとgitって
いうのはえっとバージョン管理つまり文章
やプログラムの中身の状態を管理できる
技術ですと何がどう変わったか誰が書いた
のかを記録できますでそれぞれの
バージョンに目印Vいくつとかがつけれ
ますとでえっとこれらの履歴のデータを
管理する場所をリポジトリーと言いますと
で過去の状態に戻したりとかできる
メリットがあります他人とも共有できるの
でチーム作業に向いてますでギットって
いうのはそのバージョン管理技術の中の1
個に過ぎませんで前回ですねデビの時に
あのまgitハブて説明しましたけども
gitHUBとGは一応違いましてえっと
gitハブっていうのはま前回説明で言う
とえプログラムの中身を他人と共有し
合えるIT業界定番のサービスと言いまし
たただこのgitハブっていうのはgit
の技術を利用しているウブサービスの1個
に過ぎませんま要はGって元々画面がない
のでえ仕組みだけなのでその仕組みを利用
して画面くっつけたやつがGハブって感じ
ですねはいまこれ以外にもGとか
バージョン管理詳しい説明はまた別の動画
作りますので気になる方は是非えっと
チャンネル登録お願いいたします次は
ドッカーですがドッカーっていうのは
えっとコンテナ仮想化またはコンテナて
ものを利用できる技術ですでコンティナっ
て何かって言うとちょっと難しい説明なの
で今回は超ざっくり言っちゃいますけどえ
ざっくり言うとMacとWindowsが
あったとした時にえMacで動く
プログラムこれは通常Windowsでは
動きませんなぜかというとOSが違うから
ですなんですけどえコンテナてもので
包み込んであげてこのコンテナって技術を
使うとですねなんとWindowsでも
Macのプログラムが動くんですねま要は
環境サを気にしなくても済むのがえっと
コンテナって技術ですでそのえコンテナを
利用できるようにするための中で有名な
ものがドッカーですドッカーを使うとこれ
ができるってことですねで別にOSの際
だけじゃなくてえ例えばですねえっとある
MacからRMacにえっとま
アプリケーションのソースコードとか移動
する時にですねえっと前のMACはえっと
バージョンがま新しくて次のMACは
たまたま古かったりとかする場合ですねえ
本来古いバージョンなら動かないはずの
ものがコンテに入れてあると動くんですよ
ねとかえっとPHPのえっと開発環境前の
マックは作ってたけども新しいMacは
まだPHPの環境を作ってないやとそう
いう場合でもえっとプログラムを
パッケージとしてコンテナーに閉じておけ
ば動くんですよねあとはえっとまそもそも
え開発環境構築が面倒な手順で結構色んな
手順を叩くのが面倒くさいでやっとそれが
終わって出来上がるこ環境っていうのが
あったとしたらその環境ごと体に
パッケージしてしまえばえ環境構築をする
ことなく出来上がった状態のものが渡せ
ますまこういった風な使い方もできるのが
えっとコンテナ技術ですじゃあ元々
パソコンにあるものとの関係はって言うと
えっとパソコンで元々動いてるプログラム
や元々あるファイルとかそういった
リソースとコンテナは切り離されますなの
でえっとコンテナで何が起きてるかって
いうのは元々のPC外側には影響しないん
ですねえコンテナはあくまでもホストの
PCまそのコンテナが動いているベースの
え下地のPCにとってはただの位置処理に
過ぎませんま要はですねコンテナっていう
のはえっと影響範囲が制御できてえ何もし
なければ外に影響は及ぼしませんしま設定
すれば影響はえっと変えられますが基本的
には切り離すことができるんですねえで
今回のオートデブっていうのはこの
コンテナ技術を使っていてそこでえ対応を
全部済ますからえセキュリティとかの問題
もちゃんと設定すればクリアできるよって
ことを言いたいわけですはいで今回のえ
説明したドッカーコンテナこちらも別の
動画で説明していきますので気になる方は
是非チャンネル登録をお願いいたしますで
は補足が終わりましたのでオートデブの
実際のえっとまフレームワークの中身を
説明していきますまずオートデブという
フレームワークは大きく4つのえツールで
成り立っていてえ右側説明していきますと
まずAIエージェントこちらはですね
エージェントスケジューラーなるえ仕組み
が用意されていてまAIモデルの選択
そしてどういう役割なのかっていうの
割り当てえこれをえっと管理し複数のAI
エージェントを作れるようになっています
で次に会話管理ツールですねこちらは全体
のまコントロール制御はもちろんのことえ
プロンプトで指示を出してタスクをやって
もらうとかあとはAIの状況を把握したり
とかAIからフィードバックを受けるとか
いろんなことができるまメインのユーザー
が使う領域ですねえ次にツール群これは
AIエージェントが利用するツールが揃っ
ていますよということですでまファイルを
いじったりえ開発をしたりテストをしたり
えなんか動かしたり検索したりバージョン
管理をするツールこれがえっとあるとで
これ英語の論文で気になったのがえ検索の
ところにですねリトリバルって書いてたん
ですねでリトリーバルてのはリトリブって
いう同士のま活用系ですけれどもえっと
サーチとの違いはサーチの方がまネットと
かも含むえ情報からえ情報を検索して
探し出すというニュアンスがあると思って
いてえリトリーブはですねすでにある情報
リソースの中からえ回収取得するという
ニュアンスがあると思っていますなので
もしかしたらですねえっとデビみたいに
Webブラウザー使ってオンライン上の
ものを探してきてとかやらないかもしれ
ません事前にこちらが用意する必要がある
かもしれませんただネットのオンラインも
できるかもしれませんこちらは今後要
チェックですねで次実行環境こちらは
えっとまちょっと置き換えちゃったんです
けどプログラムとログとでこちらは実際に
AIが行う全作業はこの中で行われますと
いうことですねでドッカーっていう
コンテナを使いますのでえクローズな環境
の中でセキアに作業が行われますよという
ことでしたでは実際にオートデブを使う際
の1つのサンプルというか事例というか
どういう流れで使うってのを説明して
いこうと思い
ますデブをまず使う時にはまず全体設定
から行いますこれ人間のユーザーがまず
えっとプロジェクトのゴールつまり何を
作りたいかとか何をして欲しいかっていう
のを先に決めるってことですね
えその次にルールズアクションズ
オブジェクティブコンフィギュレーション
を決めていきますまつまりえAI
エージェントに対して何ができるのかどこ
までできるのかどういう権限があるの
かっていう細かいところをコントロール
制御できますで次にえっと実際処理が行わ
れる実行環境とかシステム全体の中でえ
流れていく情報に対してま機密情報もれ
ちゃまずいものとかがあればそれが保護さ
れるような設定をする必要がありますで
こういった定義はですねえっとやる
ファイルで行われるようですヤルファイ
ルっていうのはまファイルの種類の1つで
えファイルの名前の後ろにドットなん
ちゃらってあると思うんですけどもこのド
なんちゃらがえっとヤるとかymlって
書いてやつがヤるファイルです他に人気の
やつはえっとドJSっていうJSON
ファイルがありますけれどもま要はえ設定
系でよく使われる人気のえファイル
ジャンルですで具体的には右側のように
書きますが要はコロン区切りで左側に
えっと何をえ対象に設定したいのか右側に
どういう値をま当てるのかっていう感じで
えキーとバリューを当てはめてえ管理し
ますでインデンと字下げを使って回送構造
を作れますまこんな感じでえっと設定系の
内容を定義することができるま人気の
ファイルこれがやるファイルですねで次に
えっとエージェントスケラーって
ものを使ってAIエージェントを管理でき
ますでこのえっとAIエージェント
スケジューラーで具体的には何のAI
モデルを使うのかをちゃんと選んでえその
AIエージェントには何をして欲しいの
かって役割を決めます例えばえっとテスト
をして欲しいレビューして欲しいえ行動を
書いて欲しいとかファイルを操作して
欲しいとかっていうのを自分が欲しい専門
家を用意する感じですねこれを複数作れ
ますまこれがAIエージェント軍団たる
遊園ですねで次にこのオートではですねえ
特有のえ機能を元々用意されていてですね
それがえトークコマンドアスクコマンド
ストップコマンドですこれは人間じゃなく
てAIが使うコマンドですで何かって言う
とトークコマンドはえっとAIが人間に
対して報告や進捗状況の共有とか情報共有
をするためのえコマンドですで次にアスク
コマンドこれもえ人間の有罪に対してAI
が相談してくるフィードバックを求めて
くるためのコマンドつまりこれからどうし
ますかとかこんな結果だけどどうすると
かっていうのをAIが聞くためのコマンド
が用意されてますで次にストップコマンド
これはタスクが終わったとかもしくは
エラーで止まったとかなんか止まる理由が
あった時にAIが投げてくるコマンドです
まこのコマンドがオートデブは初めから
用意されてるということでした次に全体
設定とAIスケジューリングが終わったら
いよいよタスクを実行してもらいますで
これは会話管理ツールを使って実際に指示
をしてくんですけれどもえっとAIが複数
いますのでこの会話管理ツールの中では
ですねなんと複数のAI同士が会話をして
いくんですね会話をしながら応答内容を
解析してタスクを進めていくとえただ
えっと会話終了条件を事前に設定すること
ができてまストップコマンドが何回行った
とかえどういう条件でストップしたとかま
色々とこう条件をつけてタスクが終わる
区切る条件とかを作ることができますえ次
にえっと元々の論文ではパーサーって書い
てあんですけどもま要は変換ツールですね
えパーサーを使ってえっとそれぞれの出力
内容っていうのをAIが解析してタスクを
するしないとかを判断していきますよとで
パースっていうのは簡単に言うとえ情報を
まAIエージェントが理解可能な状態に
えっとま活変換していって解析するって
いう感じですまイメージで言うとリンゴ2
つ買ってねっていうまテキストがあったら
えそのテキストをえっとまパースしてえ
同士は買う対象はリンゴ数は2だという風
に解析できますまこんな感じで文章を
ちゃんといい感じに変換できるものだと
思ってくださいでこのパースが適切なのか
どうかっていうのをちゃんとえっとAI
エジンとが理解して足りない情報があれば
足りてないとえ警告を出してくるし足りて
いれば次のフェーズにぎますちなみに
パースが終わったら次はですねえっと検証
した後え自分の権限はどこまであるのか
どこのコマンドが使えるのかっていうのを
確認して次のフェーズに移っていきます
えっと最後に出てたのが出力ツールですね
アウトプットオーガナイザーこれはえっと
ま単純にえ作業する実行環境からの結果を
受け取る場所とか何かしらのえっと出力を
する機能ですねこの出力ツールがあるから
ま我々の状況把握もできますしえAI同士
の会も成立するという感じですこれらの
ツールをを使ってタスクが進めていかいき
ますま今回の特徴はですねまえっと
コラボレティブって単語が論文でぱ出て
くるんですねコラボレ強調性というかま
コラボレーションですねなのでえっと今回
の特徴はコラボレエージェントま強調型
エアエージェントと私は名前をつけました
でこれはAIエージェント同士がえっと
会話をしていくまさにチーム開発を実現
するためのスキームかなと思っております
で最後に設定した内容で実際タスクを実行
してもらってその動くととがこの実行環境
ですとえ論文ではイバルインバイメントて
書いてますけども正確には
エバリュエーションインバイ実行環境です
ねでこちらの中で全ての処理が行われて
いきますこの中でアプリが動くしログが
あったらこちらに蓄積しますよってこと
ですねでえっとドッカーのコンテナの中で
動作しますのでえっとま他の処理とは
切り離して動きますなので適切に設定を
すればセキュリティも守られるし
プライバシーの方がも問題ないですよって
いうような感じのえ内容が書れておりまし
たで総合しますとオートデブの特徴って
いうのはえっと複数のAIエージェントを
管理して役割を与えられますよとでAI
エージェント同士が会話をしてタスクを
進めていきますえ全体の情報制御やaiの
権限等を設定しドッカーを利用するので
セキュリティも担保が可能ですとでえっと
AIが人間のユーザーにフィードバックを
求めてくるこれも特徴的でしたで開発
プロセス全体をそれを通して自動化でき
ますとま一言で言うと自分専用のAI
エンジニアチームを持つことができるそれ
がオートデブのすごいところてところです
ねはいでは肝心のパフォーマンスこちらも
説明していきましょうえオートテブの全体
のコンセプト基本方針とかま仕組みすご
そうなのは分かったと思うんですけれども
じゃ実力はどうなんですかて話ですねで
今回ですねえっとヒューマンイバルという
ものでえっと評価をしているみたいです
ちょっと毎回ねあのAI系は全く知らない
テスト方法とかが出てくるんで大変です
けれども今回はヒーマンイバルです
2021年にOpenAIが公開したもの
でえっとま大規模言語モデルllmの
えっとベンチマークをする中では標準的な
ものの1つらしいですでえっと164個の
Pythonのま問題集と回答集でえ初級
から上級まで難度カバーしていてま結構
使われているらしいですとこれはgit
HUBで公開してますので無料で入手が
可能ですでえっとこの中身を簡単に説明し
ますとえっとまずAIのモデルにある問題
を与えますとその問題を解くプログラム
コードを書いてもらいますとでその書いた
コードがえ稽古ま何個かあった場合その
えっと何かか書いたコードそれぞれを
テストしますでそのテストがちゃんと通る
か通らないかってところでえっと判断する
評価モデルらしいですでこれをPASS@
Kという指標でえっと判定していてええ何
個のコードを書けばどんぐらいの確率で
テストが通るらしいそういう性能です
みたいなことが分かるらしいですで今回は
このえっとオートデブっていうのがえっと
この問題を使ってえ今回は1個ですね
えっと1個のえ作ったソースコードこれが
どんだけ通りやすいかっていうのをえ
チェックしておりましたなんで今回は
PASS@1ですねえODデブがその問題
に対してたった1個の回答を用意してその
回答が合ってるか合ってないかみたいな
感じですねでそれがなんと生徒率が高かっ
たよという話ですで今回はそもそもえっと
アプリケーションの行動を作る問題として
もえパス1で991.5の評価を出してい
てえそれとは別でえテストを作ることも
できるようでま要は既存のえっとソース
コードプログラムに対してこういうテスト
をすべきでしょうというようなテストも
行ってそれも正当率がえっと一発で87.
%ま要するに一発合格の確率が高かっ
たってことですねなのでえっとコード生成
だけじゃなくてテストもえ生成できる
らしいですえつまり自分のえっとま
プログラムを読んでもらってじゃこういう
テストした方がいいねとかっていう理解
コンテキストの多分理解もできるん
でしょうねなんでえっと結果的には非常に
高い精度でタスクをこなすことができた
らしいことが書かれておりましたま要は
えっとコンテナでセキアにえ作業ができる
ししかも制度も悪くないよみたいな話です
ねでは最後定番ですがえ我々人間のIT
エンジニア今後仕事どうなるんでしょう
かっていう話をしていこうと思いますで
結論ですがえっと現役ITエンジニアの
観点も含めて個人的感想ですがやっぱり
従来に作業の中でAIに置き換わる部分
ってのはこれどんどん今後増えてくと思っ
ていますオートデブができることを考えた
時にですねこんなことできそうですね例え
ば単純にアプリを作らせるまコードの生成
ですねこれはできそうですとでテスト
コードが生成できるってことはテストの
自動化もできそうですテストコドかけ
るってことはえプログラムの背景
コンテキストが理解できるのでえつまり
リファクタリングとかですねえ既存コドの
改善点の調査とかこの辺がまできそう修正
とか改善もできそってことですねあとは
ドキュメンテーションの自動化まつまり
ですねよくIT現場であるこの現場えっと
プログラムはあるけれども詳細積書がない
とかねそういう現場結構あると思うしそれ
やってるエンジニアもいると思うんです
けどもまそれも任せられそうですね1番
結構厄介な作業でしたであとはですね
えっとソースコードのレビューこれもでき
そうですしあとはなんか不具合があった時
にどこがおかしいのなんで起きたのどう
直したら良さそうっていうのもえ任せ
られる可能性が出てきますあとは
バージョン管理できるんでギットのタスク
も自動化できそうな感じがしますま色々
想像が深りますけれどもえっと一方で
やっぱりですねえっとAIを管理する側
扱う側のポジションもやっぱり増えそうだ
なと思いましたえ特に今回のオードデブは
デフォルトでアクコマンドがありますよね
アスクコマンドじゃあそのアスクコマンド
でAIに聞かれますよとえ今こういう状況
でここまでやりましたどうしますかとか
こんなエラーがあったけどどうしますかっ
て言われた時に答えられますかて話ですね
はいあとはえっとコマンドや権限を適切に
付与すると石はに安全に使えますよって
言いましたけどもじゃそもそもコマンド
権限って分かってますかとどう使いますか
何がありますかって知ってますかみたいな
感じですねやるファイルかけますかとなの
でやっぱりエンジニアリングのスキルって
絶対に必要なんですよねでどちらかと言う
と今のエンジニアがどこっていうよりかは
エンジニアと呼べる技術者これがえっと
スキル持ってる人が増えるってイメージ
ですエンジニアは消えるんじゃなくって
エンジニアスキルを持ってる普通の人が
増えるみたいな感じですそれはもはや
エンジニアですねだってスキルあるんだ
からだしあやっぱりAIのことについて今
のエンジニアもっと勉強すべきだと思い
ましたね改めてえ例えばですねまえっとソ
とかgimとか経理の人でWord
Excel使えないってちょっと今厳しい
時代じゃないですかやっぱり時代によって
その技術が使えるのが当たり前えって時が
来ると思うんで今後はやっぱりエンジニア
もAIのことは多少触れて当たり前使えて
当たり前知ってて当然っていう風な時代が
来ると思うんでそれに備えてもやっぱり
エンジニアももう少しAIのことをえま
学習すべきですねえとにかくですねどっち
にしても個人的には早く一般公開して
欲しい触りたいですねはいていうのは感想
でしたではまとめですえ今回紹介したオー
debはですねMicrosoftが新た
に論文発表した自動開発フレームワーク
ですま気になる方はえっとこちらの論文
是非ご覧くださいでえっと複数のAI
エージェントを管理して自分だけのAI
エンジニアチームを持てるようなそんな
技術ですねまデビがいっぱいいるって感じ
ですねでえっと強調型のAIエージェント
がえ互いになんと会話をしながらですね
タスクをこなしていくというものですえ
ドッカーを利用することで適切な設定も
することでえっとセキュリティもえ安全性
もちゃんと担保ができそうですとでコド
生成やテスト生成といったところで高い
パフォーマンス評価を既に発揮している
みたいですで既存のタスクはやっぱりこう
いったAIに今後置き換わっていく可能性
が高いんじゃないかなと思ってます一方で
人間のユーザーはこういったものを扱う
ためのエンジニアリングの専門知識は今後
必要になってくると思いますで動画投稿日
現在はまだこの技術は一般公開はされてい
ませんはい今回の動画はこちらで終わり
です長い時間お付き合いありがとうござい
ましたえ今回の内容が面白かった参考に
なったら是非高評価をお願いいたします
また違う動画見てもいいかもと思った方は
是非チャンネル登録もよろしくお願いし
ますまた違う動画でお会いしましょうそれ
では
[音楽]
また
Browse More Related Video
Devin 게섯거라-! LG CNS가 만든 AI 개발자! || DevOn AIDE 소개
Software Engineers and IT Leaders are Dead Wrong about AI
Microsoft AutoDev is Here! Fully Autonomous SOFTWARE DEVELOPERS
Is Prompt Engineering the NEW Software Engineering?
MoA BEATS GPT4o With Open-Source Models!! (With Code!)
Como criar um exército de agentes para a sua empresa com IA
5.0 / 5 (0 votes)