AutoDev|マイクロソフトが発表した「AI エンジニア軍団」をつくる自動開発フレームワーク【Devin に驚いている場合じゃない!】

とみぞー HackTube
24 Mar 202434:19

Summary

TLDREl script del video ofrece una visión detallada de 'AutoDebl', un innovador framework de desarrollo automático anunciado por Microsoft. Basado en agentes AI, AutoDebl tiene la capacidad de gestionar múltiples tareas de desarrollo de software, desde la generación de código hasta la realización de pruebas, garantizando la seguridad y privacidad gracias a su uso de contenedores Docker. El video también explora las implicaciones de esta tecnología para los ingenieros de software humanos, sugiriendo que mientras ciertas tareas serán reemplazadas por AI, la demanda de conocimientos de ingeniería aumentará para gestionar y trabajar junto a estas inteligencias artificiales. Además, se destaca el rendimiento de AutoDebl en la generación de código y pruebas, lo que sugiere un futuro donde las habilidades de los ingenieros evolucionarán para adaptarse a la integración de la IA en el desarrollo de software.

Takeaways

  • 😲 El script habla sobre un nuevo marco de desarrollo automático llamado 'Auto DeB' desarrollado por Microsoft, que tiene el potencial de automatizar tareas de ingeniería de software.
  • 🤖 Se menciona que Auto DeB utiliza múltiples agentes de IA que colaboran entre sí para llevar a cabo tareas de desarrollo de software de manera autónoma.
  • 🔒 Auto DeB garantiza la seguridad y la privacidad ya que trabaja dentro de contenedores, lo que permite un control de acceso adecuado.
  • 🛠️ El marco incluye herramientas para gestionar conversaciones, tareas y ejecutar el entorno de desarrollo, como agentes de IA, herramientas de desarrollo y organizadores de salida.
  • 📝 Se discute la importancia de la gestión de versiones con Git y la virtualización de contenedores con Docker, ambas utilizadas en Auto DeB para facilitar el desarrollo.
  • 📈 Auto DeB ha demostrado alto rendimiento en la generación de código y pruebas, con una tasa de aprobación de PASS@1 de 991.5% en pruebas de evaluación de habilidades de programación.
  • 🔍 El script destaca cómo Auto DeB puede realizar tareas que tradicionalmente requieren un ingeniero de software, incluyendo la generación de código, pruebas y documentación.
  • 🤔 Se plantea la pregunta de cómo la introducción de tecnologías como Auto DeB afectará el futuro del trabajo de los ingenieros de software y cómo pueden verse afectados.
  • 💼 Se sugiere que, en lugar de reemplazar a los ingenieros, las herramientas como Auto DeB podrían aumentar la necesidad de roles que gestionan y trabajan junto a la IA.
  • 🌐 El marco de trabajo Auto DeB aún no está disponible para el público en general, pero el script expresa la expectativa y el interés en su potencial impacto en la industria de la tecnología.
  • 📚 El video finaliza con una llamada a la curiosidad y el aprendizaje continuo, especialmente en áreas de IA, para estar preparados para los cambios tecnológicos futuros.

Q & A

  • ¿Qué es AutoDebl y qué hace?

    -AutoDebl es un marco de desarrollo automático anunciado por Microsoft, que permite crear un ejército de ingenieros de AI para automatizar tareas de desarrollo de software.

  • ¿Cuál es la importancia de la plataforma AutoDebl en el futuro del trabajo de los ingenieros de TI?

    -AutoDebl podría cambiar significativamente el trabajo de los ingenieros de TI al automatizar gran parte del proceso de desarrollo, lo que podría llevar a un aumento en la demanda de roles que implican la gestión y el trabajo con AI.

  • ¿Qué es la función de los 'AI agents' dentro del marco AutoDebl?

    -Los 'AI agents' en AutoDebl son componentes clave que realizan tareas específicas dentro del proceso de desarrollo, como la revisión de código, la generación de pruebas y la ejecución de tareas asignadas.

  • ¿Cómo se asegura la seguridad y la privacidad en el entorno de desarrollo de AutoDebl?

    -AutoDebl utiliza tecnologías como Docker para mantener un entorno de desarrollo seguro y confinado, lo que ayuda a proteger la información confidencial y a garantizar la privacidad.

  • ¿Qué es un 'Docker container' y cómo se relaciona con AutoDebl?

    -Un 'Docker container' es una tecnología de virtualización que permite a los desarrolladores empaquetar sus aplicaciones y sus entornos de ejecución en un paquete estándar. AutoDebl utiliza Docker para mantener un entorno de desarrollo seguro y aislado.

  • ¿Cuál es el papel de Git en el contexto de AutoDebl?

    -Git es una herramienta de control de versiones que es fundamental en el desarrollo de software y es mencionada en el contexto de AutoDebl para gestionar el historial de cambios y colaborar en el desarrollo de proyectos.

  • ¿Por qué es importante la evaluación de la performance de AutoDebl?

    -La evaluación de la performance es crucial para entender la efectividad de AutoDebl en tareas de desarrollo de software, como la generación de código y pruebas, y para comparar su rendimiento con métodos de desarrollo tradicionales.

  • ¿Cómo se gestionan las configuraciones y reglas dentro de AutoDebl?

    -AutoDebl utiliza archivos de configuración, como los archivos YAML, para definir las reglas, objetivos y permisos para los AI agents, lo que permite un control preciso sobre el proceso de desarrollo.

  • ¿Qué es la 'HumanEval' y cómo se relaciona con la evaluación de AutoDebl?

    -La 'HumanEval' es una evaluación de rendimiento de modelos de lenguaje publicada por OpenAI, que se utiliza para medir la capacidad de los modelos de lenguaje para generar código correcto en respuesta a problemas específicos. AutoDebl fue evaluado usando este tipo de pruebas.

  • ¿Cómo se espera que evolucionen las habilidades de los ingenieros de TI con la introducción de tecnologías como AutoDebl?

    -Se espera que los ingenieros de TI tengan que adaptarse y aprender a trabajar con AI y tecnologías de automatización de desarrollo, lo que podría incluir la gestión de AI agents y la optimización de procesos de desarrollo automatizados.

  • ¿Cuáles son algunas de las tareas específicas que AutoDebl podría automatizar en el proceso de desarrollo de software?

    -AutoDebl tiene el potencial de automatizar una variedad de tareas, incluyendo la generación de código, la creación de pruebas, la revisión de código, la documentación y la gestión de versiones.

Outlines

00:00

🤖 Introducción a AutoDebl: Un nuevo marco de desarrollo automatizado por AI de Microsoft

El primer párrafo presenta el tema principal del video: AutoDebl, un marco de desarrollo automatizado por AI anunciado por Microsoft. Se menciona que el contenido incluirá opiniones personales y reflexiones sobre cómo esta tecnología podría afectar el futuro del trabajo de los ingenieros de software. También se hace referencia a una publicación en un sitio de arxiv, donde Microsoft publicó un论文 sobre AutoDebl, un sistema que podría revolucionar el desarrollo de software al ser impulsado por IA.

05:00

📚 La importancia de arXiv y el papel de AutoDebl en el desarrollo automatizado

Este párrafo explora el contexto de arXiv como plataforma para la publicación de论文 y cómo ha influido en la difusión de ideas en la academia y la industria. Se destaca la publicación de Microsoft sobre AutoDebl, un marco de desarrollo que utiliza agentes AI autónomos para la automatización completa del proceso de desarrollo de software, asegurando la seguridad y la privacidad en el proceso.

10:01

🛠️ Herramientas y tecnologías involucradas en AutoDebl

El tercer párrafo se enfoca en las herramientas y tecnologías clave que soportan AutoDebl. Se discuten conceptos como Git para el control de versiones, Docker para la virtualización de contenedores y cómo estas tecnologías permiten un desarrollo más eficiente y seguro. Se menciona la importancia de la gestión de versiones y el aislamiento de entornos de desarrollo para facilitar la colaboración y la reutilización de código.

15:02

📝 Configuración y flujo de trabajo con AutoDebl

Aquí se describe el proceso de configuración y el flujo de trabajo al utilizar AutoDebl. Se menciona la definición de objetivos y reglas para los agentes AI, así como la configuración de permisos y protección de información confidencial a través de archivos de configuración como YAML. Se destaca cómo AutoDebl permite la creación y gestión de múltiples agentes AI, cada uno con un rol específico en el proceso de desarrollo.

20:02

🗣️ Colaboración y comunicación entre agentes AI en AutoDebl

Este párrafo destaca la colaboración entre los agentes AI en AutoDebl. Se introducen comandos específicos para la comunicación, como Talk, Ask y Stop, que permiten a los agentes informes, recibir feedback y señalar la finalización de tareas. Se enfatiza cómo esta interacción entre los agentes AI, a través de conversaciones, permite el progreso de las tareas de desarrollo.

25:02

🔧 Herramientas de ejecución y evaluación en el entorno de AutoDebl

Se describen las herramientas utilizadas en AutoDebl para la ejecución y evaluación de tareas. Se mencionan el uso de Docker para entornos de ejecución seguros, la organización de salidas y cómo los agentes AI se comunican y colaboran para avanzar en el proyecto. Se destaca cómo AutoDebl maneja la información y la seguridad a través de su arquitectura.

30:04

📊 Evaluación de rendimiento y expectativas para AutoDebl

En este párrafo, se discuten los resultados de la evaluación del rendimiento de AutoDebl, utilizando el estándar HumanEval. Se menciona el alto índice de éxito en la generación de código y pruebas, lo que indica la capacidad de AutoDebl para realizar tareas con alta precisión. Se reflexiona sobre las implicaciones de esta tecnología para el futuro del desarrollo de software y cómo podría afectar el trabajo de los ingenieros de TI.

👨‍💻 Perspectiva del ingeniero de TI y el futuro del trabajo en la industria

El último párrafo ofrece una reflexión personal sobre cómo AutoDebl y la IA en general podrían cambiar el rol de los ingenieros de TI. Se sugiere que tareas como la generación de código, pruebas, refactorización y documentación podrían ser automatizadas, y se destaca la importancia de que los ingenieros de TI adquieran habilidades para gestionar y trabajar junto con la IA. Se concluye con la expectativa de que esta tecnología se vuelva pública y se haga accesible para su exploración y uso.

Mindmap

Keywords

💡Auto-Debu

Auto-Debu es un marco de desarrollo automático propuesto por Microsoft, el cual permite la creación de un ejército de ingenieros AI. En el video, se menciona que este framework podría revolucionar la forma en que los ingenieros IT desarrollan software, al automatizar tareas que tradicionalmente requerían un enfoque manual.

💡AI Engineer Army

El término 'AI Engineer Army' se refiere a la idea de tener múltiples agentes AI trabajando en conjunto como un equipo de ingenieros. En el contexto del video, se destaca cómo Auto-Debu permite la gestión de estos agentes AI y la asignación de roles específicos para la realización de tareas de desarrollo de software.

💡Docker

Docker es una tecnología de conteneurización que permite a los desarrolladores empaquetar sus aplicaciones y los entornos en los que se ejecutan de manera que sean portables y menos propensas a errores de configuración. En el video, se menciona que Auto-Debu utiliza Docker para garantizar un entorno de desarrollo seguro y controlado.

💡Git

Git es una herramienta de control de versiones ampliamente utilizada en el desarrollo de software, que permite a los desarrolladores rastrear cambios y colaborar en proyectos. Aunque no se discute en profundidad en el video, se entiende que Auto-Debu, al ser un framework de desarrollo, probablemente se integre con herramientas como Git para gestionar el ciclo de vida del código.

💡Homo Sapiens IT Engineer

El término 'Homo Sapiens IT Engineer' se utiliza en el video para referirse a los ingenieros de tecnología informática humanos. Se cuestiona cómo la introducción de tecnologías como Auto-Debu podría afectar el futuro del trabajo de los ingenieros humanos en el campo de la IT.

💡Auto-Debu Framework

El 'Auto-Debu Framework' es el núcleo del sistema presentado en el video, el cual involucra la automatización de tareas de desarrollo con agentes AI. Se describe cómo este framework puede manejar múltiples agentes, asegurando un desarrollo colaborativo y eficiente.

💡AI-Driven Development

El desarrollo impulsado por AI, mencionado en el video, se refiere a la utilización de inteligencia artificial para dirigir y mejorar el proceso de desarrollo de software. Auto-Debu es un ejemplo de cómo la AI puede tomar el control de aspectos clave del desarrollo, desde la generación de código hasta la realización de pruebas.

💡Human IT Engineer's Job Future

La frase 'futuro del trabajo del ingeniero en IT' se introduce para debatir cómo las herramientas como Auto-Debu podrían cambiar la naturaleza del trabajo de los ingenieros humanos. Aunque sugiere que algunas tareas podrían ser automatizadas, también se insinúa que podría surgir una nueva clase de trabajo relacionada con la gestión y supervisión de sistemas AI como Auto-Debu.

💡Archiv

Archiv es una plataforma donde se pueden publicar y acceder a artículos y documentos de investigación de forma gratuita. En el video, se menciona Archiv como el lugar donde Microsoft publicó un artículo sobre Auto-Debu, lo que indica su relevancia en el ámbito académico y de investigación.

💡Performance Evaluation

La evaluación del rendimiento es un aspecto clave del video, donde se examina cómo Auto-Debu se desempeña en tareas de programación y pruebas. Se utiliza una evaluación estandarizada llamada 'HumanEval' para medir el éxito de los programas generados por Auto-Debu, resaltando su alta tasa de aprobación.

💡Collaborative AI Agents

Los 'agentes AI colaborativos' son un concepto central en el video, que describe cómo los diferentes agentes AI en Auto-Debu trabajan juntos para completar tareas. Esta colaboración es esencial para el enfoque de Auto-Debu en el desarrollo de software automatizado y dirigido por AI.

Highlights

Microsoftが発表したAIエンジニア軍団を作る自動開発フレームワーク「オートデブ」について紹介

オートデブはエンジニアのタスクを自動化し、AI駆動の開発プロセスを提供

ビデオは個人の意見を含み、視聴者は注意を払う必要がある旨注意喚起

オートデブの概要と、AIソフトウェアエンジニアの登場に伴うIT業界への影響

Microsoftが2020年3月13日にアーカイブに投稿した論文「オートデブ」の紹介

アーカイブの機能と、学術論文の投稿・閲覧について説明

オートデブが提案する自律型AIエージェントによる開発フレームワークの詳細

セキュリティやプライバシーの保護もオートデブフレームワークでは確保可能

オートデブのパフォーマンスは既にテストされ、高い評価を得ている

オートデブの構造を図解し、AIエージェントの役割とコンテナ技術の説明

ギットとドッカーの技術と、オートデブでのそれらの活用方法

オートデブの4つの主要なツール:AIエージェント、会話管理ツール、ツール群、実行環境

AIエージェント同士が会話しながらタスクを進めるコラボレーションの重要性

ヒューマンイバルを使用したオートデブのパフォーマンス評価方法の紹介

オートデブが高水準のコード生成とテスト生成能力を有していること

人間のITエンジニアの仕事に今後オートデブがもたらす変化についての個人的な見解

オートデブの総括と、今後の展望について

Transcripts

play00:01

[音楽]

play00:07

富蔵ハチへようこそ今回はトレンド編で

play00:10

Microsoftが発表したAI

play00:12

エンジニア軍団を作る自動開発

play00:15

フレームワークデブについて説明して

play00:17

いこうと思いますこちらチャンネル共通の

play00:20

告知事項です気になる方は一時停止して

play00:22

ご覧くださいえ今回の内容ですがえデブと

play00:27

いうですねま自動開発フレームワークこと

play00:30

でまたエンジニアのタスクがですねま自動

play00:32

化されていくという内容ですで最後の方は

play00:35

また定番のですね人間のITエンジニアの

play00:38

仕事今後どうなってくんでしょうという話

play00:39

もしていこうと思いますえ今回の動画は今

play00:44

まで以上に特にえ個人の意見感想を含み

play00:47

ますのでご留意くださいそれでは参り

play00:50

ましょうではまずオートデブの概要につい

play00:53

て説明していこうと思いますえ先日私は

play00:57

ですねこんな動画を投稿しましたえ中身

play01:00

ですねえっと2024年の3月12日にえ

play01:03

新しいAIデビが出ましたよとで何かって

play01:07

言うとITエンジニアの実務が実際にでき

play01:11

ちゃう世界初のAIソフトウェア

play01:13

エンジニアですという話でしたねでこちら

play01:17

の内容は結構反響が大きくてですね元々

play01:19

海外でもバってましたしまブロン記事も

play01:22

結構閲覧がすごい増えてですね私自身も

play01:24

驚いてましたでこれからエンジの仕事も

play01:27

色々また変わっていくなと思っていたん

play01:29

ですが

play01:30

えっとこれ系の話でさらに大きいのがまた

play01:33

出てきたのでこちら紹介しようと思います

play01:36

ことの発端はですねえっとまアーカイブと

play01:38

いう論文投稿サイトがあってこちらに

play01:41

Microsoftがえっとま測ってか

play01:43

測らずか2020年3月13日まデビの

play01:47

発表の翌日ですねこちらに投稿された論文

play01:50

がえっとありましたタイトルはですね

play01:53

オートデブオートメAIドリブン

play01:56

デベロップメントてことでですね威すると

play01:59

えデブAI駆動の自動開発と衝撃的な

play02:03

タイトルで出ておりましたでこのなんたら

play02:07

ドリブンデベロップメントまずこちらは

play02:09

IT業界でよく使う単語でま何をトリガー

play02:13

に何を起因に開発をしていくかすべきかっ

play02:16

て時によく使われる言葉なんですけどもま

play02:18

今回はAIドリブンデベロプメントAI

play02:22

駆動開発となんと素敵な名前でしょうで

play02:26

こちらに

play02:28

オートメーティッドはい結構これに驚き

play02:31

ましてまそもそもですねアーカイブ知ら

play02:34

ない方もいると思うんで説明していこうと

play02:36

思いますでアーカイブってえっとまあ

play02:39

2000あ1990年ま91年頃にえ

play02:43

始まったえ簡単に言うと無料で論文を投稿

play02:47

閲覧できるウェブサイトですとま学術論文

play02:50

ですねで学術論文のジャンルは色々あって

play02:53

ま物理数学経済えまコンピューター

play02:56

サイエンスえ金融電気工学電子工学ま色々

play03:01

とあるんですけどもその学術論文をえ投稿

play03:04

できるところでまPDFでえっと投稿が

play03:08

できるしダウンロードもできると無料です

play03:10

ねで特徴はですねさ前の論文を取り扱って

play03:15

いるえサービスまプレプリントサーバーっ

play03:18

て言んですけどもこのプレプリントサー

play03:19

バーっていうものの先駆けですまプレ

play03:22

プリントサーバーといえばアーカイブが

play03:24

1番有名って感じですねはいで同じような

play03:27

サービスは日本にもあってJ回部とかあと

play03:30

海外でえっと生物系ならバイオアーカイブ

play03:33

科学系ならケムアーカイブとか色々あるん

play03:35

ですねでこのプレプリントってのは左前の

play03:38

論文ですけどもさってそもそも何ですかっ

play03:41

て話を一応しとくとえ学術論文を何か出版

play03:45

しようと思った時にさというプロセスを

play03:47

通るんですねでまえっと論文書人が執筆を

play03:51

して実際にえっと出版したいよとなった時

play03:54

にまその出版社のえっと編集とかがえっと

play03:57

チェックをしてままずはえっと定Sとか

play04:01

文書として成立してるかとかま色々と

play04:04

チェックをしますとでそのチェックを通過

play04:07

するとやっとサドというところに通って

play04:09

サドはまその専門家とかその界隈の詳しい

play04:12

人とかが色々とチェックをしてま審査する

play04:15

ところですねでこのサドを見事通過すると

play04:18

その学術師とかに乗るという感じなんです

play04:21

けれどもまこのえサドのレベルはですね

play04:24

出版社によって全然違うんですけども

play04:26

例えば有名なサイエンスとかネイチャー

play04:29

みたいな1の学術師だと砂のレベルは高

play04:32

すぎてですねなかなか通らないま仮に内容

play04:36

が合ってたとしてもそれがもう求める

play04:38

レベルの驚けなもんじゃないと上げないよ

play04:40

とかまそういうのがあったりするんですね

play04:42

なのでそこはま出発によってバラバラです

play04:45

なんですけど所得はそもそも時間がかかる

play04:47

んですねえっと平均して数ヶ月長くて1年

play04:51

以上かかったりもしますまつまり遅いん

play04:53

ですよねなのでえっと発明とか発見って

play04:56

いうのはま発表してから時間かっちゃうと

play05:00

古くなっちゃうんでえまスピードが遅いと

play05:02

いうところでえっとさ前の論文を早めに

play05:05

公開できるスピーディな情報共有目的をし

play05:07

たのがアーカイブですじゃあ砂通ってない

play05:10

から信用ないかってことはそんなことは

play05:12

なくてですねえ結構使われておりまして皆

play05:15

さんご存知OpenAIとかまApple

play05:18

GoogleMicrosoftもよく

play05:20

このアーカイブを使っておりますしま

play05:22

例えば数学のま難しい定理まポアンから

play05:26

予想とかですねこういうの定理に対する

play05:28

証明論文とかそういうのもまここに上がっ

play05:30

たりするんですねなんか乗る前にでま結構

play05:33

ここにもう乗せるのが定番になってきてい

play05:36

てえまさく前に実際アーカイブで公表し

play05:40

ちゃってでそこで専門家がああでもない

play05:42

こうでもないと意見を出してきてそれを

play05:44

参考に水行つまり修正をしてで本家の砂に

play05:48

持っていくという流れがだんだん一般的に

play05:51

なってきてるようですまあとはですね

play05:53

メリットがあって左って遅いのでえ砂でま

play05:57

あの遅いとですねチプ化するってもあるん

play05:59

ですけれどもそもそも里の時にですね

play06:01

アイデア盗まれるとかそういうのも実際

play06:03

あったらしいんですよねなのでえっと

play06:05

アーカイブ載せていつ誰がどんなことを

play06:08

出したのかを明らかにするこれでまえっと

play06:10

パクられたりとかするのを防ぐって意味で

play06:13

アーカイブはよく利用されてるようです

play06:15

ただえ砂じゃ通ってないから信用ない

play06:17

かっていうとそんなことはなくてですね

play06:19

一応所得前もちゃんとチェックはされてい

play06:22

てままずその界隈の専門家がアーカイブ見

play06:25

てますしあとはあの閲覧者がですねこの

play06:28

内容おかしいっていうのを報する機能も

play06:30

ありますであとは作の論文まサの論文が

play06:33

実際おかしすぎた場合はリジェクトつまり

play06:36

削除されたりすることもありますしえ登録

play06:39

分野が間違ってれば直されますしあまりに

play06:42

もアカウント含めひどかった場合はえっと

play06:43

アカウントま停止ま赤板ですねとかもする

play06:46

ことがあるようですはいなんでねえっと

play06:49

アーカイブ結構使われているのでえこの

play06:52

機会に是非アーカイブ見て興味があるある

play06:54

方はえっと見てみて

play06:57

くださいでこのアーカの論文は1個1個が

play07:02

識別できるIDが振られていましてその

play07:04

振られるルールも共有しますねえっと

play07:07

ルールはですねアーカイブコ投稿の年月を

play07:11

示す数字ド投稿数番号を示す数字そして

play07:15

バージョンがつって書かれていますでこれ

play07:18

に加えて登録分野とか投稿Bが補足される

play07:21

ような感じですで今回の実際の

play07:23

MicrosoftのえっとIDはこちら

play07:25

ですねえっとアーカイブコロ2403これ

play07:29

は2024年の3月の投稿ですとでド

play07:34

0829これはえっと3月のえ投稿された

play07:37

論文の中の

play07:39

8299番目のアーカイブ論文ですと

play07:43

すごい数が月刊で上がってますねでそれの

play07:46

えっと第一般V1ですという意味ですねで

play07:50

後ろの補足がえっとcsseつまり

play07:53

コンピューターサイエンス分野の中のえ

play07:55

ソフトウェアエンジニアリングの分野の

play07:58

論文ですと実際投稿日はえ2020年の3

play08:01

月13日というのが分かりますでこちらの

play08:04

IDは実際にあの調べれば論文が見れます

play08:07

ま概要欄にもね実際の論文のリンク貼って

play08:10

おきますので是非興味ある方はご覧

play08:12

くださいで論文見ますと中にですねえっと

play08:15

ま投稿者の名前のところに全員皆さん立

play08:18

この名前がえ下についてましてえ名前の下

play08:21

にえ所属ですねMicrosoftLM

play08:24

USAと書いてますでこれはえっと

play08:27

Microsoftの本社の住所ですねえ

play08:30

本社はえっとアメリカのワシントン州の

play08:33

レドモンドにあるのでま本社の人はこう

play08:35

やって書くんですねつまりえっとこの投稿

play08:38

者はMicrosoft本社の人たちの

play08:40

論文ですよということが分かりますで論文

play08:43

のえっとインデックス目次がえっとこんな

play08:46

感じで書かれてありましたま

play08:47

アブストラクトから始まって最後結論まで

play08:51

書いていて今回のオートデブの内容ですね

play08:53

で今回はこの中身を全部詳細には威しませ

play08:57

んがこの中身をえっとざっくりとえっとま

play09:01

噛み砕いて分かるレベルにまとめてえ日本

play09:05

語でえっとま意見も踏まえてえ説明して

play09:08

いこうと思いますでまだこの動画制作時点

play09:11

ではですねこの論文の内容説明してる日本

play09:13

語の動画なかったんですよね1個もなので

play09:16

今回多分初めてになると思うんで是非え

play09:18

興味ある方は最後までご覧くださいでは

play09:21

ですねえざっくりと説明するとですねまず

play09:24

先に結論ですねえ今回の論文中身はえ

play09:27

こんなことが書いてありますえ自立型の

play09:30

AIエージェントを複数用意する自動開発

play09:34

のフレームワークを提案しますとでその

play09:38

フレームワークを使うとですねま

play09:40

セキュリティやプライバシーの保護も

play09:42

ちゃんと対策ができますよとでえしかも

play09:46

えっとフレームワークってこの論文では

play09:48

表現しててもっぽくないんですけどもま

play09:50

ぶっちゃけですねもうテストを実際に実施

play09:53

してえっと評価が何パーとかっていう風に

play09:55

出してるんで多分なんかもがもうあるん

play09:57

でしょうね開発中でおそらくそれをベース

play10:00

に喋ってんだと思いますはいでこれを今回

play10:03

まちょっとIT初心者向の人も踏まえて

play10:05

ですねえ補足しながら説明していこうと

play10:08

思い

play10:09

ますえ今回の論文は非常にボリュームで

play10:13

ですねだいぶ削ったんですけれどもそれで

play10:15

も量が多いので少し長くなるかもしれませ

play10:18

んがお付き合いくださいではまずオート

play10:20

デブの特徴からまとめていきますえ冒頭の

play10:24

アブストラクトイントロダクションまとめ

play10:26

たらこんなことが書いておりましたえ自律

play10:28

型AIエージェントによって完全に自動化

play10:31

された開発フレームワークオートデブを

play10:34

提案しますとで従来のAIエージェント

play10:37

これ具体的な名前も出てましたねえgit

play10:39

HUBコパイロットとかそういったものは

play10:41

支援型であってえ自動化できる範囲も限定

play10:45

的ですけれどもオーデブは開発プロセス

play10:48

全体を自動化できますよとでオートデブは

play10:52

全ての作業がま後で説明しますがコンテナ

play10:54

に閉じられていてえ権限制御も可能なので

play10:58

えセキュリティやプライバシーもちゃんと

play11:00

確保できますよとですでにパフォーマンス

play11:03

もテスト済みでえ素晴らしい評価があると

play11:06

こちらも後で説明しますまこんなことは

play11:08

書いてありますでえっと今回のえオーデの

play11:12

オートデブの構造をえ図にしてるものが

play11:14

ありましてそちらを書き直したのはこちら

play11:16

ですねこんな感じになってましたでこれ

play11:19

少し英語分かりづらいので日本語に威して

play11:21

みましたま少しえ言葉の意味も変わっ

play11:23

ちゃいますけどもこんな感じですでこの

play11:26

説明する前にどうしても避けてれない専門

play11:29

用が2個ありましてこちらを補足する必要

play11:31

がありますそれがこのドッカーとギット

play11:34

ですねでこの今回ですね2個説明するん

play11:37

ですがすでにエンジニアで知ってる方は

play11:39

飛ばしてもらっていいので補足と書いてる

play11:42

チャプターを飛ばしてください知らない方

play11:44

はご覧くださいではこのこちらのギットと

play11:47

特化説明していこうと思いますえ先に

play11:50

さらっと触れておきますとギットっていう

play11:52

のはバージョン管理ができる技術です

play11:55

そしてドッカーっていうのはコンテナって

play11:57

ものが使える技術ですより詳しく説明して

play12:00

いきますまずgitはですねえバージョ

play12:03

ンってものを管理する技術です身近な例で

play12:06

言うとですねえっとアプリにはバージョン

play12:08

の数字がありますよねあとはスマホ自体に

play12:11

もOSのバージョンの数字ありますで

play12:14

ゲームにもバージョンがあってよくアプデ

play12:16

したらえっと数字が上がってま新しい

play12:18

ステージが増えるとかキャラが増えるとか

play12:20

ありますねで紙の本とか電子書籍こちらも

play12:23

バージョンがありましてま初犯とか第1般

play12:26

第2半とかまそういったものがありますよ

play12:29

ねま要は中身が変わったら上がっていく

play12:31

数字みたいな感じですねでこのえ

play12:34

バージョンはプログラムにもありましてま

play12:37

プログラムが一定の規模を変わった場合は

play12:40

バージョンをつけてそれを変えたりして

play12:42

管理していきますでそのえっとバージョン

play12:45

として目印を不要してえっと管理してます

play12:47

よとまV1.とかそういうのがバージョン

play12:50

ですねま今回のアーカイブでも一応例で

play12:53

言うとあれもバージョンですえ識別史とし

play12:55

てま与えられたIDに最後にV1とかV2

play12:58

とかありますねあのもバージョンですで

play13:01

バージョン管理の技術を使うと何がいい

play13:04

かって言うとえっとバージョン管理の技術

play13:07

を使った場合管理領域ってところがあって

play13:09

その管理領域の中でえっとファイルを監視

play13:12

して変更を見ていきますでもし技術が使わ

play13:15

れていなかった場合普通にえっと

play13:17

バージョン管理なしで運用しちゃうとま

play13:19

右上みたいにですね似たようなファイルが

play13:22

いっぱい出来上がって管理しづらくなり

play13:24

ますまコピーコピーでどんどん作られてく

play13:27

感じですねなんですけれどもちゃんと

play13:29

バージョン管理技術を活用すると下のよう

play13:32

にえすっきりと常に1個だけのファイルに

play13:34

なりえそして変更の履歴とかがちゃんと

play13:37

管理されていてえま綺麗になりますとで

play13:41

この管理領域のところこれ名前がちゃんと

play13:44

ついていましてえっとリポジトリーと言い

play13:46

ますでリポジトリーという領域の中で

play13:49

ファイルをいじることによってちゃんと

play13:51

管理ができますよでこのリポジトリーって

play13:53

いうのはま差分変更の利益を全部持ってい

play13:56

ていつ誰がどのファイルをどんな風に何行

play14:01

目を変えたかとかが全部記録されていて

play14:03

履歴に残りますただし勝手に履歴に残る

play14:07

わけじゃなくて自分が確定したタイミング

play14:10

この時点の変更で保存しますみたいなこと

play14:12

を宣言するとえ前の状態からその宣言状態

play14:16

までの間で差分を管理するというような

play14:19

仕組みになってますでまバージョン管理が

play14:22

できるとですね例えばえっと古い

play14:24

バージョンに1回戻そうとかちょっと

play14:26

新しくしようとかができるようになります

play14:29

まバージョン管理のえっと具体的なえま

play14:33

商品名と言いますか有名なサービス名が

play14:35

gitですとでまとめますとgitって

play14:38

いうのはえっとバージョン管理つまり文章

play14:40

やプログラムの中身の状態を管理できる

play14:43

技術ですと何がどう変わったか誰が書いた

play14:46

のかを記録できますでそれぞれの

play14:48

バージョンに目印Vいくつとかがつけれ

play14:50

ますとでえっとこれらの履歴のデータを

play14:53

管理する場所をリポジトリーと言いますと

play14:56

で過去の状態に戻したりとかできる

play14:58

メリットがあります他人とも共有できるの

play15:01

でチーム作業に向いてますでギットって

play15:04

いうのはそのバージョン管理技術の中の1

play15:07

個に過ぎませんで前回ですねデビの時に

play15:10

あのまgitハブて説明しましたけども

play15:13

gitHUBとGは一応違いましてえっと

play15:16

gitハブっていうのはま前回説明で言う

play15:19

とえプログラムの中身を他人と共有し

play15:21

合えるIT業界定番のサービスと言いまし

play15:24

たただこのgitハブっていうのはgit

play15:27

の技術を利用しているウブサービスの1個

play15:30

に過ぎませんま要はGって元々画面がない

play15:32

のでえ仕組みだけなのでその仕組みを利用

play15:35

して画面くっつけたやつがGハブって感じ

play15:37

ですねはいまこれ以外にもGとか

play15:41

バージョン管理詳しい説明はまた別の動画

play15:43

作りますので気になる方は是非えっと

play15:45

チャンネル登録お願いいたします次は

play15:48

ドッカーですがドッカーっていうのは

play15:50

えっとコンテナ仮想化またはコンテナて

play15:53

ものを利用できる技術ですでコンティナっ

play15:56

て何かって言うとちょっと難しい説明なの

play15:58

で今回は超ざっくり言っちゃいますけどえ

play16:01

ざっくり言うとMacとWindowsが

play16:03

あったとした時にえMacで動く

play16:06

プログラムこれは通常Windowsでは

play16:08

動きませんなぜかというとOSが違うから

play16:10

ですなんですけどえコンテナてもので

play16:14

包み込んであげてこのコンテナって技術を

play16:17

使うとですねなんとWindowsでも

play16:19

Macのプログラムが動くんですねま要は

play16:22

環境サを気にしなくても済むのがえっと

play16:26

コンテナって技術ですでそのえコンテナを

play16:30

利用できるようにするための中で有名な

play16:33

ものがドッカーですドッカーを使うとこれ

play16:36

ができるってことですねで別にOSの際

play16:39

だけじゃなくてえ例えばですねえっとある

play16:42

MacからRMacにえっとま

play16:44

アプリケーションのソースコードとか移動

play16:45

する時にですねえっと前のMACはえっと

play16:49

バージョンがま新しくて次のMACは

play16:52

たまたま古かったりとかする場合ですねえ

play16:55

本来古いバージョンなら動かないはずの

play16:57

ものがコンテに入れてあると動くんですよ

play17:00

ねとかえっとPHPのえっと開発環境前の

play17:05

マックは作ってたけども新しいMacは

play17:08

まだPHPの環境を作ってないやとそう

play17:10

いう場合でもえっとプログラムを

play17:12

パッケージとしてコンテナーに閉じておけ

play17:14

ば動くんですよねあとはえっとまそもそも

play17:17

え開発環境構築が面倒な手順で結構色んな

play17:21

手順を叩くのが面倒くさいでやっとそれが

play17:24

終わって出来上がるこ環境っていうのが

play17:26

あったとしたらその環境ごと体に

play17:29

パッケージしてしまえばえ環境構築をする

play17:31

ことなく出来上がった状態のものが渡せ

play17:34

ますまこういった風な使い方もできるのが

play17:37

えっとコンテナ技術ですじゃあ元々

play17:41

パソコンにあるものとの関係はって言うと

play17:44

えっとパソコンで元々動いてるプログラム

play17:47

や元々あるファイルとかそういった

play17:49

リソースとコンテナは切り離されますなの

play17:53

でえっとコンテナで何が起きてるかって

play17:56

いうのは元々のPC外側には影響しないん

play17:59

ですねえコンテナはあくまでもホストの

play18:02

PCまそのコンテナが動いているベースの

play18:04

え下地のPCにとってはただの位置処理に

play18:08

過ぎませんま要はですねコンテナっていう

play18:11

のはえっと影響範囲が制御できてえ何もし

play18:15

なければ外に影響は及ぼしませんしま設定

play18:17

すれば影響はえっと変えられますが基本的

play18:20

には切り離すことができるんですねえで

play18:23

今回のオートデブっていうのはこの

play18:25

コンテナ技術を使っていてそこでえ対応を

play18:28

全部済ますからえセキュリティとかの問題

play18:30

もちゃんと設定すればクリアできるよって

play18:33

ことを言いたいわけですはいで今回のえ

play18:36

説明したドッカーコンテナこちらも別の

play18:38

動画で説明していきますので気になる方は

play18:40

是非チャンネル登録をお願いいたしますで

play18:43

は補足が終わりましたのでオートデブの

play18:45

実際のえっとまフレームワークの中身を

play18:48

説明していきますまずオートデブという

play18:50

フレームワークは大きく4つのえツールで

play18:53

成り立っていてえ右側説明していきますと

play18:56

まずAIエージェントこちらはですね

play18:58

エージェントスケジューラーなるえ仕組み

play19:00

が用意されていてまAIモデルの選択

play19:03

そしてどういう役割なのかっていうの

play19:05

割り当てえこれをえっと管理し複数のAI

play19:08

エージェントを作れるようになっています

play19:10

で次に会話管理ツールですねこちらは全体

play19:13

のまコントロール制御はもちろんのことえ

play19:16

プロンプトで指示を出してタスクをやって

play19:17

もらうとかあとはAIの状況を把握したり

play19:20

とかAIからフィードバックを受けるとか

play19:22

いろんなことができるまメインのユーザー

play19:24

が使う領域ですねえ次にツール群これは

play19:27

AIエージェントが利用するツールが揃っ

play19:29

ていますよということですでまファイルを

play19:32

いじったりえ開発をしたりテストをしたり

play19:34

えなんか動かしたり検索したりバージョン

play19:37

管理をするツールこれがえっとあるとで

play19:40

これ英語の論文で気になったのがえ検索の

play19:42

ところにですねリトリバルって書いてたん

play19:44

ですねでリトリーバルてのはリトリブって

play19:47

いう同士のま活用系ですけれどもえっと

play19:49

サーチとの違いはサーチの方がまネットと

play19:53

かも含むえ情報からえ情報を検索して

play19:56

探し出すというニュアンスがあると思って

play19:58

いてえリトリーブはですねすでにある情報

play20:01

リソースの中からえ回収取得するという

play20:04

ニュアンスがあると思っていますなので

play20:06

もしかしたらですねえっとデビみたいに

play20:09

Webブラウザー使ってオンライン上の

play20:11

ものを探してきてとかやらないかもしれ

play20:13

ません事前にこちらが用意する必要がある

play20:15

かもしれませんただネットのオンラインも

play20:18

できるかもしれませんこちらは今後要

play20:19

チェックですねで次実行環境こちらは

play20:22

えっとまちょっと置き換えちゃったんです

play20:24

けどプログラムとログとでこちらは実際に

play20:27

AIが行う全作業はこの中で行われますと

play20:30

いうことですねでドッカーっていう

play20:32

コンテナを使いますのでえクローズな環境

play20:35

の中でセキアに作業が行われますよという

play20:38

ことでしたでは実際にオートデブを使う際

play20:42

の1つのサンプルというか事例というか

play20:44

どういう流れで使うってのを説明して

play20:45

いこうと思い

play20:46

ますデブをまず使う時にはまず全体設定

play20:50

から行いますこれ人間のユーザーがまず

play20:53

えっとプロジェクトのゴールつまり何を

play20:55

作りたいかとか何をして欲しいかっていう

play20:57

のを先に決めるってことですね

play20:59

えその次にルールズアクションズ

play21:01

オブジェクティブコンフィギュレーション

play21:02

を決めていきますまつまりえAI

play21:05

エージェントに対して何ができるのかどこ

play21:08

までできるのかどういう権限があるの

play21:10

かっていう細かいところをコントロール

play21:12

制御できますで次にえっと実際処理が行わ

play21:15

れる実行環境とかシステム全体の中でえ

play21:19

流れていく情報に対してま機密情報もれ

play21:21

ちゃまずいものとかがあればそれが保護さ

play21:23

れるような設定をする必要がありますで

play21:26

こういった定義はですねえっとやる

play21:28

ファイルで行われるようですヤルファイ

play21:30

ルっていうのはまファイルの種類の1つで

play21:33

えファイルの名前の後ろにドットなん

play21:35

ちゃらってあると思うんですけどもこのド

play21:36

なんちゃらがえっとヤるとかymlって

play21:38

書いてやつがヤるファイルです他に人気の

play21:41

やつはえっとドJSっていうJSON

play21:43

ファイルがありますけれどもま要はえ設定

play21:45

系でよく使われる人気のえファイル

play21:48

ジャンルですで具体的には右側のように

play21:50

書きますが要はコロン区切りで左側に

play21:54

えっと何をえ対象に設定したいのか右側に

play21:57

どういう値をま当てるのかっていう感じで

play22:00

えキーとバリューを当てはめてえ管理し

play22:02

ますでインデンと字下げを使って回送構造

play22:06

を作れますまこんな感じでえっと設定系の

play22:09

内容を定義することができるま人気の

play22:12

ファイルこれがやるファイルですねで次に

play22:15

えっとエージェントスケラーって

play22:17

ものを使ってAIエージェントを管理でき

play22:19

ますでこのえっとAIエージェント

play22:21

スケジューラーで具体的には何のAI

play22:24

モデルを使うのかをちゃんと選んでえその

play22:28

AIエージェントには何をして欲しいの

play22:30

かって役割を決めます例えばえっとテスト

play22:32

をして欲しいレビューして欲しいえ行動を

play22:35

書いて欲しいとかファイルを操作して

play22:37

欲しいとかっていうのを自分が欲しい専門

play22:40

家を用意する感じですねこれを複数作れ

play22:42

ますまこれがAIエージェント軍団たる

play22:45

遊園ですねで次にこのオートではですねえ

play22:48

特有のえ機能を元々用意されていてですね

play22:52

それがえトークコマンドアスクコマンド

play22:54

ストップコマンドですこれは人間じゃなく

play22:57

てAIが使うコマンドですで何かって言う

play23:00

とトークコマンドはえっとAIが人間に

play23:02

対して報告や進捗状況の共有とか情報共有

play23:06

をするためのえコマンドですで次にアスク

play23:09

コマンドこれもえ人間の有罪に対してAI

play23:12

が相談してくるフィードバックを求めて

play23:14

くるためのコマンドつまりこれからどうし

play23:17

ますかとかこんな結果だけどどうすると

play23:18

かっていうのをAIが聞くためのコマンド

play23:20

が用意されてますで次にストップコマンド

play23:23

これはタスクが終わったとかもしくは

play23:25

エラーで止まったとかなんか止まる理由が

play23:27

あった時にAIが投げてくるコマンドです

play23:30

まこのコマンドがオートデブは初めから

play23:32

用意されてるということでした次に全体

play23:35

設定とAIスケジューリングが終わったら

play23:38

いよいよタスクを実行してもらいますで

play23:40

これは会話管理ツールを使って実際に指示

play23:42

をしてくんですけれどもえっとAIが複数

play23:45

いますのでこの会話管理ツールの中では

play23:47

ですねなんと複数のAI同士が会話をして

play23:50

いくんですね会話をしながら応答内容を

play23:53

解析してタスクを進めていくとえただ

play23:55

えっと会話終了条件を事前に設定すること

play23:58

ができてまストップコマンドが何回行った

play24:00

とかえどういう条件でストップしたとかま

play24:02

色々とこう条件をつけてタスクが終わる

play24:05

区切る条件とかを作ることができますえ次

play24:08

にえっと元々の論文ではパーサーって書い

play24:10

てあんですけどもま要は変換ツールですね

play24:13

えパーサーを使ってえっとそれぞれの出力

play24:16

内容っていうのをAIが解析してタスクを

play24:18

するしないとかを判断していきますよとで

play24:21

パースっていうのは簡単に言うとえ情報を

play24:24

まAIエージェントが理解可能な状態に

play24:27

えっとま活変換していって解析するって

play24:30

いう感じですまイメージで言うとリンゴ2

play24:33

つ買ってねっていうまテキストがあったら

play24:35

えそのテキストをえっとまパースしてえ

play24:39

同士は買う対象はリンゴ数は2だという風

play24:43

に解析できますまこんな感じで文章を

play24:45

ちゃんといい感じに変換できるものだと

play24:47

思ってくださいでこのパースが適切なのか

play24:50

どうかっていうのをちゃんとえっとAI

play24:52

エジンとが理解して足りない情報があれば

play24:55

足りてないとえ警告を出してくるし足りて

play24:57

いれば次のフェーズにぎますちなみに

play24:59

パースが終わったら次はですねえっと検証

play25:01

した後え自分の権限はどこまであるのか

play25:04

どこのコマンドが使えるのかっていうのを

play25:06

確認して次のフェーズに移っていきます

play25:09

えっと最後に出てたのが出力ツールですね

play25:11

アウトプットオーガナイザーこれはえっと

play25:13

ま単純にえ作業する実行環境からの結果を

play25:16

受け取る場所とか何かしらのえっと出力を

play25:19

する機能ですねこの出力ツールがあるから

play25:22

ま我々の状況把握もできますしえAI同士

play25:25

の会も成立するという感じですこれらの

play25:27

ツールをを使ってタスクが進めていかいき

play25:30

ますま今回の特徴はですねまえっと

play25:33

コラボレティブって単語が論文でぱ出て

play25:35

くるんですねコラボレ強調性というかま

play25:38

コラボレーションですねなのでえっと今回

play25:40

の特徴はコラボレエージェントま強調型

play25:43

エアエージェントと私は名前をつけました

play25:45

でこれはAIエージェント同士がえっと

play25:47

会話をしていくまさにチーム開発を実現

play25:50

するためのスキームかなと思っております

play25:53

で最後に設定した内容で実際タスクを実行

play25:57

してもらってその動くととがこの実行環境

play25:59

ですとえ論文ではイバルインバイメントて

play26:02

書いてますけども正確には

play26:03

エバリュエーションインバイ実行環境です

play26:06

ねでこちらの中で全ての処理が行われて

play26:09

いきますこの中でアプリが動くしログが

play26:12

あったらこちらに蓄積しますよってこと

play26:13

ですねでえっとドッカーのコンテナの中で

play26:16

動作しますのでえっとま他の処理とは

play26:19

切り離して動きますなので適切に設定を

play26:22

すればセキュリティも守られるし

play26:25

プライバシーの方がも問題ないですよって

play26:27

いうような感じのえ内容が書れておりまし

play26:29

たで総合しますとオートデブの特徴って

play26:32

いうのはえっと複数のAIエージェントを

play26:36

管理して役割を与えられますよとでAI

play26:39

エージェント同士が会話をしてタスクを

play26:41

進めていきますえ全体の情報制御やaiの

play26:46

権限等を設定しドッカーを利用するので

play26:49

セキュリティも担保が可能ですとでえっと

play26:52

AIが人間のユーザーにフィードバックを

play26:55

求めてくるこれも特徴的でしたで開発

play26:58

プロセス全体をそれを通して自動化でき

play27:00

ますとま一言で言うと自分専用のAI

play27:04

エンジニアチームを持つことができるそれ

play27:06

がオートデブのすごいところてところです

play27:09

ねはいでは肝心のパフォーマンスこちらも

play27:13

説明していきましょうえオートテブの全体

play27:16

のコンセプト基本方針とかま仕組みすご

play27:19

そうなのは分かったと思うんですけれども

play27:21

じゃ実力はどうなんですかて話ですねで

play27:24

今回ですねえっとヒューマンイバルという

play27:26

ものでえっと評価をしているみたいです

play27:28

ちょっと毎回ねあのAI系は全く知らない

play27:30

テスト方法とかが出てくるんで大変です

play27:32

けれども今回はヒーマンイバルです

play27:35

2021年にOpenAIが公開したもの

play27:38

でえっとま大規模言語モデルllmの

play27:41

えっとベンチマークをする中では標準的な

play27:44

ものの1つらしいですでえっと164個の

play27:47

Pythonのま問題集と回答集でえ初級

play27:51

から上級まで難度カバーしていてま結構

play27:53

使われているらしいですとこれはgit

play27:56

HUBで公開してますので無料で入手が

play27:58

可能ですでえっとこの中身を簡単に説明し

play28:01

ますとえっとまずAIのモデルにある問題

play28:05

を与えますとその問題を解くプログラム

play28:08

コードを書いてもらいますとでその書いた

play28:11

コードがえ稽古ま何個かあった場合その

play28:14

えっと何かか書いたコードそれぞれを

play28:16

テストしますでそのテストがちゃんと通る

play28:19

か通らないかってところでえっと判断する

play28:22

評価モデルらしいですでこれをPASS@

play28:25

Kという指標でえっと判定していてええ何

play28:28

個のコードを書けばどんぐらいの確率で

play28:30

テストが通るらしいそういう性能です

play28:32

みたいなことが分かるらしいですで今回は

play28:35

このえっとオートデブっていうのがえっと

play28:37

この問題を使ってえ今回は1個ですね

play28:41

えっと1個のえ作ったソースコードこれが

play28:44

どんだけ通りやすいかっていうのをえ

play28:46

チェックしておりましたなんで今回は

play28:49

PASS@1ですねえODデブがその問題

play28:52

に対してたった1個の回答を用意してその

play28:54

回答が合ってるか合ってないかみたいな

play28:56

感じですねでそれがなんと生徒率が高かっ

play28:58

たよという話ですで今回はそもそもえっと

play29:02

アプリケーションの行動を作る問題として

play29:05

もえパス1で991.5の評価を出してい

play29:09

てえそれとは別でえテストを作ることも

play29:12

できるようでま要は既存のえっとソース

play29:14

コードプログラムに対してこういうテスト

play29:16

をすべきでしょうというようなテストも

play29:19

行ってそれも正当率がえっと一発で87.

play29:23

%ま要するに一発合格の確率が高かっ

play29:26

たってことですねなのでえっとコード生成

play29:29

だけじゃなくてテストもえ生成できる

play29:31

らしいですえつまり自分のえっとま

play29:35

プログラムを読んでもらってじゃこういう

play29:37

テストした方がいいねとかっていう理解

play29:39

コンテキストの多分理解もできるん

play29:40

でしょうねなんでえっと結果的には非常に

play29:44

高い精度でタスクをこなすことができた

play29:47

らしいことが書かれておりましたま要は

play29:49

えっとコンテナでセキアにえ作業ができる

play29:53

ししかも制度も悪くないよみたいな話です

play29:57

ねでは最後定番ですがえ我々人間のIT

play30:01

エンジニア今後仕事どうなるんでしょう

play30:03

かっていう話をしていこうと思いますで

play30:06

結論ですがえっと現役ITエンジニアの

play30:09

観点も含めて個人的感想ですがやっぱり

play30:13

従来に作業の中でAIに置き換わる部分

play30:15

ってのはこれどんどん今後増えてくと思っ

play30:17

ていますオートデブができることを考えた

play30:20

時にですねこんなことできそうですね例え

play30:22

ば単純にアプリを作らせるまコードの生成

play30:24

ですねこれはできそうですとでテスト

play30:26

コードが生成できるってことはテストの

play30:28

自動化もできそうですテストコドかけ

play30:30

るってことはえプログラムの背景

play30:32

コンテキストが理解できるのでえつまり

play30:34

リファクタリングとかですねえ既存コドの

play30:37

改善点の調査とかこの辺がまできそう修正

play30:40

とか改善もできそってことですねあとは

play30:42

ドキュメンテーションの自動化まつまり

play30:44

ですねよくIT現場であるこの現場えっと

play30:47

プログラムはあるけれども詳細積書がない

play30:49

とかねそういう現場結構あると思うしそれ

play30:51

やってるエンジニアもいると思うんです

play30:53

けどもまそれも任せられそうですね1番

play30:55

結構厄介な作業でしたであとはですね

play30:58

えっとソースコードのレビューこれもでき

play30:59

そうですしあとはなんか不具合があった時

play31:02

にどこがおかしいのなんで起きたのどう

play31:05

直したら良さそうっていうのもえ任せ

play31:07

られる可能性が出てきますあとは

play31:09

バージョン管理できるんでギットのタスク

play31:11

も自動化できそうな感じがしますま色々

play31:13

想像が深りますけれどもえっと一方で

play31:16

やっぱりですねえっとAIを管理する側

play31:19

扱う側のポジションもやっぱり増えそうだ

play31:21

なと思いましたえ特に今回のオードデブは

play31:23

デフォルトでアクコマンドがありますよね

play31:25

アスクコマンドじゃあそのアスクコマンド

play31:27

でAIに聞かれますよとえ今こういう状況

play31:30

でここまでやりましたどうしますかとか

play31:32

こんなエラーがあったけどどうしますかっ

play31:33

て言われた時に答えられますかて話ですね

play31:36

はいあとはえっとコマンドや権限を適切に

play31:38

付与すると石はに安全に使えますよって

play31:41

言いましたけどもじゃそもそもコマンド

play31:42

権限って分かってますかとどう使いますか

play31:44

何がありますかって知ってますかみたいな

play31:45

感じですねやるファイルかけますかとなの

play31:48

でやっぱりエンジニアリングのスキルって

play31:50

絶対に必要なんですよねでどちらかと言う

play31:52

と今のエンジニアがどこっていうよりかは

play31:55

エンジニアと呼べる技術者これがえっと

play31:57

スキル持ってる人が増えるってイメージ

play31:59

ですエンジニアは消えるんじゃなくって

play32:01

エンジニアスキルを持ってる普通の人が

play32:03

増えるみたいな感じですそれはもはや

play32:04

エンジニアですねだってスキルあるんだ

play32:06

からだしあやっぱりAIのことについて今

play32:10

のエンジニアもっと勉強すべきだと思い

play32:12

ましたね改めてえ例えばですねまえっとソ

play32:15

とかgimとか経理の人でWord

play32:18

Excel使えないってちょっと今厳しい

play32:20

時代じゃないですかやっぱり時代によって

play32:22

その技術が使えるのが当たり前えって時が

play32:24

来ると思うんで今後はやっぱりエンジニア

play32:26

もAIのことは多少触れて当たり前使えて

play32:30

当たり前知ってて当然っていう風な時代が

play32:32

来ると思うんでそれに備えてもやっぱり

play32:33

エンジニアももう少しAIのことをえま

play32:36

学習すべきですねえとにかくですねどっち

play32:39

にしても個人的には早く一般公開して

play32:41

欲しい触りたいですねはいていうのは感想

play32:43

でしたではまとめですえ今回紹介したオー

play32:48

debはですねMicrosoftが新た

play32:50

に論文発表した自動開発フレームワーク

play32:52

ですま気になる方はえっとこちらの論文

play32:54

是非ご覧くださいでえっと複数のAI

play32:57

エージェントを管理して自分だけのAI

play33:00

エンジニアチームを持てるようなそんな

play33:02

技術ですねまデビがいっぱいいるって感じ

play33:04

ですねでえっと強調型のAIエージェント

play33:07

がえ互いになんと会話をしながらですね

play33:09

タスクをこなしていくというものですえ

play33:12

ドッカーを利用することで適切な設定も

play33:15

することでえっとセキュリティもえ安全性

play33:17

もちゃんと担保ができそうですとでコド

play33:20

生成やテスト生成といったところで高い

play33:22

パフォーマンス評価を既に発揮している

play33:24

みたいですで既存のタスクはやっぱりこう

play33:27

いったAIに今後置き換わっていく可能性

play33:29

が高いんじゃないかなと思ってます一方で

play33:32

人間のユーザーはこういったものを扱う

play33:34

ためのエンジニアリングの専門知識は今後

play33:36

必要になってくると思いますで動画投稿日

play33:39

現在はまだこの技術は一般公開はされてい

play33:42

ませんはい今回の動画はこちらで終わり

play33:45

です長い時間お付き合いありがとうござい

play33:47

ましたえ今回の内容が面白かった参考に

play33:49

なったら是非高評価をお願いいたします

play33:51

また違う動画見てもいいかもと思った方は

play33:53

是非チャンネル登録もよろしくお願いし

play33:55

ますまた違う動画でお会いしましょうそれ

play33:58

では

play33:58

[音楽]

play34:18

また

Rate This

5.0 / 5 (0 votes)

Etiquetas Relacionadas
AutodebDesarrollo AutomatizadoAIIngeniería ITMicrosoftFrameworksInnovaciónProgramaciónFuturo TecnológicoRevolución IT