急速に進化する人型ロボット〜フィギュアAIとUnitree H1
Summary
TLDRこの動画では、ロボット技術の急速な進展とその将来性について議論されています。2023年に入り、OpenAIやFuture AIなどの企業がロボット開発に多額の資金を投入し、人型ロボットの商品化が間近に控えていることが指摘されています。特に、ロボットがディープラーニングを通じて世界モデルを獲得することで、人間を超える能力を持つ可能性が示唆されています。さらに、大規模言語モデル(LLM)の進化により、マルチモーダル処理が可能になり、ロボットの機能がさらに拡張されることが期待されています。
Takeaways
- 🤖 ロボット開発が近年急速に進歩し、2023年は「ロボットの年」と期待されている。
- 🔑 主なロボット開発企業として、イーロンマスクによるOptimus、Anthropic出身者によるFuriAI、中国のUN3H1などが注目されている。
- 🌐 ロボットが世界モデルを獲得することで、熟練の職人技術などを凌駕する可能性がある。
- 💡 大規模言語モデル(LLM)の急速な進化により、従来は困難とされていた課題がクリアされつつある。
- 🎥 YouTubeなどの膨大な動画データからオブザベーションによる学習が可能になっている。
- 🧠 ハードウェア進化とあわせて、ワールドモデルプロセッシングユニット(WPU)の開発が期待される。
- ⚡ ロボットのレスポンス性能が向上し、滑らかな動きと高速なインファレンスが実現しつつある。
- 🔄 一度に学習するのではなく、その場その場で継続的に学習できる能力が重要になる。
- 👶 赤ちゃんのように、ロボットもオブザベーションから世界モデルを構築できるようになる。
- 🤖👨🍳 近い将来、ロボットが家庭に入り込み、コーヒーを入れるなどの作業をこなせるようになる。
Q & A
イーロン・マスクが開発しているオプティマスロボットについて教えてください。
-イーロン・マスクはオプティマスというロボットを開発しており、過去3年間で性能を向上させてきました。200万円から300万円程度で近い将来に市場に投入される予定です。
AnthropicというAI企業について説明してください。
-AnthropicはフィギュアAIという新しいAI企業で、2022年から活動を開始しました。OpenAIなどから1000億円の資金を調達し、OpenAIと言語モデルの分野で連携する計画があるようです。ボストンダイナミクスやテスラの出身者も関わっています。
中国企業のUN3H1ロボットについて説明してください。
-UN3H1は中国の企業が開発した人型ロボットで、1580ドル程度で販売される予定です。中腰の姿勢で歩行し、様々な作業をこなすことができます。押されても倒れずに方向転換が可能なロボットです。
ロボット開発の今後の展望はどうなっていますか?
-今年の上半期にはロボットに関するニュースが増えると予想されています。マルチモーダル技術の進展により、ロボットの動作がより滑らかになり、ビジョンや体の動きの性能が向上すると考えられています。
人工知能研究者ヤル感の主張について説明してください。
-ヤル感は、現状の大規模言語モデル(LLM)では世界モデルを獲得できないと主張しています。しかし、最近のAIシステムの進化を見ると、オブザベーションのみでも世界モデルを構築できる可能性があると指摘されています。
ロボットが世界モデルを獲得することによる影響は何ですか?
-ロボットが世界モデルを獲得できるようになると、人間よりも詳細な世界の理解が可能になります。これにより、熟練の技術者の仕事さえ代替される可能性があります。
現在のAIシステムにはどのような課題がありますか?
-現在のAIシステムでは、学習フェーズと推論フェーズが分かれており、実際の環境で継続的に学習することができません。この点が課題とされています。
今後のAIシステムの発展について、どのような展望が述べられていますか?
-トランスフォーマーのアーキテクチャーが進化し、過去の学習内容を蓄積しながら新しい経験から学習できるようになる可能性が示唆されています。また、ハードウェアの進化によりワールドモデルを処理するユニットが登場するかもしれません。
マルチモーダルAIの発展が期待される理由は何ですか?
-マルチモーダルAIの発展により、言語だけでなく視覚や身体性など、様々なモダリティを統合した高度な世界モデルの獲得が可能になると考えられています。
本トランスクリプトから得られる主なインサイトは何ですか?
-ロボット技術とAI技術が急速に進化しており、世界モデルを獲得できるようになれば、人間を超える能力を発揮する可能性があることがインサイトとして得られます。しかし、課題も残されており、今後の技術的ブレークスルーが期待されています。
Outlines
🤖 ロボット開発の最新動向
この段落ではロボット開発の最新動向について話されています。イーロンマスクが開発中のOptimus人型ロボットに加え、新興企業FyuzionAIも巨費を投じてロボットを開発中であること、また中国のUN3H1社の人型ロボットも発表されたことが紹介されています。今年はロボット開発が本格化する年になると予想されています。
🧐 研究者の見解とロボット開発の課題
この段落では、ロボット開発における課題や困難さについて、研究者の見解が示されています。モラベックのパラドックスや、フレーム問題など、従来は克服が難しいとされていた課題が、近年の深層学習技術によって解決されつつあることが指摘されています。しかし、世界モデルの獲得や行動時の学習など、新たな課題も存在することが示唆されています。
🔮 ロボットと人工知能の融合による未来像
最後の段落では、ロボットと人工知能が融合することによる、新しい可能性について議論されています。ロボットが世界モデルを獲得し、人間以上に詳細な理解を持つようになれば、ロボットの能力が人間を凌駕する時代が訪れるかもしれません。また、マルチモーダル学習やハードウェアの進化により、未来の人工知能システムがワールドモデルを扱えるようになることも示唆されています。
Mindmap
Keywords
💡ロボット
💡マルチモーダル
💡世界モデル
💡オブザベーション
💡ゼロショットラーニング
💡LLM (Large Language Model)
💡WPU (World Model Processing Unit)
💡モラベックのパラドックス
💡フレーム問題
💡アクション
Highlights
イーロンマスクがオプティマスというロボットを作り、性能を上げて近々市場に投入するとしている。
Anthropic の FureAI が 1000億円の資金調達を行い、重要な注目株となっている。
中国の会社 UN3H1 が人型ロボットを1580万円で売り出す計画がある。
今年はロボットの商品がたくさん出てくると予想される。
マルチモーダルの進化により、ビジョンや動作制御の性能が急激に上がってきている。
モラベックのパラドックスが克服され、AIが難しいと言われていた問題を解決できるようになってきた。
LLMの範囲内でどんどん進歩しており、拡張する必要がなくなってきた可能性がある。
AIがオブザベーションから世界モデルを構築できるようになってきた。
将来的にロボットが人間以上の世界モデル理解能力を持つようになれば、人間の熟練を凌駕する可能性がある。
赤ちゃんはオブザベーションによる学習が中心だが、AIはYouTubeなど人間以上のオブザベーションができる。
センサーからの入力とインファレンスの高速化により、ロボットが身体性を獲得し人間を追い越す可能性がある。
現在のAIはオンライン学習ができない課題があるが、これを克服できれば人間並みの学習が可能になる。
大規模言語モデルの次はラージワールドモデル (LWM) になる可能性がある。
ハードウェア面でもワールドモデルプロセッシングユニット (WPU) のような新しい概念が出てくるかもしれない。
ロボット分野は引き続き注目していく価値がある。
Transcripts
ちょっとニュース系でですねロボットが
すごい流行ってるということでこれは
ちょっとだいぶ前から言われてますけども
今年はロボットの年になるんじゃないかと
うんいう話がかなり出てますけどもえっと
ま割と最近のロボットの進展ということで
まずはイーロンマスクがねずっと
オプティマスっていうのを作ってますよね
これがま
あのここ3年ぐらいですね性能を上げてき
て200万300万円ぐらいですかで近い
うちに市場に投入するよということを言っ
てたんですけども最近ですねアメリカの
fureAIっていう会社がnbiaとか
OpenAIから1000億円を調達した
というようなニュースが出てました
えジェフbezosなんかもお金を出し
てるということでOpenAIとその言語
モデルの部分では連携していくという話
ですで会社自体は2022年からという
始まっみたいでボストンダイナミックスと
かテスラ出身のあのエンジニアの人たちが
やってるということで1月にですね動画が
出ててなんかコーヒーを入れるような人型
ロボットと出てるっていうのであのまこの
フィギュアAIですねちょっと注目株だと
いう風に思いますで実はこのフィギュア
AIの報道の翌日にですねイーロンマスク
が
うろうろしてなんかやってる動画出した
みたいな対抗意識だと思いますうんえで
もう1つですねなんか最近話題になってる
のがえっと中国の会社でUN3H1という
人型ロボットが出ていてこれがえ1580
まで売り出すみたいな話が出てきてますで
これもですね人型のロボットなんですけど
もちょっと中腰になって歩くみたいな感じ
ですけどもスタスタと歩いていろんな作業
をこなしてるというようなあの話でかなり
まあの性能が良さそうでですね周りから人
が押してもなん倒れずにですね2速方向は
えやるというようなロボットです今年他に
ももしかしたらたくさん出てくるとえっと
あとイーロンマスクとかですねフィギュア
AIの商品もですね出てくるんじゃないか
ということが予想されますんでままずは
動画とかでですねいっぱいピアした後に
商品が出てくるっていう話につがるんじゃ
ないかなという気がしますあのマルチ
モーダルですねマルチモーダルが今流行っ
ててとにかくビジョンとかあと多分体
動かすような部分も含めてですけども性能
がちょっと急激に上がってきてるんじゃ
ないかなと思いますんでGoogle
mindですねとかオーAIからも
いろんな技術が今後出てくるとは思います
けどもロボットにちょっと注目すべきかな
という風に思ってます今年のえっと上半期
のニュースにもロボットてくるような感じ
はしてるとこですモラベックのパラドク
スっちゅうのがま前々からあってで人間に
は簡単なことが機会に難しくてきという話
ところがねあのモラベックのパラドックス
は間違いだとかいうのがあってねそういう
ブログかつまりいやつまりロボット
ロボットはなかなか難しいよっっちゅうの
がそうでもなくなってきたという話ですよ
ねええうんあのllmの時もねフレーム
問題というのがあっていくらこうルール
ベースで賢くしてったって全部記述しきれ
ないんだからちょっと人間並みの思考の
考える能力っていうのは無理だという風に
言われてたんですけども知らまりなんか
克服してる感じですよねだからなんかこう
難しい難しいと言われているようなAIの
問題っていうのは実はなんか
トランスフォーマーでクリアしちゃってる
んじゃないかとうんいうような感じがあり
ますねねたくさんあってそれで勝手に学習
してなんか知らんまにあの難しいと言われ
ていた問題がクリアできてるんじゃないか
というようなイメージがちょっとあると
いうことですけどもそうなんですよで
つまりねllmみたいなもので全部行くの
かでいやもっとね新しいアテクシがいるん
じゃないかみたいな議論があるんやけど
ええうんでもどうもあの空とかえあるいは
まこの前お話したジニとかそういうもの見
ているとllmの範囲でどんどんどんどん
進歩してんのねええええええだから
ちょっとあれですねllmには限界があ
るっていうんで拡張するみたいな話も一時
あったけども最近はまたそれの揺り戻しか
分からないですけどもllmの範囲でと
いう話がまた出てきてるとうんいやもう
ちょっと具体的に言えばそれはね反対して
おもとしてヤル感がおるわけでで彼はLM
みたいなものは彼えね前にねこんなこと
ごごしてたもう5年後に今みたいなLM
みたいなもう疲れてないってごしてたわけ
よでで自分のジェパラてで僕今日もね
ジパン前のポジションペーパーってのもう
1回読なしてま彼が何が言いたいかっちう
ことはよくわかったんだけど
うんだけど
あの彼のVジェパっていう話があるんだ
けどそれ
の方がすごいよと言うんだけどあの空を見
たら
ねでだからVジパーすごいよとか言うけど
じゃあ空みたいな動画出せよと言いたい
わけだけどあ出さないでペーパーは出てん
だけどですごいよと口で言うだけではね
やっぱねあの空のインパクトに叶わないん
じゃないかとでさらに言えばねさらに言え
ばあの彼はねいや自分の言ってることは
誤解されとるとね実はアクションが重要な
んだってVジェパちゅうのにアクション
入っ入ってないやけねええええええほん
ならアクション入れろよってで元々の
ジパーはねアクションが重要だっっていう
こと言ってるわけよで今のジェパっていう
のは画像ねでVジパービデオだけねだから
こアクション入ってないわけようん
アクションはあれですねビデオの途中で
なんか色々変えていくっていうような感じ
でゲームみたいな感じですよねだからそれ
がジニが実現してしまったわけよええええ
ええいやだからねあの
ヤル感がね今のLMはダメだダメだって俺
の使えとか言うてるけどねところ今のアテ
クちゃてどんどんどんどん先進んでいっ
てんのよでだからヤルかがねダメだって
じゃ口そういうのならねね空を超えるもの
辞任を超えるものを出してから言えと言い
たいわ
なえ斎藤さんのお考えはどうなんですかあ
はいあのもうロボットと愛の融合は町に
待っていたところというかええあの去年
ぐらいのところからもううんもういつきて
もおかしくないと思っておりましたのと今
のそうですねあのインファランスが
どんどんどんどん早くなっていってレ点シ
スルと共にあの非常に高速になってくると
まさにこれロボットに適用することがうん
そうそうかはいそのまでうんなるほどパレ
早いっていうのはあれですねレスポンス
ですよねそうかロボットっていうのは
まさにインファレンスマシンですからねあ
そうですねあの非常に滑らかな動きが実現
されてきてで実はさらにその先にもうあの
予測できていることがあるんですがあ言っ
ていいことだけにしてくださいねあ大丈夫
です言っていいお願いしますあの実は
ロボットが世界モデルを獲得することに
なると思いますすなわちソとロボットが
融合してく話でうんうんあの我々人間が
単純なタスクをこなして作業してる時って
のやっぱりそこでしかもが見れてないうん
わけなんですがそこにロボットがもう世界
モデル的な理解を人間よりも深くできる
ようになるでその人間よりもうんえより
詳細に世界モデルを理解した上で何かを
やり始めると人間の職人の技とかですね
熟練のとか悪のとかっていうことがあの
優勢を失ってしまうようなタイミングと
いうのが相当からずもう近づいているのか
なとうんいう気がいたしておりますうん
いやそうなんですよそうなんですよでねえ
その世界モデルに関してだからヤル感が
言うてることはね世界モデルが重要なんだ
それはそうなんですよねで彼が言うのは
現状のllmは世界モデルは獲得できない
と言ってるわけようんだからダメなんだと
ところがねところがねあの空を見てもね
あるいはこのジニを見てもですね世界
モデルがなしであんなことことができる
かってでやかさらにこういうこと言ってん
です
が赤ちゃんが学習する時にですねほとんど
オブザベーションだけでいいとね目で見る
だけでいいとねよくね物を触ってうんあ
触覚あのはいいんだけど物をね実際に投げ
てみたりとかいうアクションをやってやる
というそういう学習はあるんだけどけど
ヤル感が盛にるのほとんどは
オブザベーションだけで良いと言ってる
わけよヤル感がそう言ってんですよで人間
の赤ちゃんも基本的にはオブザベーション
だとねでところは空とかジニはそうなんだ
けどものすごいオブザベーションやってん
ですよ具体的に言えばYouTubeを
全部読み込むとかねだから赤ちゃんがね見
オブザーブできないようなことをあの
llmというかまそのAIはですね
オブザーブしとるわけです
よだからま今藤さんがおっしゃったように
ですねこの見るだけで世界モデルを構築
できるってことがあの空とかあのジニでま
証明されつつあるんですようんでプラス
これはあの松田先生が以前からおっしゃっ
てたその身体性の有のところにも繋がっ
てくと思うんですがいよいよその資格とか
聴覚とかの情報に加えてロボットがその
センサーとしてまさに本当に互換を全部
あるいは互換以上のものをインプットとし
て得てですねえそこからあのいろんな
アウトプットを出してくるしかもあの非常
に高速なインバランスができるようになる
ということになるともうあっという間に
人間を追い越してくるではないのかなて
いうがしてうんうんだからコーヒー入れる
ことぐらいはもできそうですね
うんあの例のあのウォズニアックのうん
そうですね人の家に行ってコーヒーを入れ
るっちゅうことですよねうんうんセラフ
おじさんもなんか一言あるんじゃないです
かまだまだだみたいなうん感じじゃない
ですかねあとは今のAにできてないのは
そのその都度学習なんですね今の学習あの
あい学習は学習フェーズ水路は水路
フェーズで分かれてるとそれをあの本当に
あのウニ君に言うように人のちに行って
コーヒーを入れられるようになるには自分
がいろんな経験をしてその都度学んでか
ないと世界がだんだん分かってかないので
ひたすら学習だけして世界大体分かったさ
水論だっていう今のアーキテクチャーだと
限界があるかもなっていうところでそこも
なんか突破できるんじゃないかなという
ところですね期待してるのは
うんだからまそれが今の
トランスフォーマーのアーキテクチャーで
できるかってでできそうですよねうんどう
なんでしょうね
けどトク数がこう増えてって
るっていうのはそのそこの部分に相当する
んじゃないですかかえそこはわからんね
うんその時その時学んだことっていうのが
過去の投君というのに対応するんじゃない
ですかねあああの要するに水論の中で今
までの会話利益を覚えててそれが追加学習
に相当するようなことだっていうことで
あればああそれはそうですよねそれはそう
うんある意味そうですよねだって前言うた
じゃないかってことね今だったらね忘れ
とるわけやけどそうそうそうそうそうそれ
がね100万トそうそうだ覚えとるわけ
じゃないですかうんそうゼロゼロショット
ラーニングみたいなことが追加の学習だっ
てに相当すると思えばそういうことかも
しれないうんまだからそれでねどこまで
行けるのかっていうのはまあこれからね
分ってこれまこれからですよねじゃ
いよいよロボットがこう我々の周りで動き
出すというのはもう年内じゃないかという
ような感じがしてきたうんうんうんですね
安田さんもなんかありますかコメントはだ
まマルチモーダルはねもおっしゃる通りで
だまそういう意味ではLllmの
アーキテクチャーがどんどん進化して
るっていう意味でもはやもう大規模言語
モデルじゃないなっていう気がしてきます
ねうん
うん名前が引っ張られちゃうんですけど
言語ってことにうんだからllmちいうの
はさきねあのつま先生がおっしゃって今
LMMかなんかよねラージマルチモデル
うんモデルうんうんそうでその次が
おそらくラージワールドモデルLW
あれそのそのキーワードなんか最近どっか
でジリーかなんかでそんな言葉使って
なかったっけそうなんですねうんはいうん
なのであのまハードウェアもですねCPU
からGPUま今回lpuというのも
ブロックから出てきました
がワールドモデルプロセッシングユニット
うんwpuみたいなものをちょっと作り
たい面白いなそうですねええええそれです
ねそれがそれがハードウェアと一緒に進化
するとすごいことになりますねはいはいあ
ま引き続きロボットの分野も注目していき
たいという風に思います
関連動画をさらに表示
Sex Neuroscientist on the Scary Future of Sex Robots
Microsoft's new "Embodied AI" SHOCKS the Entire Industry! | Microsoft's Robots, Gaussian Splat & EMO
【ホリエモン】※2025年、みんな消えていくかもしれません。
【AIロボット】ヒトの代わりに?ChatGPT搭載で進化?マルチモーダルって何?社会問題を自主的に解決する?|アベプラ
‘Everything is Going to Be Robotic’ Nvidia Promises, as AI Gets More Real
Unitree G1 vs. Boston Dynamics Atlas: Hypermobility in Humanoid Robots
5.0 / 5 (0 votes)