#regonn_curry_fm #252 2024年3月11日20:05~
Summary
TLDRこのポッドキャストでは、データサイエンス、機械学習、新しい働き方に関する話題が中心です。特に、短期間で行われる機械学習コンペティションの進捗状況や、新しい予測モデルの精度向上に取り組む様子が語られています。また、新しいAIモデル「クラウド3」のリリースや、3Dオブジェクト生成に関する最新技術の紹介、個人情報の漏洩問題への対応など、最新のテクノロジーとその影響について深く掘り下げています。リスナーはAIとデータサイエンスの最前線にいる専門家たちの議論から、新しい知見を得ることができます。
Takeaways
- 😀 このポッドキャストでは、データサイエンスや機械学習、仮想通貨、新しい働き方などについて話し合っています。
- 🎵 音楽をバックグラウンドにコーディングや進捗報告をしています。
- 🏆 カグルのコンペに参加しており、特にLLM(Large Language Models)に関するコンペティションに取り組んでいるとのこと。
- 📊 現在の順位は150から200位で、ハイスコアのノートブックを超えることが目標。
- ⚽️ Jリーグの試合予測を行い、正当率26%を達成し、今後の精度向上を目指しています。
- 🌐 「クラウド3」と呼ばれる新しいAIサービスについて、そのリリースと性能の高さを話し合っています。
- 🤖 AIモデル「オーパス」について、GPT-4よりも性能が良いと評価しています。
- 🔍 PDFや論文の読解と要約にクラウド3が役立つとの経験を共有。
- 📝 コーディングや用語集の作成において、クラウド3の利点を説明。
- 🚀 スタビリティAIがリリースした「トポSR」という3Dオブジェクト生成モデルについて言及。
- 🛡️ シグネ会員の個人情報漏洩に関するお知らせとそれに対する反応を話し合っています。
- 💼 カグルと仕事に関する最近の進捗や活動についての情報交換をしています。
Q & A
LLMのコンペに参加しているが、現在の順位はどのくらいですか?
-現在は150位か200位くらいです。
進行中の予測プロジェクトの正当率はどのくらいですか?
-正当率は約26%です。
クラウド3は何と比較して性能が良いと言われていますか?
-GPT-4よりも性能が良いと言われています。
クラウド3のリリース日はいつですか?
-3月4日にリリースされました。
クラウド3を提供している会社の名前は何ですか?
-アンソロピックという会社が提供しています。
トポSRとは何ですか?
-スタビリティAIが新しく出した3Dオブジェクト生成モデルです。
シグネ会員の個人情報漏洩についての通知はどのような内容でしたか?
-特殊な操作をすると個人情報が見ることができたという内容でした。
最近進行中の分析コンペはどのようなものですか?
-サッカーの試合結果を予測するプロジェクトです。
予測モデルの現在の精度をどのように改善しようとしていますか?
-特徴量を追加することで精度を上げていきたいと考えています。
ポッドキャストの更新が遅れている理由は何ですか?
-仕事が忙しく、資料作成などに時間を取られているためです。
Outlines
📊 コンペティションへの挑戦
このセグメントでは、話者が機械学習コンペティションに参加していることについて話し合います。特に、LLM(大規模言語モデル)に関連するコンペティションに焦点を当てており、短期間での集中的な取り組みを強調しています。話者は現在の順位が低いものの、高スコアのノートブックを超えることができればメダル圏内に入る可能性があると説明しています。また、サッカー予測モデルの正当率とその改善についても触れ、データサイエンス、機械学習、仮想通貨、新しい働き方など、様々な話題について討論するポッドキャストの一環としてこの会話が行われていることを明らかにしています。
🌐 新AI技術の検討
このパートでは、最新のAI技術とその機能について議論しています。特に「クラウド3」と呼ばれる新しいAIモデルに注目し、その性能とGPT-4との比較、PDFや論文の解析能力、コーディングタスクへの適用性などについて詳細に語っています。話者たちは、この技術が以前のモデルよりも優れていると感じており、特に日本語の処理能力やマークダウンの利用の柔軟性などに注目しています。また、AIが生成する歌詞の質についても言及し、個々のニーズに応じたAIの使用の適応性についても触れています。
🚀 新AIモデルと3Dオブジェクト生成技術
話者は、新しいAIモデル「俳句」と、Stability AIによってリリースされた3Dオブジェクト生成技術「トポSR」について語ります。「俳句」は、コストパフォーマンスが高く、早いレスポンス時間を特徴とするモデルである一方で、「トポSR」は、画像から3Dモデルを迅速に生成する技術であり、特にその処理速度と精度、そしてユーザーフレンドリーなライセンス条項に焦点を当てています。これらの技術は、特にメタバース空間やゲーム開発において有用である可能性があり、話者は個人的にこれらのモデルを試してみた経験を共有しています。
🔒 情報セキュリティの課題
このセクションでは、個人情報の漏洩事件に焦点を当て、セキュリティの重要性と課題について議論しています。特に、シグネ会員の情報漏洩事件を例に挙げ、ウェブページ上での特殊な操作により個人情報が閲覧可能になってしまう問題点について詳細に話しています。
Mindmap
Keywords
💡コンペ
💡LLM
💡予測
💡データサイエンス
💡機械学習
💡AI
Highlights
カグのコンペに挑戦中、LLMのコンペであり、短期間での成果を目指す
現在の順位は150〜200位、ハイスコアのノートブックに挑戦中
週末のサッカー試合予測、正当率26%という結果に
レゴンとカレーがデータサイエンスや機械学習について話し合う
クラウド3リリース、GPT-4を超える性能を持つとの発表
AIチャットベンチャー、Anthropicがクラウド3をリリース
クラウド3はPDFや論文の要約能力が高く、ユーザーフレンドリー
トポSR、3Dオブジェクト生成の新技術としてスタビリティAIから発表
シグネからの個人情報漏洩のお知らせ、特殊操作によるデータ閲覧の可能性
Jリーグの予測分析に取り組み、サッカー試合の結果予測を試みる
新しくローンチしたプロジェクトや資料作成に忙しい日々
ポッドキャストの更新が滞っているが、近い将来に公開予定
クラウド3とGPT-4の比較検討、利用者の経験に基づく評価
画像から3Dモデルを生成するトポSRの実践的な応用可能性
サッカー試合予測の精度向上に向けた取り組みと今後の展望
個人情報保護に関する議論と、データセキュリティの重要性
Transcripts
た
[音楽]
えまコーディングし
ますRECORD
Progress
はい
そばはい行きますねはい
[音楽]
はい
はい今週はそうですね私はカグのコンペを
やってましてあのllmのコンペですね
あれがえ90日間ぐらい90日間じゃない
1ヶ月半ぐらいの短期間コンペということ
でそうですねちょっと嫌いを入れて神楽の
コンペにえ取り組んでますカレですはい
うんどんな今順位的にはどこら辺なんです
か今はですねまだあのハイスコアの
ノートブックを抜かせていない段階ですね
結構ハイスコアのノートブックを抜かせれ
たらまあまあメダル剣に入れるぐらいの今
感じそんな感じなんですねうんはい自分は
今何位かな150とか200ぐらいかなの
とこですねままだまだあのノートブックを
したいなみたいなはい感じでやってます
はいはい私のはちょうどこの前土曜日の
ところで以前話していたあのと予測ですね
のえっと実際2回目ぐらいのはいあの回の
2回目が終わってそれでま早速予測して
みようてことで今週末のと予測してみたん
ですがうんま正当率が26PAぐらいだっ
たんではいもうちょっと頑張って精度上げ
ていきたいですねレゴンです
はいえ勝ち負け引き分けの3択でしたっけ
ですねそれの13試合はいああはいはい
うんそかはいまだから単純に考えたらあの
1/3のはいま連続なんでまはいうんまだ
から33%ぐらいはま取れてた方がいいん
ですけどはいうんはいはいはいま今んとこ
率ですねこれから改善ってとこですねです
ね
はいはい
えこのポッドキャストではレゴンとカレー
がカグを中心としたデータサイエンス機械
学習に関連する情報仮想通貨XR新しい
働き方などについて話しますということで
252回目はえクラウド3というのとこれ
はなんて言うんでしょう
トライポポフォアではいえお伝えしたいと
思いますはいこれもクラウドでいいんです
かねクラウドクラウ3というのが出てまし
てはいこれがえっと3月4日にリリースさ
れたまllmというかまそうですねチット
AIチッGPTみたいな感じですねはいと
いうのがリリースされていてこのクラウ3
というのが何かというとえアンソロピック
という会社がベンチャーのえアメリカの
ベンチャーの会社があるんですけどうん
そこはAmazonとかGoogleとか
ZOOMが出資するAIベンチャーという
ことでうんそこがあのAIのチャットを
あのリリースしたんですねはいはいでそれ
が結構あの話題になっていてであの
チャットGPTよりもあのかなりGPT4
よりも性能がいいということがえそのえ
クラウドのえサイトで発表というかされて
ましてはいでその中のオーパスというのが
1番制度がいいですけどもうんのオーパス
というのにはもうGPT4よりもまのき
のみあの性能がいいということでえそう
ですねえこのあのこサイトにあるんです
けどうんえなんだろうコド書かせてもいい
しとかあの休Aさしてもいいしとかあの
知識を聞いてもえGPT4よりもいいし
かつあの同じなんてですかその聞き方で
ちゃんと公平にえある程度公平にあの
GPT4と比べていいですよみたいなこと
が発表されていてはいうんなんかいいです
ねはいうんで私も試してみたところま
かなり良くてあのなんか聞いたりしてもえ
なんか自然な文章返ってきますしなんか
特にいいなと思ったのははあのPDFとか
論文を読ませてそれでこの論文について
あのPDFをアップロードして教えて
くださいって言うとなんかその論文の全体
を結構読んでくれてなんか要約してくれ
てるようななんか見方うんになったりして
ま見方というか返答になったりして結構
うん長文もいけるとか確かどっかに書いて
あったんですけどはいま長文もいけてで
あの出力も結構安定してるみたいでうん
なんかそこら辺いいなとかはい思いつつ
使っていてでうんそなんでかなりそのうん
なんかgpd法護衛というとこであの
Googleのジェミニとかはままあなん
かそこそこいいような悪いようなみたいな
感じだったんですけどうんこのクラウドに
出てきてうんこれもしかしたらうん本当に
GPTを超えてるかもなみたいなはい感じ
で触れた触れてるのはなんかすごいなって
いう感じでしたねはい私もえ有料版てみて
なんで最新の3のはいはいモデルを試して
みたんですが自分も同じように例えばえ
PDFを渡してうんじゃあこれの用語集を
作ってみたいな感じであのチャットGP用
をはいチャットGPTにもクラウドにも
両方同じプロンプトみたいなPDF渡して
これのちょっとあの仕事上必要だったんで
まその初心者の人にも分かりやすいような
用語集を作ってくださいいってやったうん
あのそうですねクラウドの方がやっぱり
制度も良くてちゃんとその日本語であの
そのPDFの撮ってきたその用語について
もちゃんと詳しくあの説明が入っていて
うんうんでタスク的にはあのクラウドの方
が良かったですしあと時間もあのどっち
かっていうとクラウド3の方があの早かっ
た気がしますね生生時間ねなんかねなん
GP4もなんか
1回投げてからなんかしばらく待たないと
なんか結果が出てこないみたいなことも
結構多いのではいなんかそういう意味では
あのクラウドの方がやりやすいなとは思っ
たんですがちょっとなんかその
コーディングタスクみたいの渡した時には
まだうん自分の中ではチャットgbtの方
があのなんか使いやすいなという感じは
少しありましたかねそうなんかそれはま
ちょっと感覚的なところもあったりするん
ですけどけどその代わりクラウドの方が
あの入力にあのあれですねマークダウン的
なものを使えるんですよねだからこうああ
そうなんだはいそうですねちょんちょん
ちょんってあのあれはなんて言ったらいい
んだえっとまこっからコードですよみたい
なあのマークダウンで書くのあると思うん
ですけどあれで書いたらあのちゃんとあの
コードの用のあのエディターと言いますか
あの色がバックグラウンドが変わってこっ
からコードみたいのが分かりやすくなって
たりとかあとは文章のあのなんだフォント
みたいなものも引き継いてくれるだから
これがタイトルでみたいななんかそういっ
たのも一応考慮してあの処理してくれるん
でまそれが邪魔になる場合もあるんです
けどはいまそういう意味ではなんだろう
一般的なタスクなんでま普段そう
いうあのエンジニアじゃない人が触るって
意味でもクラウドの方がなんかちょっと
ユーザーフレンドリーなのかなっていう
感じは少ししましたかねうんはいあとは
あれですねなんか他の人の記事ですけど
あの歌詞歌の歌詞とかもなんかクラウドの
方がなんかそれっぽい歌詞を作ってくれ
たりみたいななんかそういうところで
良かったみたいなことを言ってる人もい
ましたねうん
うんなるほど
まあなんでそうですねこれもめんどくさい
ですけどこのタスクだったらこっちみたい
な今んとこ自分は分けて
うん使うことになるの
かはいはいそうですね得意不得意ありそう
ですしうんうんはいあとは今後えっと俳句
というえモデルAIモデルが出てくる
らしくてうんそうですねそれはこのえ今
1番いいと言われてるオーパスよりも
かなりコストが軽いんすよねうんだから
相当軽いモデルであの性能はそこそこの
モデルなんじゃないかなというのが期待さ
れていてはいそうですねなんかえかなり
うんとめちゃくちゃ瞬間的な出力うんと
めちゃくちゃ早い出力を多分してくれるん
じゃないかなというところがあの俳句に
期待ですね
うんまなんで現状だとそういうもしなんか
チャット実際にそのAPI使ってチャット
を作るみたいな場合でもやっぱ速はある
程度ないとあの返答に時間かかってUX
なりなんかユーザーの体験悪くなるんで
そういった意味でもそういう早いモデル
みたいなそういう治要もちゃんとあると
思うんでうんなんか普通に検討というか
使う時にはクラウドも一応候補に入れとい
た方がいいなっていう感じはそうねします
ね
はいもまだAPIは試してないんですけど
APIアクセスもできるみたいですしはい
そうですねそれでめちゃくちゃ早いんなら
うん期待ですねうん
うんはいいこれでねもうあの20これも
20ドルでしたよね確かなのでですねはい
なんかこうリリースされるたびにね
とりあえず20ドルで使ってみてでうん
継続しようかどどうしようかなみたいな
はいうんなんか感じになってきますねうん
はいでうんもうちょっとね今ジェミには1
回申し込んだものの解約しようかなという
感じですね自分はうんはいなかなかジェミ
にはなんだろうそこまでのモチベーション
が今んとこは出てこないですねうんはい
うんそうすねちょっとね適材適性と言って
もあれね今んところはそ使いようないか
使う場面自分はないかなって感じだったり
してうん
はいえっと次の話題がトポSRこれは何
でしょうえっとこれがまた最近
スタビリティAIさんが新しく出した
えっと今度は3dのえっとオブジェクト
生成のモテルでしてえ一応月の5日ぐらい
にニュースが出てたんでまその記事から
撮ってきてますけどえトポAIっていう
えっとこれはあのサービスですねえ画像
からその3Dオブジェクトを作るま以前も
ちょっと私がYouTubeの時とかに
公開してたようなものがあるんですけどま
それのえっとトリポっていうまた別の
サービスがありましてそことスタビリティ
AIが組んでえっともう本当に素早くその
画像1枚の画像から3Dモデルを作
るっていうえモデルを公開してそれでこの
モデルがいいのがえモデルのそのコードも
えウェイトも一応MITライセンスかで
あの提供されているのでここら辺がすごい
うんうんあの扱いやすいビジネスでも利用
しやすいっていうところでま個人的には
すごいやりやすいなっていうのではいけど
あんまり話題にはなってないですねままだ
そこまでなんか利用範囲というかまどう
いうとこで使うんだろうっていうま段階か
もしれないですけどま便利なのはその画像
から3dのリアルなオブジェクトを作れ
るっていうところなんでま実際にそういう
メタバース空間とかゲームとかそういった
ところで使われるようなモデルにはなって
いくのかなと思うモデルでそれでこのえ
論文自体あの発表された論文自体ではあの
まちゃんとその今までのモデルよりも1番
あの早いしあの精度もいいみたいな制度は
1番ではないあ違うかえっと速さか速さ1
番ではないんですけどえっと精度はかなり
良くてあのそれなりの速さであの出力が
できるっていうところでえっと一応GPU
なしでもあの動かせるとかあとコード自体
もまもちろん公開されているのではい
ローカルでそのハギングフェイスから
モデルのえっとウェイトを落としてきて
あのローカルで実際に自分のえ写真とか
あのとかをえっとあげ
て処理すればその3Dモデルをえ作って
その3Dモデルをダウンロードできてそれ
をまた好きなとこに使えるっていうのが
人通りできるので
はいなんでここら辺今までもそういった
モデルはあったんですけどやっぱ
ライセンスがめどくさかったりサービスに
あの囲まれてたんでま有料で使うしかない
とかそういうパターンが多かったので無料
で自分でローカルでいくらでも使える環境
でそれでライセンスもあのこうあの
ちゃんと大丈夫っていうのはなかなか
珍しい形なんでここら辺使える人にとって
ははいなんかそれなりに色々試してみても
面白そうだなというモデルでしたねはい
うん
ええ素晴らしいあれですねスピードですね
うんGPUだとA100で
0.55mmモデルがうんとはねすごいす
ね
うんま実際に私もローカルで試してみまし
たけども30秒くらいでパパッと1つの
画像からあのモデルができたりしてはい
へえすご良かったですねうん結局普通に
サービスとかでやろうとするとま画像やっ
てからあのウェイティングリストみたいな
感じで処理を待ってうんそれでまあなんか
30分ぐらいしてやっと1つの出てくる
ぐらいなま感じだったりもするんでうん
意味ではローカルでまいくらでも動かせて
それでそれなりのGPU別にCPUだけで
も良くてっていうのははいはいまなんで
ここら辺ははいまスタビリティAIさん
あたりがはいやってくれて助かりますね
うん
うん
うんそうすねすごいすねもうほと無料と
いうかうんオープンなものでいろんなこと
ができるようになってそうですねはい
素晴らしいですねたえっと自分でえっと最
学習とかそこら辺は今んとこ一応
ギットハブで見たんですけどえっとそこら
辺は書かれてなくて単純に実行するコード
だけですね今んところはもしかしたらあの
中身はあのま決まっているあの構造には
なっているんであの分かる人にとっては
コド中読み込めばあの学習とかもできるか
もですけど今んところは多分
あのそうですねえっととりあえず予測と
いうか実行するだけの環境が提供されて
ますねうん
はいそんな感じでした
はい
えっと次はそうですね今週の分析コンペと
いうことで
今日かなええ
シグネからえシグネ会員の個人情報の漏洩
に関するお知らせと詫びというのが来て
ましたねはいはいこれは
えっとなんだろうメールによると
えウェブページの表示画面においてま
プログラミングを伴う特殊な操作をすると
え個人情報と言いますか入力してるえ使命
で話番号メールアドレス学歴職歴等の情報
がま見ることができたというようになって
いたということですねうんうんなのでま
登録する時にえ学歴とか確かどうだったけ
必須だったか2位だったかちょっと必須の
ものと2位のものがあるのでうんどれが
必須かはちょっとわか忘れちゃったんです
けどま氏名とかえ電話番号とか確か必須
だったのでそうですねうんそういう必須の
ものをププラスま学歴とか職歴とかまでも
ま特殊な操作をすると見ることができる
ようになっちゃってたとうんうんいうこと
ですねただ銀行講座情報とかクレジット
カード情報みたいなものとかパスワードと
かはま含まれていませんというとこだった
というとこですねはいうんまそういう
メールが来ていたのでそうですねまあね
ちょっと残念だなというようなとこでした
ねあのうんはい個人情報がはいあの流出し
ちゃっていたとでね私も多分登録している
のではいうんなんかうん自分の情報が出
ちゃっていたかもしれないというとこです
ねはいなんかそれで言うとなかなかかぐ
るってそういった方は前はあのなんか一応
スコアがプライベートスコアがバレちゃっ
たみたいなあのことはありましたけど意外
とかぐるってセキュリティ面ではそこまで
問題なんか把握してないだけなのか
あんまり聞かないですねそう意味ではうん
そうですねそこは硬いというかちゃんと
やっているのかもしくはあんまり情報入れ
てないのかですかまそれもありますかね
はいまあとはシグネの場合そういう転職
サイト的な要素もやっぱりあるんで
ちょっとあの個人情報も詳しく入力したり
ですする必要があるのでうんまそういった
点ではま気をつけたいところではあります
よね
かぐはいつの間にかあのえっとかぐの
ジョブスみたいななんか
あの仕事紹介みたいなやついつかなくなり
ましたもんねうんはいうんそういうのも
あってうんま余計な個人情報多分入れて
ないのかなってとこすね
うん
はい
えとそうですね今週のネタとてはこんな
とこですかね
はい
はいまそうですねま進捗と予測の進捗程度
を話しておきますと最初にも言った通り
とりあえず予測はできるようになってい
るって言ってもまだあのJリーグの公式
からスクレイピングま今回のちょっと
イベント的にはそのまほとんど行動やった
ことない人でもなるべく分かるような
ちょっとビジネスよりの人を対象にして
いるのでなんでいなしはいデータあります
じゃあこれをあのもうラトgbmで分析し
ますみたいな感じでもなくまちょっとずつ
説明しながらあのままずデータをどう通っ
てきますでまスクレイピングする場合にも
まそのちゃんと気をつけないとあの不可に
なってというか万対象になったりというか
まそういうあの影響を与えたりもするので
気をつけましょうとかそういうところの話
から進めていてそれでま初回っていうこと
もあってとりあえずけど学習で結果その
予測だけはしておきたいなっていうので
本当に最低限のサイキットラーンでコード
のえっとデシジョン3でまとりあえず作っ
てみてセト率もあのとりあえず出せるよう
にしといてぐらいな感じではいまだったん
でまけどもうちょっとま当たって欲しかっ
た気もしますけどはいまあとはどうですか
ねまやっぱ引き分けえ一応去年のデータと
かを学習に使ってたんですけど去年だと
なんかこの時期3月ぐらいだとすごい
引き分けの試合数が多くてけどなんか今回
のとはそこまで引き分けは多くなくて
みたいな形でなるほどなんかそういう
なんか傾向もま色々あるからなんか色々
大変だなという気持ちでこっからどう上げ
ていくかですねはいまけど一緒にやって人
でそのサッカーのまあの実際に予測して
いる人みたいなあの人もいてその人とま
あの話しながらやったりしているのでま次
のネタというかまこの特徴料を追加したら
良さそうだなみたいのもまとりあえず何個
変るんでそこら辺から手つけていって制度
を上げていきたいなと思ってますねうん
うんうんはいでちょっと動画自体はその別
の人が今管理しているのでいつ公開される
とかはちょっとまだ私も把握できてないん
ですかままたそれがあの出る時とかには
はいおそっかうんこれから動画が公開さ
れるんですねそれのうんま一応録画はして
いますが本当に公開されるのかまでは
ちょっと分かってないですがとりあえず
イベントはあのもう開催しててはいまあの
順調なのかまとりあえず進んでるっていう
感じですね
はいいいっすね伸び代ですねまだまだまだ
予測モデルもうん伸ばせるしはいそうはい
みたいなことを最近はしてますかね
はい
はい自分はあと何やってんのかなあと
はまそんなとこですねかぐやってたらかぐ
ばっかりになっちゃってうんでとこすね
はいとちょっと最近は仕事の方も微妙に
なんか新しくロンチだったりあの発表はい
の資料を作んないといけなかったりではい
うんうんまあなかなかちょっとあの最近ま
ライブで聞いてる人はいいんですけどあの
ポッドキャストが更新できてないんでま
そろそろ
うんやっと落ち着きそうな予感がするんで
ぼちぼちはい公開していけたらなと思って
ますねちょうど唐揚げさんのところから
はいあの出せてないんではいまさっさと
編集してま公開していきたいす
ねうんそっかこれをポッドキャストで聞い
てくれてる方ははい何回分化一緒に今
上がったとこかもしれないですねそうです
ねはいあの一気に上がってるかもしれない
一気にかもですしねうん
はい
はいそれでは今週はこんなとこで終わり
ましょうか
はいはいそれでははい今週もありがとう
ございましたありがとうございまし
たはいそれではYouTubeも終わり
ますありがとうございました
うん
Voir Plus de Vidéos Connexes
5.0 / 5 (0 votes)