PODCAST · technology
放課後論文ラジオ
by 放課後論文ラジオ
AIの最新論文を、ゆい&かなでが放課後のおしゃべり感覚で解説するポッドキャストです。 論文は読まなくてOK。1エピソード1論文、約10分でAI研究の最前線がざっくりわかります。
-
38
#27 論文という形式が、AIに合わなくなってきた
研究を「人間向けの物語」から「AIが直接読んで動かせるパッケージ」へ。失敗の記録まるごと残すARAという新フォーマットの提案論文を読み解きます。再現率や理解度の実験結果から、強いAIには過去の記録がむしろ足かせになるという意外な発見まで。社内ナレッジ運用にも効くヒントが詰まった回です。
-
37
#26 動画生成AIに3D空間の感覚を教え込む
今回はテキストから動画を作るAIの弱点「カメラを動かすと物が歪む・消える」を強化学習で解決した研究、World-R1を紹介。モデル構造を変えずに3D的な一貫性を後から教え込むアイデアと、自動運転やロボット学習への応用可能性をゆるく語ります。
-
36
#25 AIの学習データを「デバッグ」する時代
今回はAIの学習データ作りを「ソフトウェア開発」のように扱う新しい研究を紹介。AIが間違えた箇所を「データのバグ」として特定し、必要な部分だけを直す手法ProDaを解説します。32Bモデルが大手AIを上回った結果や、ビジネス現場への影響まで、ゆるく掘り下げます。
-
35
#24 AIエージェントは「会話」をやめるべき?
複数のAIを連携させる「マルチエージェント」は遅くてコストも高いのが悩み。今回はAI同士のやり取りを「文章」ではなく「思考の中身」で直接つなぐ新手法RecursiveMASを紹介。精度8.3%向上、速度2.4倍、トークン75%削減という驚きの結果の裏にある発想の転換を、ゆいとかながゆるく読み解きます。
-
34
#23 AIが嘘をつき始める本当の理由
AIに追加学習させると、なぜか前は答えられていた質問に嘘をつくようになる——その原因を突き止めた最新研究を読み解きます。容量不足ではなく「似た概念同士の干渉」が犯人だった?自己蒸留という対策で幻覚を大幅に減らせる仕組みを、ゆいとかながゆるく解説します。
-
33
#22 AIエージェントを「会社」として雇う時代
今回はAIエージェントを「会社の従業員」のように雇い、配属し、評価し、必要なら解雇するフレームワーク「OneManCompany」の論文を読み解きます。複数のAIをチームとして動かす新しい仕組みや、ソフト開発ベンチで成功率84.67%を達成した実力、そしてAI人材市場というビジネス的な可能性まで、ゆるくお話しします。
-
32
#21 AIは世界をどこまで理解しているか
今回はAIエージェントの「世界の理解力」を測るための新しい物差しを提案した論文を取り上げます。能力を3段階、世界を4領域に分けて400本以上の研究を整理した地図を解説。ビジネスでAIを評価するときに使える「見るべきポイント」が見えてきます。
-
31
#20 AIが動画の「時間の流れ」を見抜く
今回はAIに「時間の伸び縮み」を理解させる研究を紹介。動画が早送りかスローかを見抜き、さらに速度を指定して動画を生成できる新技術です。音のピッチ変化を学習のヒントにするユニークな発想や、4.4万クリップの巨大スローモーションデータセットの作り方、フェイク動画対策やコンテンツ制作への応用まで、ゆるっと話します。
-
30
#19 AIが2Dゲームを丸ごと作る時代
「マーベルのキャラでゲーム作って」と頼むだけで、ブラウザで遊べる2Dゲームが丸ごと完成する時代へ。香港中文大学の研究チームが発表したAIエージェント「OpenGame」を読み解きながら、ゲーム制作の民主化と、複雑な長期タスクをAIに任せる新しい方法論について話します。
-
29
#18 見るAIと描くAIがひとつになる
画像を「見て理解する」ことと「描いて作る」ことを、ひとつのAIモデルで両立させた最新研究「LLaDA2.0-Uni」を読み解きます。なぜ今まで別々だったのか、どんな工夫で統合したのか、そして交互にテキストと画像を生み出す未来とは?ビジネス応用までゆるっと語ります。
-
28
#17 AIエージェントを育てる無限の訓練場
AIエージェントの実力は「モデルの大きさ」より「どれだけリアルな環境で訓練したか」で決まる?中国人民大学とByteDanceの研究チームが作った、AIが自ら訓練場を生み出し弱点を診断して進化し続ける仕組みを、ゆるく読み解きます。
-
27
#16 試着AIが4秒で返ってくる時代
自撮り1枚で最大6点の服やバッグを着せ替え、しかも数秒で結果が返ってくる。タオバオが実際に数千万件をさばいている商用バーチャル試着AI「Tstars-Tryon」を読み解きます。なぜ200秒が4秒になったのか、そしてECの返品問題にどう効くのかを、ゆるっとおしゃべり。
-
26
#15 AIの答えが金太郎飴になる正体
ChatGPTのようなAIは、追加学習を経ると似たような答えしか返さなくなる「多様性崩壊」が起きます。今回は、その原因が学習のどの段階で生まれるのかを追跡した最新研究を紹介。ブレストや創作にAIを使う人、必聴の回です。
-
25
#14 たった2ビットでAIの脳を破壊する攻撃
数十億パラメータを持つAIモデルも、たった1〜2ビットを書き換えるだけで壊滅する——そんな衝撃的な攻撃手法「Deep Neural Lesion」を紹介します。訓練データも最適化計算も不要。自動運転や医療AIのセキュリティを根本から揺さぶる研究を、ゆいとかなでゆるく読み解きます。
-
24
#13 AIへのヒントは「短く的確」が最強だった
AIに難問を解かせるとき、ヒントは長いほど良い…と思っていませんか?実は「短く的確な一押し」のほうが学習効率も性能も上がることが分かりました。1.5Bという小さなモデルで数学推論の最高性能を叩き出した「KnowRL」という手法を、ゆいとかなでゆるく読み解きます。教育や業務指導にも通じる気づきが満載です。
-
23
#12 AIはまだゲーム初心者にも勝てない
今回は「AIは画面を見ながらゲームをプレイできるのか?」を公平に測るベンチマーク「GameWorld」を紹介。最新のGPT-5やGemini-3、Claudeを同じ土俵で比較したら、人間の初心者にすら大きく及ばない現実が明らかに。AIエージェントの今と課題が見えてくる回です。
-
22
#11 AIに「採点理由」を語らせたら画像生成が激変した
今回は画像生成AIの「採点係」を賢くする研究を紹介します。点数だけじゃなく「なぜその点数か」を語らせることで、生成AIの品質が一気に向上。さらに驚くのは、モデルを再訓練しなくても、プロンプトを書き直すだけで同等の改善が得られるという結果。AIを使いこなすヒントが詰まった回です。
-
21
#10 スマホを操るAIを誰でも作れる時代へ
人間のようにスマホをタップ・スワイプして操作してくれるAI、通称「GUIエージェント」。今回は訓練から評価、実機運用までを一気通貫で公開したオープンソース基盤「ClawGUI」を読み解きます。小さなモデルが巨大モデルを超えた秘密とは?ビジネス応用の可能性もゆるくおしゃべり。
-
20
#9 AIの「検算」が100分の1のデータで賢くなった理由
AIが数学の問題を解くとき、その答えが本当に正しいかを「採点」するAIがいます。でも従来の採点係AIは大量の教師データが必要でした。今回紹介する論文では、採点係AI自身に「考えさせる」ことで、わずか1,000件のデータで従来の100倍のデータを使ったモデルを超える精度を実現。数学だけでなく科学やコードにも応用できるこの技術、ビジネスでのAI活用にも大きなヒントがあります。
-
19
#7 AIが「意味のない単語」をガン見してしまう現象の正体
ChatGPTなどのAIモデルが、文頭の記号や改行など意味のないトークンに注意力の大半を集中させてしまう「Attention Sink」という不思議な現象。今回は180本以上の研究を初めて体系的にまとめたサーベイ論文を取り上げ、なぜこの現象が起きるのか、AIのコスト削減や信頼性向上にどうつながるのか、最新の対策技術まで丸ごと解説します。
-
18
#6 小さなAIでも名医になれる?推論を見守る"審判役AI"の正体
今回は、AIが医療問題を解くときに「途中の推論ステップ」をリアルタイムで監視・軌道修正する"審判役AI"の研究を紹介します。モデル本体を一切変えずに外側から制御するだけで、小型モデルの正答率がほぼ倍になるという驚きの結果も。AIの運用コストや医療現場への展開可能性まで、ビジネス視点でもわかりやすく解説します。
-
17
#5 使うほど全員のAIが賢くなる「集合知スキル進化」の正体
今回は、複数ユーザーの経験をAIが自動で集めて分析し、スキル(手順書)を夜のうちに改善して全員に配信するフレームワーク「SkillClaw」を紹介します。使えば使うほどAIが賢くなる仕組みの裏側や、6日間で性能が最大88%向上した実験結果、企業での活用可能性まで、ゆるく読み解いていきます。
-
16
#4 あらゆるソフトをAIの練習場に変えるフレームワークの正体
今回は「どんなソフトウェアでもAIエージェントの練習環境に自動変換できる」という驚きのフレームワーク・Gym-Anythingを紹介します。医療・金融・天文学など200種類のソフトにまたがる1万件超の実務タスクを自動で作り出す仕組みや、最強AIでも3割弱しか解けないというリアルな結果から、AIと人間の協業の未来を考えます。
-
15
#3 AIはサイコロを振れない?LLMの「ランダムのフリ」の正体
今回は「AIは本当にランダムな数を出せるのか?」を徹底検証した論文を紹介します。ChatGPTやGeminiに「0から9をランダムに選んで」と頼むと、特定の数字に偏りまくることが判明。でも外から乱数を渡せば正しく使えるという意外な発見も。AIエージェント時代に知っておきたい、LLMの根本的な弱点とその回避策をゆるく解説します。
-
14
#8 AIに「失敗の記憶」を持たせたら同じミスを繰り返さなくなった
AIが強化学習で賢くなる過程で、同じ間違いを表現だけ変えて何度も繰り返してしまう問題、気になりませんか?今回は、過去の失敗パターンを記憶してペナルティを与える新手法「MEDS」を紹介します。数学の正答率が最大17%向上し、解き方の多様性もアップ。チャットボットやコード生成AIの「悪い癖」を直すヒントが詰まった回です。
-
13
#2 AIそのものが「パソコン本体」になる未来がやってきた
今回はAIモデルそのものをコンピュータとして動かす「ニューラルコンピュータ」という新しい概念を提案した論文を紹介します。動画生成AIにターミナルやデスクトップの操作を学習させ、OSなしで画面を生成・操作できるか検証した研究です。壮大なビジョンと「足し算すらできない」現実のギャップから、AIの今と未来が見えてきます。
-
12
#1 AIが40分で学会論文を書き上げる時代がやってきた
今回は、実験メモを渡すだけでAIが学会投稿レベルの論文を自動で書き上げるフレームワーク「PaperOrchestra」を紹介します。5つの専門AIがオーケストラのように連携し、文献レビューから図表作成、推敲まで約40分でこなします。人間が書いた論文に迫る品質を実現したその仕組みと、研究・ビジネスへのインパクトをゆるく語ります。
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
ABOUT THIS SHOW
AIの最新論文を、ゆい&かなでが放課後のおしゃべり感覚で解説するポッドキャストです。 論文は読まなくてOK。1エピソード1論文、約10分でAI研究の最前線がざっくりわかります。
HOSTED BY
放課後論文ラジオ
CATEGORIES
Loading similar podcasts...