-
10
chatgpt-pro-LLM进化史
chatgpt-pro-LLM进化史
-
9
minimax-LLM发展史与关键技术演进深度研究报告
minimax-LLM发展史与关键技术演进深度研究报告
-
8
doubao-大模型+LLM+发展脉络梳理
doubao-大模型+LLM+发展脉络梳理
-
7
qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南
qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南
-
6
DeepseekMath
00:00:00 Start00:17:41 DeepSeekMathBase+7B+的数学能力评估00:27:47 DeepSeekMath-RL+的训练与评估00:40:24 探索抗噪声奖励信号的算法00:46:35 DPO、PPO+和+GRPO+的目标及梯度00:51:30 Closing
-
5
instructGPT
00:00:00 Start00:18:49 InstructGPT:在不同方面的表现与改进00:28:34 Closing
-
4
ReAct
00:00:00 Start00:19:25 ReAct+Outperforms+Other+Methods+in+Tasks00:28:34 ReAct+在+ICLR+2023+会议论文中发布00:34:25 ICLR+2023+会议论文中的实验00:43:45 ReAct+在+ALFWorld+中的刀具清洁问题00:51:15 Closing
-
3
deepseek V3.2
deepseek V3.200:00:00 Opening00:30:00 Main Discussion
-
2
deepseek-R1
DeepSeek R1 full discussion and segmented playback.OUTLINE00:00:00 Opening00:16:02 DeepSeek R1 - Segment 100:29:54 DeepSeek R1 - Segment 200:47:34 DeepSeek R1 - Segment 300:56:22 DeepSeek R1 - Segment 401:04:21 DeepSeek R1 - Segment 501:15:42 DeepSeek R1 - Segment 601:26:49 DeepSeek R1 - Segment 701:42:33 DeepSeek R1 - Segment 802:00:42 DeepSeek R1 - Segment 902:12:45 DeepSeek R1 - Segment 1002:21:42 DeepSeek R1 - Segment 1102:24:38 Ending
-
1
硅谷坐标 x 田渊栋: 解析大模型护城河、记忆存储瓶颈与Agent对社会冲击
田渊栋(Meta AI/FAIR,强化学习与大模型推理/长上下文方向)分享对大模型竞争格局、模型“记忆”机制、长上下文与存储瓶颈、推理路线,以及 Agent 时代社会冲击的判断与观察。### 内容要点- 大模型护城河:数据/算法/infra/人才- 两种记忆:上下文(工作记忆)与权重(世界观)- 长上下文与存储供应链瓶颈- Agent 形态与社会影响
We're indexing this podcast's transcripts for the first time — this can take a minute or two. We'll show results as soon as they're ready.
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
Loading similar podcasts...