-
10
chatgpt-pro-LLM进化史
chatgpt-pro-LLM进化史
-
9
minimax-LLM发展史与关键技术演进深度研究报告
minimax-LLM发展史与关键技术演进深度研究报告
-
8
doubao-大模型+LLM+发展脉络梳理
doubao-大模型+LLM+发展脉络梳理
-
7
qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南
qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南
-
6
DeepseekMath
00:00:00 Start00:17:41 DeepSeekMathBase+7B+的数学能力评估00:27:47 DeepSeekMath-RL+的训练与评估00:40:24 探索抗噪声奖励信号的算法00:46:35 DPO、PPO+和+GRPO+的目标及梯度00:51:30 Closing
-
5
instructGPT
00:00:00 Start00:18:49 InstructGPT:在不同方面的表现与改进00:28:34 Closing
-
4
ReAct
00:00:00 Start00:19:25 ReAct+Outperforms+Other+Methods+in+Tasks00:28:34 ReAct+在+ICLR+2023+会议论文中发布00:34:25 ICLR+2023+会议论文中的实验00:43:45 ReAct+在+ALFWorld+中的刀具清洁问题00:51:15 Closing
-
3
deepseek V3.2
deepseek V3.200:00:00 Opening00:30:00 Main Discussion
-
2
deepseek-R1
DeepSeek R1 full discussion and segmented playback.OUTLINE00:00:00 Opening00:16:02 DeepSeek R1 - Segment 100:29:54 DeepSeek R1 - Segment 200:47:34 DeepSeek R1 - Segment 300:56:22 DeepSeek R1 - Segment 401:04:21 DeepSeek R1 - Segment 501:15:42 DeepSeek R1 - Segment 601:26:49 DeepSeek R1 - Segment 701:42:33 DeepSeek R1 - Segment 802:00:42 DeepSeek R1 - Segment 902:12:45 DeepSeek R1 - Segment 1002:21:42 DeepSeek R1 - Segment 1102:24:38 Ending
-
1
硅谷坐标 x 田渊栋: 解析大模型护城河、记忆存储瓶颈与Agent对社会冲击
田渊栋(Meta AI/FAIR,强化学习与大模型推理/长上下文方向)分享对大模型竞争格局、模型“记忆”机制、长上下文与存储瓶颈、推理路线,以及 Agent 时代社会冲击的判断与观察。### 内容要点- 大模型护城河:数据/算法/infra/人才- 两种记忆:上下文(工作记忆)与权重(世界观)- 长上下文与存储供应链瓶颈- Agent 形态与社会影响
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
Loading similar podcasts...