PODCAST · education

llm learning road

by zc

llm learning road

Subscribe · 0 Bookmark

10

chatgpt-pro-LLM进化史

chatgpt-pro-LLM进化史

Mar 19, 2026

1h 20m
9

minimax-LLM发展史与关键技术演进深度研究报告

minimax-LLM发展史与关键技术演进深度研究报告

Mar 19, 2026

1h 11m
8

doubao-大模型+LLM+发展脉络梳理

doubao-大模型+LLM+发展脉络梳理

Mar 19, 2026

1h 27m
7

qwen-大模型进化图谱：从技术跃迁、厂商博弈到开发者生存指南

qwen-大模型进化图谱：从技术跃迁、厂商博弈到开发者生存指南

Mar 19, 2026

31m
6

DeepseekMath

00:00:00 Start00:17:41 DeepSeekMathBase+7B+的数学能力评估00:27:47 DeepSeekMath-RL+的训练与评估00:40:24 探索抗噪声奖励信号的算法00:46:35 DPO、PPO+和+GRPO+的目标及梯度00:51:30 Closing

Mar 19, 2026

51m
5

instructGPT

00:00:00 Start00:18:49 InstructGPT：在不同方面的表现与改进00:28:34 Closing

Mar 19, 2026

28m
4

ReAct

00:00:00 Start00:19:25 ReAct+Outperforms+Other+Methods+in+Tasks00:28:34 ReAct+在+ICLR+2023+会议论文中发布00:34:25 ICLR+2023+会议论文中的实验00:43:45 ReAct+在+ALFWorld+中的刀具清洁问题00:51:15 Closing

Mar 19, 2026

51m
3

deepseek V3.2

deepseek V3.200:00:00 Opening00:30:00 Main Discussion

Mar 17, 2026

40m
2

deepseek-R1

DeepSeek R1 full discussion and segmented playback.OUTLINE00:00:00 Opening00:16:02 DeepSeek R1 - Segment 100:29:54 DeepSeek R1 - Segment 200:47:34 DeepSeek R1 - Segment 300:56:22 DeepSeek R1 - Segment 401:04:21 DeepSeek R1 - Segment 501:15:42 DeepSeek R1 - Segment 601:26:49 DeepSeek R1 - Segment 701:42:33 DeepSeek R1 - Segment 802:00:42 DeepSeek R1 - Segment 902:12:45 DeepSeek R1 - Segment 1002:21:42 DeepSeek R1 - Segment 1102:24:38 Ending

Mar 17, 2026

2h 30m
1

硅谷坐标 x 田渊栋：解析大模型护城河、记忆存储瓶颈与Agent对社会冲击

田渊栋（Meta AI/FAIR，强化学习与大模型推理/长上下文方向）分享对大模型竞争格局、模型“记忆”机制、长上下文与存储瓶颈、推理路线，以及 Agent 时代社会冲击的判断与观察。### 内容要点- 大模型护城河：数据/算法/infra/人才- 两种记忆：上下文（工作记忆）与权重（世界观）- 长上下文与存储供应链瓶颈- Agent 形态与社会影响

Mar 17, 2026

1h 01m

Type above to search every episode's transcript for a word or phrase. Matches are scoped to this podcast.

Searching…

No matches for "" in this podcast's transcripts.

Showing of matches

No topics indexed yet for this podcast.

Loading reviews...

Share your thoughts

ABOUT THIS SHOW

llm learning road

HOSTED BY

chatgpt-pro-LLM进化史

minimax-LLM发展史与关键技术演进深度研究报告

doubao-大模型+LLM+发展脉络梳理

qwen-大模型进化图谱：从技术跃迁、厂商博弈到开发者生存指南

DeepseekMath

instructGPT

ReAct

deepseek V3.2

deepseek-R1

硅谷坐标 x 田渊栋： 解析大模型护城河、记忆存储瓶颈与Agent对社会冲击

Authentication Required

硅谷坐标 x 田渊栋：解析大模型护城河、记忆存储瓶颈与Agent对社会冲击