llm learning road

PODCAST · education

llm learning road

llm learning road

  1. 10

    chatgpt-pro-LLM进化史

    chatgpt-pro-LLM进化史

  2. 9

    minimax-LLM发展史与关键技术演进深度研究报告

    minimax-LLM发展史与关键技术演进深度研究报告

  3. 8

    doubao-大模型+LLM+发展脉络梳理

    doubao-大模型+LLM+发展脉络梳理

  4. 7

    qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南

    qwen-大模型进化图谱:从技术跃迁、厂商博弈到开发者生存指南

  5. 6

    DeepseekMath

    00:00:00 Start00:17:41 DeepSeekMathBase+7B+的数学能力评估00:27:47 DeepSeekMath-RL+的训练与评估00:40:24 探索抗噪声奖励信号的算法00:46:35 DPO、PPO+和+GRPO+的目标及梯度00:51:30 Closing

  6. 5

    instructGPT

    00:00:00 Start00:18:49 InstructGPT:在不同方面的表现与改进00:28:34 Closing

  7. 4

    ReAct

    00:00:00 Start00:19:25 ReAct+Outperforms+Other+Methods+in+Tasks00:28:34 ReAct+在+ICLR+2023+会议论文中发布00:34:25 ICLR+2023+会议论文中的实验00:43:45 ReAct+在+ALFWorld+中的刀具清洁问题00:51:15 Closing

  8. 3

    deepseek V3.2

    deepseek V3.200:00:00 Opening00:30:00 Main Discussion

  9. 2

    deepseek-R1

    DeepSeek R1 full discussion and segmented playback.OUTLINE00:00:00 Opening00:16:02 DeepSeek R1 - Segment 100:29:54 DeepSeek R1 - Segment 200:47:34 DeepSeek R1 - Segment 300:56:22 DeepSeek R1 - Segment 401:04:21 DeepSeek R1 - Segment 501:15:42 DeepSeek R1 - Segment 601:26:49 DeepSeek R1 - Segment 701:42:33 DeepSeek R1 - Segment 802:00:42 DeepSeek R1 - Segment 902:12:45 DeepSeek R1 - Segment 1002:21:42 DeepSeek R1 - Segment 1102:24:38 Ending

  10. 1

    硅谷坐标 x 田渊栋: 解析大模型护城河、记忆存储瓶颈与Agent对社会冲击

    田渊栋(Meta AI/FAIR,强化学习与大模型推理/长上下文方向)分享对大模型竞争格局、模型“记忆”机制、长上下文与存储瓶颈、推理路线,以及 Agent 时代社会冲击的判断与观察。### 内容要点- 大模型护城河:数据/算法/infra/人才- 两种记忆:上下文(工作记忆)与权重(世界观)- 长上下文与存储供应链瓶颈- Agent 形态与社会影响

Type above to search every episode's transcript for a word or phrase. Matches are scoped to this podcast.

Searching…

No matches for "" in this podcast's transcripts.

Showing of matches

No topics indexed yet for this podcast.

Loading reviews...

ABOUT THIS SHOW

llm learning road

HOSTED BY

zc

URL copied to clipboard!