EPISODE · Apr 25, 2026 · 37 MIN
#509.前字节研究员深度访谈:中国AI的真实差距、刷榜文化与Agent新赛道
from 跨国串门儿计划
📝 本期播客简介本期我们克隆了播客《Into Asia》的一期深度对谈A Year Inside ByteDance's AI Lab【编者述:该内容存在争议,x 上有评论认为该研究者并未接触到字节AI 的核心项目,仅作为信息和视角补充】主持人 Cheche 与北京大学助理教授、前字节跳动研究员 Chu Chu 坦诚交流了中国人工智能领域的竞争与挑战。Chu Chu 曾深度参与大语言模型的研发,对中美 AI 差距有着一线观察。在节目里,他揭示了中国 AI 公司内部刷榜文化的真相,分析了芯片禁令下数据蒸馏的无奈,并尖锐指出中美 AI 差距其实正在拉大。从字节跳动的 IMO 数学竞赛项目,到北大推理效率算法的新方向,再到具身智能与 AI Agent 的中国机会,这场对话带来了一位圈内人最真实的反思与预判。👨🔬 本期嘉宾Chu Chu,北京大学助理教授,前字节跳动 Seed 部门研究员,加州大学洛杉矶分校(UCLA)博士。他曾先后在北京通用人工智能研究院(通院)和字节跳动工作,亲历了中国大语言模型从追赶 GPT-4o 到被 DeepSeek 冲击的全过程,目前专注于 AI 推理效率与具身智能的研究。⏱️ 时间戳00:00 开场 & 节目简介嘉宾背景与 AI 之路01:33 从吴恩达课程到 UCLA 博士03:10 跟随朱松纯归国:数据驱动与规模假设的争论04:12 在通院的日子:ChatGPT 如何改变 AI 研究格局05:51 加入字节跳动:SEED 的诞生与 DeepSeek 的震撼字节的 AI 战场:刷榜、资源与隐形压力07:23 “我们以为追上了 GPT-4o,直到 DeepSeek 出现”08:07 形式化数学与 IMO 金牌项目:公关还是科研?09:35 SEED 内部结构:LLM、VLM 与数学组的分工11:04 刷榜文化:基准分数如何定义你的成败12:35 午休两小时、九小时工作制:字节 AI 研究员的一天14:11 从银牌到交付:当研究兴趣被工程琐事消磨17:16 谷歌三个月迭代一轮,我们要半年:速度差距的背后18:16 特供版 H20、禁运前抢购的 H100:字节的芯片家底19:43 国产芯片为什么训练用不上?21:14 追赶者缺乏创新:中美差距真的在缩小吗?差距拉大的本质:蒸馏、数据与基础设施21:57 Claude Code 让我不想再招博士生:编程智能体的震撼22:48 用户反馈循环:美国模型的真正护城河24:25 离开字节的原因:大厂 LLM 工程其实很无聊26:04 北大新方向:推理效率提升 5%,就能省下天量成本27:50 捷径的代价:中国公司为何沉迷数据蒸馏?29:01 什么是蒸馏?用 GPT 的答案训练自己的模型30:06 AGI 信仰与现实:智能体如何重构工程师的角色具身智能与下一代 Agent31:16 制造业优势:中国可能在具身智能赛道领先32:20 宇树机器人擅舞却不擅“思”:运动控制与智能操作的鸿沟33:31 如何让机器拥有灵巧操作的能力?34:12 Open Claw 与 Vibe Research:当研究生开始让智能体帮自己盯实验35:23 智能体的隐私陷阱与使用边界36:17 中国程序员正在用 Claude Code 写中国的大语言模型?37:05 结语🌟 精彩内容💡 中美 AI 差距反而在拉大?Chu Chu 坦言,尽管在部分基准上中国模型看似追平,但实际体验和智能涌现上的差距仍在扩大。核心原因是用户反馈循环的断裂和基础设施的全面落后。“我认为我们还远远落后,而且差距还在越拉越大,这真的很让人难过。”💡 刷榜文化才是真正的压力在字节等大厂,每个团队紧盯着自己负责的基准分数,却没有将表现转化为真实场景中的好用体验。“从论文上看,中国的每一家大厂都有一个不错的模型,但以我自己的使用体验来说,我并不觉得它们真的够好。”💡 蒸馏:被卡住脖子的中国 AI 在走捷径为快速获取高质量训练数据,不少中国公司直接查询 GPT、Claude 等模型,将答案塞进自己的训练集。这种蒸馏虽然省时省钱,却让企业迟迟建不起自主的数据管道,形成恶性循环。💡 推理成本才是烧钱大户训练模型的成本固然高昂,但 Chu Chu 指出,真正吃掉利润的是部署后的推理算力。“如果能从算法上让推理效率提高一点点,哪怕百分之五,给公司省下的钱也会非常可观。” 这也是他回归北大后的主攻方向。💡 具身智能:中国的下一张王牌凭借全球领先的硬件制造能力,尤其在电机和本体方面,中国在具身机器人领域优势明显。但如何让宇树这样的机器人拥有真正的大脑——灵巧地拿起杯子、走进千家万户——仍是待解难题。💡 智能体正在承包科研工作他的学生已经开始用 Open Claw 监控模型训练、自动调试 Bug,团队甚至提出“Vibe Research”的概念:设定一个监控任务,就让智能体去完成,自己直接去睡觉。🌐 播客信息补充翻译克隆自:本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
NOW PLAYING
#509.前字节研究员深度访谈:中国AI的真实差距、刷榜文化与Agent新赛道
No transcript for this episode yet
Similar Episodes
May 14, 2026 ·7m
May 12, 2026 ·2m
May 12, 2026 ·7m
May 11, 2026 ·32m
May 8, 2026 ·2m
May 6, 2026 ·3m