EPISODE · Feb 19, 2026 · 45 MIN
#426.谷歌传奇 Jeff Dean 深度访谈:Gemini 的演进、硬件协同与 AI 编程的未来
from 跨国串门儿计划
📝 本期播客简介本期我们克隆了:硅谷前沿 AI 播客《Latent Space》The AI Frontier: from Gemini 3 Deep Think distilling to Flash — Jeff Dean本期嘉宾是谷歌(Google)的首席 AI 科学家、分布式系统与深度学习领域的泰斗级人物 Jeff Dean。在这场深度对话中,Jeff Dean 揭秘了 Gemini 系列模型背后的设计哲学。你将听到他如何解释“为了得到强的小模型,必须先做出大的”这一蒸馏逻辑,以及他如何从能量消耗的底层视角重新定义批处理(Batching)的必要性。Jeff 还回顾了 Google Brain 的诞生往事,分享了他在 1990 年本科论文中就展现出的对神经网络规模化的预见性。此外,他详细探讨了硬件与算法协同设计的复杂周期,并对未来 AI 编程中“人机交互”与“需求描述”的范式转移给出了深刻见解。这不仅是一场技术盛宴,更是顶级科学家对 AI 工业化未来的终极推演。👨⚕️ 本期嘉宾Jeff Dean,谷歌首席 AI 科学家,谷歌大脑(Google Brain)的联合创始人。他是分布式系统(如 MapReduce, BigTable, Spanner)和深度学习框架(TensorFlow)的核心贡献者。作为 AI 领域的传奇人物,他目前领导谷歌在 Gemini 模型、TPU 硬件研发以及前沿 AI 应用方面的探索。⏱️ 时间戳00:00 开场 & 播客简介模型演进与蒸馏策略02:24 帕累托前沿:为何必须先做大模型才能得到强的小模型04:13 蒸馏技术的起源:从 2014 年的图像识别到如今的 Gemini06:23 Gemini Flash 的经济学:低延迟如何改变用户习惯08:48 需求与能力的博弈:为什么模型变强后用户要求会更高硬件与算法的协同设计14:35 程序员必知的延迟数字:从能量消耗视角看批处理(Batching)的本质18:58 TPU 的设计哲学:如何预测未来两到六年的计算需求21:00 低精度与投机采样:提升能效比的关键技术22:56 强化学习的下一站:如何解决不可验证领域的评估难题规模化与通用能力的突破25:05 从专用模型到通用模型:为何符号系统不再是数学竞赛的标配28:04 1990 年的本科论文:Jeff Dean 对神经网络规模化的早期坚持30:56 茶歇间的灵感:Google Brain 的诞生与“规模化”信条33:12 Gemini 的诞生:整合 Google Brain 与 DeepMind 的幕后故事AI 编程与未来预测35:14 “管理五十个实习生”:AI 时代的编程范式转移37:14 需求描述的艺术:为什么写清楚技术规范变得前所未有的重要40:47 延迟降低 50 倍的可能性:未来系统的实时互动体验41:43 终极预测:个性化模型与每秒万级 Token 的推理时代🌟 精彩内容💡 蒸馏的“母体”逻辑Jeff Dean 强调了前沿大模型在生态中的核心地位。他认为,为了获得一个高性价比、低延迟的小模型(如 Gemini Flash),你必须先拥有一个能力溢出的前沿模型作为“老师”。通过蒸馏技术,大模型的逻辑和行为被压缩进小模型中,使其在特定尺寸下展现出超越前代的性能。🔋 能量视角下的计算效率Jeff 提供了一个极其硬核的视角:计算的本质是能量损耗。他指出,在芯片内移动数据的成本(约 1000 皮焦耳)远高于一次乘法运算(约 1 皮焦耳)。这一物理事实决定了“批处理”在 AI 推理中的不可替代性——你必须通过增加 Batch Size 来摊薄数据移动的能量成本。🛠️ 硬件与算法的“双向奔赴”TPU 的研发是一个跨越 2-6 年的预测游戏。Jeff 揭秘了谷歌如何通过“协同设计”让硬件团队与模型专家对话。这种机制允许他们在芯片架构中加入实验性特性,以适配未来可能流行的算法(如稀疏模型或低精度计算),从而在技术浪潮中保持领先。📝 需求描述:AI 时代的硬技能在谈到 AI 编程时,Jeff 提出了一个有趣的观点:以前没人看的“技术规范文档”现在成了驱动 Agent 的核心。因为 Agent 的输出质量直接取决于描述的精确度。未来优秀的工程师将不再是“写代码的人”,而是能清晰定义边缘案例、性能目标和系统架构的“需求大师”。🚀 每秒万级 Token 的未来Jeff 预测,当推理延迟降低 20-50 倍,且每秒能生成一万个 Token 时,AI 的运作方式将发生质变。这一万个 Token 中,可能只有一千个是最终代码,剩下九千个都是背后的“思维链”推理。这种高强度的自我检查将使 AI 生成的内容比人类手写的更加稳健可靠。🌐 播客信息补充本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
NOW PLAYING
#426.谷歌传奇 Jeff Dean 深度访谈:Gemini 的演进、硬件协同与 AI 编程的未来
No transcript for this episode yet
Similar Episodes
May 14, 2026 ·7m
May 12, 2026 ·2m
May 12, 2026 ·7m
May 11, 2026 ·32m
May 8, 2026 ·2m
May 6, 2026 ·3m