#279.英伟达CTO谈AI时代的计算前沿与未来 episode artwork

EPISODE · Oct 28, 2025 · 33 MIN

#279.英伟达CTO谈AI时代的计算前沿与未来

from 跨国串门儿计划

📝 本期播客简介本期我们克隆了知名科技播客,邀请到英伟达(NVIDIA)的首席技术官Michael Kagan进行深度对话。Michael Kagan是半导体行业的传奇人物,曾是英特尔的首席架构师,后联合创办Mellanox并担任CTO。Mellanox于2019年被英伟达收购后,Michael成为英伟达AI计算平台主导地位的关键推动者,拥有四十多年推动计算前沿发展的经验。对话围绕Mellanox被英伟达收购的里程碑事件展开,Michael详细阐述了Mellanox的互连技术如何成为英伟达AI帝国不可或缺的基石,实现了从单个芯片到数十万个芯片的协同工作,以及高速网络在分布式计算中如何克服通信瓶颈。他深入探讨了构建和管理十万甚至百万级GPU集群所面临的独特挑战,包括硬件故障的预设应对、跨数据中心的光速限制、以及如何通过软件和网络设计来优化效率和能耗。Michael还剖析了AI训练与推理工作负载的演变,特别是生成式AI如何让推理变得同样计算密集,甚至可能超越训练的需求,并展望了未来针对不同推理阶段的GPU优化方向。他分享了英伟达与英特尔合作的愿景,强调英伟达“双赢”的企业文化——不是瓜分现有蛋糕,而是共同做大市场。最后,Michael展望了AI的科幻未来,从AI模拟历史到AI发现物理定律,并提出了每年十倍性能增长的“黄加Kagan定律”,将AI比作改变世界的“思想的宇宙飞船”。翻译克隆自:Nvidia CTO Michael Kagan: Scaling Beyond Moore's Law to Million-GPU Clusters👨‍⚕️ 本期嘉宾Michael Kagan,英伟达首席技术官(CTO)。他曾是英特尔的首席架构师,后联合创办Mellanox并担任CTO。Mellanox于2019年被英伟达收购后,Michael成为英伟达AI计算平台主导地位的关键推动者。⏱️ 时间戳00:00 开场 & 播客简介NVIDIA的“双赢”文化与Mellanox的关键作用02:31 NVIDIA的“双赢”文化:做大蛋糕而非瓜分03:08 嘉宾介绍:Michael Kagan的传奇职业生涯04:50 Mellanox为何成为NVIDIA AI帝国的基石05:00 AI时代算力需求指数级增长:超越摩尔定律05:41 高速网络在AI扩展中的核心地位:纵向与横向扩展06:31 NVLink:GPU内部的纵向扩展技术07:15 GPU:一个系统而非单一芯片08:13 横向扩展:分布式计算与网络通信瓶颈09:08 Mellanox的价值:跨节点连接与任务拆分10:32 网络性能关键:窄延迟分布而非仅峰值带宽12:01 Bluefield DPU:数据中心操作系统的计算平台13:09 Mellanox与NVIDIA的成功合并:双向奔赴构建超大规模GPU集群的挑战13:39 10万+ GPU集群的挑战:硬件故障与软件设计14:32 单一任务在整个数据中心运行的特殊性16:06 跨数据中心部署:光速限制与延迟管理17:01 SpectrumX:边缘设备助力拥塞控制AI训练与推理工作负载的演变及优化18:16 训练与推理工作负载的差异19:20 生成式AI如何让推理变得计算密集20:03 推理的两个阶段:预填充与解码20:45 推理需求可能超越训练:模型训练一次,推理亿万次21:55 针对预填充和解码优化的专用GPU SKU数据中心扩展的物理限制与未来22:45 数据中心扩展的实际限制:能源与散热23:37 液冷技术:实现更高密度的算力24:23 吉瓦级数据中心:混凝土凝固速度的限制NVIDIA与Intel的合作愿景24:23 加速计算与通用计算的融合25:22 NVIDIA与Intel合作:共同拓展市场Mellanox被收购后的NVIDIA文化与增长26:26 NVIDIA市值45倍增长:Mellanox合并后的文化变迁27:32 Mellanox团队的成功整合与NVIDIA在以色列的扩张AI的科幻未来与“黄加Kagan定律”28:51 AI的科幻应用:实验历史与地球2模拟器29:37 AI发现物理定律:从归纳到理解30:08 “黄加Kagan定律”:每年十倍性能增长31:18 指数级增长的不可预测性:类比iPhone的变革AI的最终愿景:“思想的宇宙飞船”32:07 AI:从“思想的自行车”到“思想的宇宙飞船”33:05 AI的变革力量:如同电力般改变世界🌟 精彩内容💡 Mellanox与NVIDIA的融合:AI计算的基石Michael Kagan详细阐述了Mellanox的互连技术如何成为英伟达AI帝国的不可或缺的基石。在AI算力需求指数级增长的背景下,Mellanox的高速网络技术实现了从单个芯片到数十万个芯片的协同工作,克服了分布式计算中的通信瓶颈,是实现AI大规模扩展的关键。“英伟达有个很有意思的地方,就是它的双赢文化。我们追求的不是从现有的蛋糕里分走更大的一块,而是为所有人把蛋糕做得更大。”🛠️ 超大规模GPU集群的挑战与优化Michael深入探讨了构建和管理十万甚至百万级GPU集群所面临的独特挑战。他指出,硬件故障是必然的,因此设计必须预设应对机制;跨数据中心部署受限于光速,需要精密的网络设计来管理延迟和拥塞。NVIDIA通过Bluefield DPU和SpectrumX等技术,优化效率和能耗,将整个数据中心视为一个单一计算单元。“当你构建一个包含十万个组件的机器时,所有部件同时正常工作的概率是零。所以肯定有东西是坏的,你需要在设计之初就考虑到如何在这种情况下继续运行。”🚀 AI训练与推理工作负载的演变随着生成式AI的兴起,推理工作负载变得同样计算密集,甚至可能超越训练的需求。Michael解释了推理的“预填充”和“解码”两个阶段,并表示NVIDIA正在开发针对这些阶段优化的专用GPU SKU,以满足不断增长的推理需求。“推理对算力的需求其实不比训练少,甚至可能更多。因为模型你只训练一次,但推理要进行很多次。”📈 “黄加Kagan定律”与AI的科幻未来Michael提出了每年十倍性能增长的“黄加Kagan定律”,强调AI领域正以远超摩尔定律的速度发展。他展望了AI的科幻未来,包括AI模拟历史、发现物理定律的可能性,并将AI比作“思想的宇宙飞船”,预示着它将像电力一样彻底改变世界。“摩尔定律是每两年翻一番。‘黄加Kagan定律’的斜率大概是每年十倍,或者说几个数量级。”🌐 播客信息补充本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用AI进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight在小宇宙查看该单集文稿

NOW PLAYING

#279.英伟达CTO谈AI时代的计算前沿与未来

0:00 33:41

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

第一次播音 北京时间 06:00-07:00 RFI - 法国国际广播电台 收听法广政经、社会、环保、文化、艺术等新闻与专栏节目,了解法国、中国与世界大事。 安静低调⚠️不要在国内平台评论区提及本站 会被封⚠️《必听推荐》在简介❗️新剧等完结 ♠️♥️ ❗️如果播到一半没声 先搜“补档➕剧名”关键词❗️⚠️《不是推剧》的剪辑 ,听了、但是不推荐此剧。❤️推荐剧集会明确标注🚗除了正剧外,搜“停车场(或emoji 车)”关键词可获得🛏床戏CUT2026 听剧记录📝【💯 “六边形”:剧情➕后期➕配音➕主旨➕电影质感】【按题材分类⬇️】🌟【剧情片,群像 、冒险 、悬疑 、解锁地图…🌍】魂兵之戈、欢迎进入梦魇直播间、地球上线、网易☁️『孙美琪疑案』赵路 魏超 8082 Audio制作(打造《黑神话·悟空》《诡秘之主》等作品)魔尊也想知道、🌟【立意佳,精美文艺电影,情绪沉浸,值得细品~🎬】入戏【🐱有声剧】、酒徒、南方海啸、反向驯养(余昊威 刘思岑)、男妾生存法则(遇神后期团队)🦊、遇蛇广播剧***、铜钱龛世、***《遇神《二锅水《画外空间《不对付《唇间 《人偶…后期老师制作➕《太傅他人人喊打》云耶山耶工作室出品:【遇蛇广播剧】(主役赵毅大昕,配角🈶️顺子、三石、小红…)🌟【立意佳,感动满满、落地生活感 | 生命话题,纪实片质感🎬】地中行、抱抱🐱(刘一鸣 x 斑马)、江医生怀了死对头的崽、回到民国当导演、糊口(徐宇隆 x 胡良伟)、指尖温度、===============以上全肯定/二刷起步/引人思考/超级触动=====================搞笑到抽象👍一口气听完了笑疯了《大家好,我和男二在一起了》(彭尧 x 风允之)【剧情超级精彩👍 一口气听完,后期不错🌟】黑天[木苏里]、限时狩猎({将进酒}唐酒卿原著)、全球高考、残次品、无限练习生、桐花中路私立协济医院怪谈、暗界神使、C 语言修仙、【剧情精彩👍】分区:【有创意👍都市风水/轻冒险,偏治愈+逗趣】貔貅饭馆只进不出【网易☁️】(小红 x 斑马)、👍装死拯救不了世界(徐宇隆 x Albert英语研习社 Albert英语研习社 欢迎关注微信公众号「Albert英语研习社」获取节目文本和更多原创英语学习内容。 关于Albert ●没有名牌大学背景,没有英语专业背景 ●没有国外留学经历,没有英语生活环境 ●22岁成为500强公司英文讲师,录音素材全球员工使用 ●24岁自学成为同声传译 ●25岁为瑞士总统翻译 BabyBus | 宝宝巴士·国学儿歌 | 唐诗三百首 BabyBus 国学唱出来,好听又好记!和奇奇妙妙一起唱国学儿歌——让宝宝快乐启蒙!国学唱出来,好听又好记!让宝贝在潜移默化中记住唐诗、宋词、汉乐府、三字经等国学经典,和奇奇妙妙一起唱国学儿歌,领略经典的魅力!* 古诗词儿歌:有唐诗、宋词、汉乐府,从简单到复杂,从五言到七言,童音吟唱三遍+童音诵读一遍,让宝贝爱上古诗词!* 三字经儿歌:奇奇和妙妙把《三字经》唱出来,非常适合低幼小朋友识记。小朋友不用刻意...<p data-flag="normal" style

Frequently Asked Questions

How long is this episode of 跨国串门儿计划?

This episode is 33 minutes long.

When was this 跨国串门儿计划 episode published?

This episode was published on October 28, 2025.

What is this episode about?

📝 本期播客简介本期我们克隆了知名科技播客,邀请到英伟达(NVIDIA)的首席技术官Michael Kagan进行深度对话。Michael...

Can I download this 跨国串门儿计划 episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!