智者访谈 Podcast - All Episodes

11

11. 上海交大张拳石：思维链只是表象，DeepSeek凭什么更强

DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？本期《智者访谈》邀请到上海交通大学张拳石教授，他在神经网络可解释性研究领域开创了新的理论框架。不同于传统的工程技术层面的解释方法，张教授提出了「等效与或交互」解释性理论，用严谨的数学符号化方式证明神经网络的内在表征逻辑，为理解泛化性、鲁棒性和过拟合提供了新的视角。面对大模型发展的各种挑战，张教授强调了理论创新的重要性。他说：「所谓十年磨一剑，相比用十年时间去优化一个复杂系统，更多是用十年去等待一个真正值得投入的问题。」【时间线】01:20  思维链是模型的真实思考过程吗？05:39  将表征逻辑严谨解释为符号化交互概念14:16  幻觉、欺骗与创意：本质相同20:49  结果导向，模型的自我纠正与提升：潜在风险28:00  从表征角度理解泛化性、鲁棒性的根因31:56  过拟合的内在机理38:43  大模型的质量评估、安全与商业发展46:06  从 Scaling 的维度到维度的 Scaling50:10  用 CoT 数据反哺训练的潜在风险52:36  如何在 AI 研究中找到真正的「大问题」【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】张拳石• 上海交通大学长聘教轨副教授，博导• 上海交通大学电院计算机科学与工程系长聘教轨副教授，博士生导师，入选国家级海外高层次人才引进计划，获 ACM China 新星奖。在神经网络可解释性方向取得了多项具有国际影响力的创新性成果。• 担任 TMLR 责任编辑，NeurlPS 2024领域主席以及 AAAI 2019，CVPR 2019，ICML 2021 大会可解释性方向分论坛主席。【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 27, 2025

1h 02m

10

10. 清华翟季冬：DeepSeek 百倍算力效能背后的系统革命

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。这一突破不仅撼动了英伟达万亿市值，更引发了整个行业的反思：在通往 AGI 的征程上，我们是否过于盲信算力规模，而忽视了一条更加务实且充满创新可能的路径？与 2023 年「更大即更好」的粗放发展观不同，2025 年 AI 发展或将更像是一场精打细算的技术炼金：如何用最少的资源最大化模型效能，如何在特定场景实现极致效率。DeepSeek 已经展现出这种方式的威力——开发者总是倾向于选择性价比更高的开源方案，当千千万万的应用都以 DeepSeek 为基座，由此构建的生态将如何重塑 AI 产业格局？本期《智者访谈》邀请到清华大学计算机系长聘教授、高性能计算研究所所长翟季冬，深入探讨大模型时代的 AI 算力优化之道。翟季冬教授指出，DeepSeek 实现百倍性价比提升的一个重要原因，是其在系统软件层面的深度创新。「性能优化是一个无止境的过程，」翟季冬教授表示，在中国面临算力资源挑战的背景下，通过系统软件创新提升算力效能，是产业突围的关键。这不仅需要在编程语言、编译器、通信库、编程框架等多个技术层面发力，更需要建立起完整的基础软件体系。当下，一个值得深思的现象是：尽管 AI 算力需求持续攀升，但国内众多智算中心的国产算力资源却存在闲置。供需错配的背后，暴露出基础软件体系的短板。但困境也蕴含着重要机遇：如何打通从应用到系统软件，再到自主芯片的完整链路，探索出一条符合中国现实的发展路径？这不仅是技术创新，更是战略抉择。在算力主导 AI 竞争力的时代，如何让每一份计算资源都能释放最大价值，这个问题本身，与答案同样重要。【时间线】03:35  DeepSeek 与算力需求未来趋势06:41  算力效能评估新视角10:26  中美硬件差异下的软件思考14:00  为何还没 Transformer 专用芯片17:41  万卡集群训练难点21:01  降本增效：推理优化的关键24:41  Infra 如何为下一代大模型做好准备27:19  大规模异构集群的算力管理29:42  智算供需错配：系统软件如何补位【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】翟季冬• 清华大学计算机系长聘教授，博导，高性能计算研究所所长• 青海大学计算机技术与应用学院院长• CCF高性能计算专委副主任• 清程极智首席科学家【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 26, 2025

31m

9

09. 小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？

多模态能力的融合正在改写AI发展路径。语音、视觉与自然语言处理的边界日益模糊，以Transformer为代表的通用解决方案，正在重塑传统技术领域。在这个技术范式转变的关键时期，那些长期深耕细分领域的研究者又在思考什么？他们如何看待这种技术融合的趋势？本期《智者访谈》邀请到著名开源语音识别项目Kaldi的创始人、小米集团语音首席科学家Daniel Povey博士。作为推动全球智能语音处理产业化的关键人物，他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前，他在微软研究院的实习生，如今已成为Google Gemini等标志性项目的负责人。当整个行业都在追逐大模型和通用方法时，Povey博士却选择专注于不那么热门，但更有潜力的方向。「有这么多聪明人都在试图改进AI，那些容易被发现的方法早就已经被人发现了。」在他看来，技术进步不应被某一主流范式所限制，AI领域的进步往往源于解决特定领域的具体问题，每个领域都应该保持自己独特的视角和方法——也许语音领域的下一个解决方案，会给机器学习带来全新的启发。Transformer确实好，也确实可能是未来发展的方向，但如果所有人都只基于现有模型做改进，可能阻碍整个领域的根本性创新。在访谈中，Povey博士还分享了技术创新的方向选择、规模与效率的权衡，以及如何在紧跟前沿的同时保持独立思考。对于年轻一代的研究者，他的建议直白而务实：你必须诚实面对自己真正想要的。学AI就能年薪百万的时代已经过去了，现在进入AI领域很难做出突破，除非你真的才华横溢；很多时候，你职业生涯的最终目标，要么很难实现，要么实现了也没有想象中那么美好。希望这番坦诚的对话，能为我们在AI发展的万千可能性中，找到属于自己的方向。【时间线】01:35  Kaldi 之后的新探索02:51  语音成了神经网络的子领域04:37  多模态：Transformer 大一统？07:54  大模型 vs 小模型11:13  会议不再是交流研究的最佳方式14:01  如何判断真正的技术进步？18:10  Scaling Law 与数据极限21:18  未来机遇展望23:52  别把生活卷丢了【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】Daniel Povey• Kaldi之父• 小米集团首席语音科学家• lEEE Fellow• 清华大学杰出访问教授、武汉大学客座教授• Daniel Povey 博士毕业于英国剑桥大学，先后就职于 IBM 和微软。2012年加入美国约翰霍普金斯大学，任语言和语音处理中心副教授。2019年10月加入小米，担任集团语音首席科学家。2022年12月，Daniel Povey 凭借在语音识别和声学建模方面的杰出贡献入选IEEE Fellow。【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 25, 2025

29m

8

08. 图森未来陈默：自动驾驶无以为继急转AIGC游戏，拿下金庸群侠传、三体IP

自动驾驶行业正经历新一轮洗牌。其中，全球自动驾驶第一股图森未来的沉浮，折射出整个行业的阵痛：从 2021 年 IPO 时 85 亿美元的估值，到 2024 年初退市，短短三年间历经管理层动荡、美国监管调查、业务收缩及大幅裁员等一系列剧变。退市之后，转折仍在继续：2024 年 8 月，公司出人意料地宣布进入生成式 AI 应用领域，计划打造基于《三体》的动画电影及视频游戏。伴随这一战略转型的是愈演愈烈的管理层风波，多起法律诉讼和股权纠纷相继浮出水面。从图森未来的一系列人事变动和公开信息中可以看出，管理层在企业战略上存在根本分歧：一方坚持加大自动驾驶技术研发，另一方则更强调现金流和盈利能力。创始团队最终分道扬镳，联合创始人、前 CTO 候晓迪现已另创自动驾驶公司。在风险投资驱动的科技创业中，技术理想与商业现实如何平衡？创始人、投资人与董事会之间的权责边界又在哪里？本期《智者访谈》对话图森未来联合创始人陈默，他认为 AI 技术与新需求的产生没有必然联系，无论是自动驾驶还是大模型，都应回归工具本质，以降本增效为目的。陈默直言，L4 级自动驾驶要实现商业化，必须在营运成本上比人工驾驶更有优势，而这一点在当前技术和市场环境下遥遥无期，因此图森转向动漫游戏，正是看中了该市场的盈利能力和持续增长潜力。在访谈中，我们将尝试还原图森未来的转型决策，探讨科技创业中的关键议题：在追求技术突破的同时，如何建立可持续的商业模式？在波动的资本环境下，创业者该如何平衡多方诉求？面对科技创业的不确定性，如何建立稳定且有效的公司治理机制？这些问题不仅关乎图森的未来，在 AI 技术不断突破的今天，如何将创新转化为真正的价值，是每一位创业者需要直面的命题。注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】00:47  让公司活下来05:05  自动驾驶无以为继09:09  理想与现实13:17  90°急转，切入 AIGC 游戏15:58  大模型做得好 ≠ 商业上成功17:50  IP 破局：从三体到金庸的游戏野心24:40  创业者的底线思维【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。【主播】闻菲，机器之心合伙人总监【嘉宾】陈默• 图森未来联合创始人、首席制作人• 在人工智能、媒体和游戏行业超过15年以上的连续创业经历• 创立多家初创企业并担任公司高级管理层，拥有丰富的战略规划、资源匹配和复杂项目管理经验【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 24, 2025

30m

7

07. 清华赵明国：智能人形机器人≠智能+人形

2024 年，人形机器人领域迎来爆发式增长。特斯拉 Optimus 的持续迭代、OpenAI 对 1X 的战略投资，众多初创公司异军突起，以及包括 Mobile ALOHA 在内学术界的不断创新，共同描绘出一幅激动人心的未来图景。技术进步的浪潮固然令人振奋，但保持清醒和冷静，在开放探索的基础上，审慎选择最符合时代需求和技术发展规律的路径，才是引领人形机器人走向成熟的关键。本期机器之心《智者访谈》邀请到清华大学自动化系研究员、机器人控制实验室主任赵明国教授，从运动控制的视角看人形机器人发展。赵明国教授在机器人控制领域有二十多年的研究与实践，他认为当前人形机器人领域呈现出如春秋战国般多元化的发展态势，这既是蓬勃发展的象征，也潜藏着方向迷失的风险。赵明国教授强调，「智能人形机器人」不能只是「智能」和「人形机器人」的简单叠加，而应当是一个全新的研究主题和技术范畴，需要机器人学和人工智能两个领域更深层次的融合，制造能够在复杂环境中自主适应和学习的智能体。对大模型技术在机器人控制领域的应用，赵教授认为单纯依赖「大脑」解决运动控制问题并不合理。人类的运动控制是一个复杂的多层次系统，涉及本体反射、中枢控制和大脑控制等多个层面。我们需要更深入地研究生物系统的运动控制机理，重新思考机器人控制系统的架构，并探索更有效的学习和优化方法。赵教授主张技术的先进性并不等同于实用性，只有与时代需求和经济发展相匹配的技术，才能真正落地生根，开花结果。例如，维纳控制论中的很多思想因为过于超前而未能对早期的计算机和人工智能起到重大的推动作用。注：本期节目录制于2024年10月，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】00:47  人形机器人多元发展现状02:47  智能人形机器人≠智能+人形08:33  双足运动控制难点15:49  学习 VS 优化20:21  用大模型解决运动控制：不合理29:36  智能机器人控制系统发展方向31:30  人形机器人应用【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】赵明国• 清华大学自动化系研究员，机器人控制实验室主任，无人系统中心类脑机器人中心主任• 发表百余篇论文，授权国家发明专利10余项• 在人形机器人领域，提出了虚拟斜坡行走方法，广义模型预测控制、全身控制等方法，研究成果获得RoboCup人形组亚军等多项国际奖项• 在类脑计算领域，利用神经形态技术创建了高性能、高能效的机器人控制系统，成果发表于Nature封面，获得2019年度中国科学十大进展及“科技创新2030”计划的资助。【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 23, 2025

43m

6

06. AI 蛋白质夺诺奖，清华聂再清：大模型解码生物语言

2024 年诺贝尔化学奖颁发给了在计算蛋白质设计和蛋白质结构预测领域做出突出贡献的三位科学家，凸显了人工智能和计算方法在解析生物语言中的关键作用，也预示着 AI 技术在生物医药领域更为广阔的应用前景。然而，药物研发作为一个漫长而艰难的过程，10 年、10 亿美元、10% 成功率的「魔咒」仍然困扰着整个行业。尽管人工智能已经在多个环节展现出巨大潜力，业内专家普遍认为，距离 AI 药物研发发展成熟甚至带来颠覆性改变还需要很长一段时间。大模型的出现，为加速这一进程提供了新的契机。本期机器之心《智者访谈》邀请到清华大学聂再清教授，探讨他在将先进的自然语言处理技术应用于生物医药数据分析的创新实践。聂教授及其团队正致力于构建生物医药领域的基座大模型，通过对不同尺度和不同模态的数据进行建模及整合，建立起生物语言与自然语言之间的桥梁。团队的目标不仅仅是实现自然语言与生物语言之间的翻译，而是打造一个能够调用各种工具的智能助手。这个助手有望成为生物医药行业应用的重要入口，整合领域内的各种数据、知识和工具，并且使用自然语言与人类专家交互，通过人机协作提升药物研发的效率与成功率。在当前的技术背景下，相较于单纯研发更好的 AI 药物模型，这种模式具有更高的商业可行性。如果说数学是描述物理学的完美语言，那么人工智能则被认为是破译生物学复杂机理的关键。在访谈中，聂教授将分享其团队在自然语言与生物数据融合方面的前沿研究成果，探讨基于多模态大模型的对话式智能助手在药物研发中的实际应用与商业潜力，为我们揭示人工智能赋能药物研发的全新可能。注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】01:15  药物研发痛点：干湿实验不结合02:28  做基于大模型的对话式药物研发助手06:30  构建生物医药领域的基座大模型10:03  多尺度建模与融合：统一到原子17:45  药物研发助手 ChatDD21:16  商业模式：最终目标是成为行业入口25:38  哪些行业适合研发垂直大模型？28:37  药物研发的未来【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】聂再清• 现任清华大学国强教授、AIR首席研究员、水木分子首席科学家• 十四五国家重点研发计划「新药研发大模型」课题负责人• 曾任阿里巴巴人工智能实验室北京负责人和天猫精灵首席科学家• 曾任微软亚洲研究院首席研究员，是微软学术搜索和人立方的发起人和负责人，以及微软自然语言理解平台LUIS的技术负责人【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 22, 2025

30m

5

05. 北大王立威：理论视角看大模型，为什么AI既聪明又愚蠢

我们惊叹于当前 AI 的成果，但若深究其过程则往往感到失落。在生成式 AI 盛行的当下，这种矛盾心理尤为突出。大语言模型（LLM）的通用能力是一个意外的收获，为了改进机器翻译序列处理而提出的 Transformer，性能是如此强大，已经成为语音、文本、图像领域事实上的基础架构，并且展现出一统模态的巨大潜力。从 GPT-3 到 GPT-3.5（即 ChatGPT），模型能力似乎有了质的飞跃，但二者在训练方式上并没有本质区别，这是否意味着更多的数据、更大的模型是通往智能的正确路径，更好地「预测下一个词」最终能让我们创造出会思考的机器？今天，大模型已经开始走向产品阶段，人工智能正渗透到千行百业，我们在享受智能化所带来的便利的同时，也面临一系列现实问题。现有的理论还难以解释深度学习的许多重要问题，导致实践无法系统且高效的进行。大模型的出现，给机器学习理论提出了全新的课题。在技术创新飞速发展、知识创造相对滞后的当下，理论研究该如何应对挑战、抓住机遇？本期机器之心《智者访谈》邀请到北京大学智能学院教授王立威，从机器学习理论视角看大模型的能力边界，探讨理论对 AI 未来发展的影响。王立威教授指出，很多人都将今天的人工智能与工业革命相类比，但我们是否想过，蒸汽机虽是传世的发明，却鲜有与其设计相关的理论流传下来。如果仅仅只停留在解释具体现象的层面，如今的机器学习理论研究是否也会面临同样的命运？当 AI 技术实践不断突破而理论认知未能同步提升时，技术创新的风险也将被放大，甚至阻碍其真正价值的实现。王立威教授鼓励青年学者挑战现有框架，探索未知领域，大模型不是人工智能的全部，机器学习也不止一条路径，只有看得更深、更加本质，才能发现足以传世的「AI 领域的能量守恒定律」，进而指导未来的研究和实践。他说，探索需要勇气，承担一定风险，很多事情都无法预测，但这也正是探索的乐趣。注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】01:05  为什么如今的 AI 既聪明又愚蠢06:25  用 ML 解决数学和科学问题的潜力14:55  理论视角看思维链（CoT）26:22  大模型并不存在所谓的「涌现」34:35  幻觉是 LLM 的固有特性39:07  The Bitter Lesson & Scaling Law44:28  关于可解释性50:25  重新定义泛化54:15  大模型时代的理论研究【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】王立威• 长期从事机器学习基础理论研究，近来致力于通过机器学习方法解决科学与数学领域重大基础问题• 关于图神经网络表示理论的两篇工作分获ICLR杰出论文奖与提名奖• 担任 TPAMI编委，并长期担任 NeurIPS、ICML、ICLR 等顶会的领域主席/高级领域主席入选 AI's 10 to Watch，是首位获此殊荣的亚洲学者【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 21, 2025

58m

4

04. 腾讯混元大模型负责人王迪：揭秘万亿 MoE 系统工程之道

人工智能正经历一场由大模型引发的革命。这些拥有数十亿甚至万亿参数的庞然大物，正在重塑我们对 AI 能力的认知，也构筑起充满挑战与机遇的技术迷宫——从计算集群高速互联网络的搭建，到训练过程中模型稳定性和鲁棒性的提升，再到探索更快更优的压缩与加速方法，每一步都是对创新者的考验。面对快速演变的市场，企业如何在大模型投入与应用间寻求平衡？AI 从业者又该如何在这复杂的产业生态中找准定位，最大化自身价值？这些问题不仅关乎技术与商业，更直指 AI 产业的未来走向。本期机器之心《智者访谈》邀请到腾讯机器学习平台部总经理／混元大模型负责人王迪先生，深入腾讯从 0 到 1 自研万亿级 MoE 大模型的历程。王迪强调，大模型是一项跨领域的系统工程，需要在约束下高效整合工程、算法、数据和业务应用，对组织能力提出了前所未有的挑战。同时，业务团队需要明确模型的能力边界，辨识哪些问题适合用模型去解决，哪些则需要通过产品设计来应对，只有技术与业务紧密协作，才能快速推出满足应用需求的 AI 产品。腾讯的这条实践之路，让我们得以窥见大模型研发和工程的整个链路：从基础设施的构建到训练推理框架的优化，再到业务场景的落地，为理解大模型提供一个独特的视角。注：本期节目录制于2024年8月，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】01:07  小模型成趋势的深层逻辑05:54  腾讯为何选择从零自研大模型10:37  MoE Scaling Law：腾讯的着眼点20:22  布局全模态：统一到 Transformer23:06  平台层如何衔接上层应用与下层算力35:39  技术路径选择：直觉从何而来？39:55  万亿 MoE 实践：稳定性、鲁棒性48:10  算力集群发展及 AI Infra 展望【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】王迪（腾讯机器学习平台部总经理）• 现任腾讯机器学习平台和混元大模型技术负责人• 在超大规模生成式大模型、搜广推稀疏大模型、搜索平台、GPU 算力和任务调度等技术领域拥有丰富经验• 2008 年加入腾讯，拥有十多年 AI 领域深厚技术研发经验。【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）联系我们：[email protected] | [email protected]

Mar 20, 2025

58m

3

03. 技术发展中、巨头博弈下的AI开源

2024年7月，Meta 发布 Llama 3.1 405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源即未来」，再次将开源与封闭的争论推向舞台中央。回望过去，OpenAI 从开源到封闭的转变，折射出 AI 领域在安全风险、商业利益、技术理想等方面的博弈与权衡。展望未来，随着开放权重大模型的日益强大，开源 AI 是否真能成为行业标准？面对技术发展的不确定性和惊喜，以及巨头博弈所带来的壁垒和机遇，AI 开源将走向何方？本期「智者访谈」邀请到 AI 开源生态专家黄之鹏先生，一同探讨这场关乎技术进步和行业格局的时代之争。注：本期节目录制于2024年7月，如对话中提及年份相关时间点，默认「今年」为「2024年」。【时间线】00:00  AI 开源生态新趋势00:29 OpenAI 变 CloseAI；对齐被夸大？06:35 Google、Meta、苹果各有应对14:20 框架层：趋于一统还是更多变化？16:25 模型层：微调越来越难了19:40 AI 系统：只有 LLM 够不够？24:36 多模态、Transformer 替代及更多30:15 展望 MoE：可解释性是关键37:00 开源和封闭争论的本质41:25 中美 AI 开源生态核心差异【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】黄之鹏（AI开源生态专家）• LFAI&.Data基金会董事；• Openl启智以及Confidential Computing Consortium技术委员会委员；• Kubernetes Policy WG、CNCF Security SIG、OpenStack Public Cloud WG等开源组织的共同发起人；• 带领团队参与openEuler、openGauss、MindSpore、ONNX、Kubeflow、Akraino等多个开源社区的开发运营工作。【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器小红心）联系我们：[email protected] | [email protected]

Mar 19, 2025

46m

2

02. 蚂蚁密算董事长韦韬：从智算到密算，大模型数据困境新解法

2024 世界人工智能大会（2024 WAIC）落幕，围绕「算法、算力和数据」AI 三大要素如何持续演进发展的讨论，贯穿了三天的会期，全球顶级学者带来前沿构想，产业界带来创新的解决方案。最为聚焦的还是大模型从通用走向应用，如何在这三个维度上实现突破性的进展。其中的共识是，高质量的数据供给是大模型产业发展的关键，是决定大模型是「专家」或是「砖家」一条分界线。然而，获取高质量数据的核心在于数据安全可信流通，打破数据孤岛这一老问题，在新的产业变革趋势下，变得更为紧迫。企业和行业之间由于对数据安全、隐私保护以及商业利益的担忧，往往不愿或不敢共享数据。不同企业的信息系统架构不同、格式各异，使得数据难以互通，同时数据标准化程度低，缺乏统一规范，进一步增加了数据整合的难度。蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬认为，数据供给决定了大模型能力的上限，而隐私计算技术决定了数据跨域供给的上限。当大模型从通用走向专业应用，从技术想象力走向产业的生产力，必须要解决高质量数据集稀缺与专业数据阻滞的挑战，否则大模型作为「智力引擎」，只会陷入空转。数据融合的价值潜力巨大，却常常卡在价值验证这一环。深层次的数据挖掘往往意味着多方数据的融合。然而，找到一个中立可信、具备规模化数据深度加工能力的第三方机构，对接各方数据进行融合分析，目前仍是一大挑战。注：本期节目录制于2024年，如对话中提及「今年、明年」等时间点，默认为「2024年」、「2025年」。【时间线】00:00  嘉宾介绍00:48  大模型落地的数据困境04:45  明文流通数据泄露难追责07:07  暗网悬赏敏感数据，数月就被买走09:44  大模型敏感数据泄露不可控？11:47  如何安全使用大模型？16:10  隐私计算：从主体信任走向技术信任23:30  数据安全价值如何定义？32:00  高安全与高性能一定无法兼顾吗？36:15  密算是底色，跨云跨端是未来40:55  数据安全的定义和范畴如何改变？【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】韦韬• 蚂蚁集团副总裁兼首席技术安全官/蚂蚁密算科技公司董事长• 北京大学客座教授• 安全平行切面技术体系与可信密态计算技术体系创始人• 中国密码学会大数据与人工智能安全专委会副主任• 中国计算机学会安全专委会“数字经济与安全”组副组长【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器小红心）联系我们：[email protected] | [email protected]

Mar 18, 2025

48m

1

01.上海交大卢策吾：具身智能与他的首个刮胡子机器人

在大模型风靡的这几年，如果说 AI 领域还有哪些热点，「具身智能」必定位列其中。与被动接收信息不同，具身智能（Embodied AI）强调智能体主动与物理环境进行交互。这种交互并非毫无代价，每一次行动都可能改变环境状态，带来新的挑战，需要智能体不断调整自身策略。探索具身智能，为理解智能的本质提供了一个独特视角，基于身体发展智能，也是一种与既有 AI 研究完全不同的范式。在本期节目中，上海交通大学的卢策吾教授深度剖析具身智能，带来从原理到落地的全方位思考。注：本期节目录制于2024年5月，如对话中提及「今年、明年」等时间点，默认为「2024年」、「2025年」。【时间线】00:00    嘉宾介绍01:00    具身智能的内涵与特性03:09    具身智能「身体」与「智能」的标准？06:42    99.X%：除了通用性，还需要鲁棒性13:09    不同技术路径及分析15:20    Sora 能理解物理世界吗？20:18    具身智能大模型：两级火箭架构25:11    Scaling Law 在具身智能领域会如何体现？32:03    「数据即科研」38:20    具身智能评估：成本与有效性难兼顾46:53    具身智能创业：只有正确的技术路径，才能达到 99.X%55:16    具身智能人才：顶级人才将一直稀缺【栏目简介】这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。【主播】闻菲，机器之心合伙人总监【嘉宾】卢策吾• 上海交通大学教授，博士生导师• 科学探索奖获得者（获奖原因：具身智能贡献）• 2020 年获上海市科技进步特等奖、吴文俊自然科学一等奖• 2022 年获教育部青年科学奖• 2022 年获国际机器人顶会 IROS 最佳论文之一（6/3579），RSS 最佳系统论文提名• 以通讯作者或第一作者在《自然》、《自然-机器智能》、TPAMI、T-RO、IJRR 等高水平期刊和会议发表论文 100 多篇• 担任 NeurIPS、CVPR、ICCV、ECCV、IROS、ICRA 领域主席• 作为联合创始人、首席科学家，创立具身智能公司穹彻智能【联系方式】公众号：机器之心收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器小红心）联系我们：[email protected] | [email protected]

Mar 17, 2025

59m