EPISODE · Feb 24, 2026 · 28 MIN
#433. 探秘MiniMax:他们如何构建开源模型
from 跨国串门儿计划
📝 本期播客简介本期我们克隆了 Inside MiniMax: How They Build Open Models对话来自 MiniMax 的高级研究员 Olive Song。作为国内领先的 AI 实验室,MiniMax 近期发布的开源模型在编程和逻辑推理领域引起了广泛关注。Olive 在节目中深度分享了模型开发背后那些“惊心动魄”的瞬间——从实验失败的“ICU”状态到突破后的“KTV”狂欢。你将听到:在算力约束下,研究团队如何通过第一性原理解决强化学习中的精度难题;为什么在 AI 时代,工程规范(Engineering)的重要性远超学术理论;以及 MiniMax 如何利用内部 AI Agent 来追踪全球瞬息万变的研究进展。这不仅是一次关于技术细节的深挖,更是一次关于 AI 实验室文化、开源策略以及通往 AGI 路径的深度思考。👨⚕️ 本期嘉宾Olive Song,MiniMax 高级研究员。目前负责新版本 MiniMax M2.2 的研发工作,专注于强化学习(RL)、人类对齐(Alignment)以及模型评估。她深度参与了 MiniMax 多款核心模型与产品的迭代,对大模型在编程智能体(Agent)和长程规划方面的能力有深刻见解。⏱️ 时间戳00:00 开场 & 嘉宾介绍实验室的“心跳”与文化01:11 早上进 ICU,晚上去 KTV:AI 研究员的真实情绪曲线02:46 角色扮演与情感价值:为什么 AI 陪伴将改变未来的社交03:32 普惠智能(Intelligence with everyone):AI 如何降低专业领域的门槛技术深挖:强化学习与对齐04:47 约束“钻空子”的模型:人类对齐在编程模型中的核心地位05:34 理论与实现的差距:为什么 FP32 精度是提升 RL 效果的关键06:30 第一性原理:从底层逻辑拆解实验中的不可解释现象开源策略与评估心法07:11 为什么选择开源权重:研究员视角下的社区力量与商业博弈08:36 安全性基准:在发布模型前,实验室如何进行“大规模体检”09:34 编程即建模:通过工程化手段扩展人类能力的边界15:59 评估的艺术:为什么“五个问题”测不出一个好模型智能体(Agent)的未来10:35 长程规划挑战:如何定义任务、环境与 RL 基础设施11:37 算力优化:在 GPU 受限时代,如何用算法压榨硬件性能17:23 追赶 Claude:开源模型在复杂环境理解上的差距与突破点19:39 M2.2 预告:更稳定的长上下文处理与多语言编程能力研究员的自我进化20:18 用 Agent 卷科研:MiniMax 内部如何自动化追踪全球论文与代码21:21 走出象牙塔:为什么工业界的工程规范比学术点子更重要22:41 协作的未来:让模型与专家实现“优雅协作”的三个月目标25:53 谈谈 AGI:一个直到实现那一刻才能被定义的“移动目标”27:11 结尾:推荐书目《创造的艺术》与发现问题的思维方式🌟 精彩内容💡 “早上 ICU,晚上 KTV”Olive 生动地描述了强化学习研究的日常。由于模型行为的不可预测性,研究员的心情往往随着实验曲线剧烈波动。这种对未知的激情和对结果的好奇,是驱动顶尖实验室在高强度下持续创新的原动力。🛠️ 工程化(Engineering)是第一生产力从学术界转向工业界,Olive 深刻意识到“玩具模型”与“大规模生产”的区别。她强调,很多时候算法的突破并不源于聪明的新点子,而是源于对工程细节(如精度控制、数据清洗、算力调度)的极致追求。🚀 用 AI 加速 AI 研究面对日新月异的 AI 进展,MiniMax 团队并没有陷入信息焦虑。他们构建了内部研究员 Agent,自动过滤、总结并分析全球的论文和博客,甚至用编程 Agent 跑通新发布的仓库。这种“模型辅助研究”的工作流,让他们能始终站在技术的最前沿。💻 开源模型的“性格”与对齐Olive 认为,一个理想的通用模型应该能通过系统提示词扮演任何性格。她坦诚开源模型在适应复杂工具调用和状态跟踪方面仍与 Claude 等顶尖闭源模型有差距,但通过系统性的研究(如 M2.5 序列),这一差距正在被迅速缩小。🌐 播客信息补充翻译克隆自:Turing Post Podcast: Inside MiniMax: How They Build Open Models本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
NOW PLAYING
#433. 探秘MiniMax:他们如何构建开源模型
No transcript for this episode yet
Similar Episodes
May 14, 2026 ·7m
May 12, 2026 ·2m
May 12, 2026 ·7m
May 11, 2026 ·32m
May 8, 2026 ·2m
May 6, 2026 ·3m