PODCAST · business
晚点聊 LateTalk
by 晚点 LatePost
《晚点聊 LateTalk》由《晚点 LatePost》出品。最一手的科技访谈,最真实的从业者思考。
-
163
163: 详解DeepSeekV4:Infra巨鲸、百万上下文走进现实、极致效率优化
「走进不同团队的成果,创新从来是连续的,不是跳跃的。」 上周五,DeepSeek V4 发布。我们邀请了两位一线 AI 从业者一起详解 DeepSeek V4 的技术实现和创新想法。 如果一句话概括:DeepSeek V4 并没有带来新的“范式变化”,它是继续在 R1 的“测试时扩展”范式下,用一系列组合创新和工程优化,让百万上下文从理论进入实用。 超长上下文上的稳定表现,正是 Agent 和多步复杂任务亟需的能力之一。 本期涉及的诸多技术术语见 Shownotes 末尾注释。 本期节目的图文版也已经发布:详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实 本期嘉宾 赵晨阳,RadixArk 工程师,SGLang 开源推理框架开发者 刘益枫,UCLA 博士生 本期主播 程曼祺,晚点科技报道负责人 时间线: 体感、对比、消失的成本、DeepSeek 的节奏 03:01 编程能力与“御三家”有差距;不再采用 DeepSeek 自己提出的 MLA 07:44 不再披露训练成本,“用模型能力说话” 09:23 延期推测:四个耦合的新 feature (新注意力+Muon+mHC+FP4)一起上,难度爆炸 12:36 不是范式创新,沿现有范式仍有巨大提升空间 性能与效率 14:32 提出新的能力方向比刷单个 benchmark 重要 16:41 坦诚的内部评测:9% DeepSeek 工程师不会把V4 Pro 作为编程首选 23:03 单 token 推理的计算量和 KV cache 大幅优化,但解决同样问题的 token 消耗更多了 V4 具体进展 28:32 整体思路:极致的稀疏 33:45 混合稀疏注意力:放弃 MLA,SWA滑动窗口+CSA稀疏压缩+HCA稠密压缩,层间预定义分工 39:37 Muon 优化器已成检验工程能力试金石 48:52 mHC:从 Seed 提出 HC 到 mHC;Kimi 的 Attention Residuals 54:24 Infra 两个关键词:TileLang & FP4 01:10:11 多专家训练+蒸馏的后训练 01:13:20 评测危机:benchmark会过时饱和,evaluation是永恒追求,agent评估未共识 更多讨论 01:19:25 近期模型共性:架构趋同(MOE+Muon),优化方向驱动(agent、coding) 01:25:18 美国追新能力、高定价;中国追性价比、工程极限 01:28:00 V4 最有可能被记住的思想:极致压缩+低激活比+低单token成本,成为后续开源模型起点 剪辑:Nick 相关链接: 158期:V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标 143期:再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进 104期:我给线性注意力找“金主”,字节 say No,MiniMax say Yes 103期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 102期:DeepSeek 启动开源周,大模型开源到底在开什么? 附录:术语、概念解释 - 模型架构相关 Token-wise(词元级)改进:优化模型处理单 token 的过程,通常用于提升注意力计算、上下文建模或推理效率。 Layer-wise 的改进:优化模型不同网络层的结构或计算方式,通常用于提升训练稳定性、表达能力或整体计算效率。 MoE:Mixture of Experts 混合专家网络,让不同“专家”子网络处理不同输入,降低单次计算成本。 哈希路由:把 token、样本或请求分配到不同专家、节点或存储位置的方法。V4 在前几层 MoE 用了哈希路由,避免起始层路由塌缩。 Engram:DeepSeek 之前提出的一种带 N-gram 编码器的辅助模块,通过额外编码连续 token 片段,帮助模型利用局部短语级信息。V4 未使用 Engram。 - 注意力相关 MLA:Multi-head Latent Attention,多头潜在注意力,引入潜在表示压缩 KV 信息的注意力机制,能降低显存占用和计算开销。 MQA:Multi-Query Attention,多查询注意力结构,共享 Key/Value,仅保留多头 Query,提升推理效率并减少 KV cache。 线性注意力:通过核函数或近似方法将注意力复杂度从二次降低为线性(一维),是改进原初注意力随上下文长度增加,计算和显存爆炸的方向之一。 稀疏注意力:仅计算部分 token 间的注意力(而非全连接),改进原初注意力问题的另一主流方向。 滑动窗口注意力:限制注意力仅在局部窗口内计算的一种稀疏注意力。 CSA:Compressed Sparse Attention,压缩稀疏注意力。用于长上下文建模的注意力机制。把序列分组压缩成更少的token,query再从中挑选出最相关的部分。V4中的压缩比是4:1。 HCA:Heavily Compressed Attention,高度压缩注意力。同样用于长上下文建模。相比CSA压缩比例更高(128:1),query无需挑选token。 NSA/DSA:V4发布之前,DeepSeek 在年初和 9 月先后提出的两种稀疏注意力方案。 - 优化器相关 AdamW:一种改进的 Adam 优化器,通过解耦权重衰减(weight decay)提升训练稳定性和泛化能力。 Muon:一种面向大模型训练的优化算法,通过改进梯度更新或内存效率来提升训练性能。 Learning Rate:学习率,控制模型参数每次更新步长的超参数,对训练稳定性和收敛速度至关重要。 牛顿-舒尔茨迭代:一种用于矩阵归一化或求逆的数值迭代方法。Muon 作者 Jordan 提到通常使用 5 次迭代,V4 中采用了 10 次迭代。 - 残差相关 HC:Hidden/Highway Connection,一类改进残差连接的信息通路设计,用于增强信息传递或控制梯度流。 mHC:Manifold-Constrained Hyper-Connections 流形约束超连。DeepSeek 在 HC 基础上的改造,解决了 HC 在大规模训练时的数值不稳定问题。mHC 使用了双随机矩阵,即每行和、每列和都等于 1 的矩阵,以约束信息流。 Attention Residuals:注意力残差连接,将注意力模块输出与输入相加,用于稳定训练并保留原始信息。 - Infra 相关 矩阵乘法:深度学习中最核心的基础计算操作(如向量与权重相乘)。 Kernel:算子核,指在底层硬件(如 GPU)上执行的高效计算函数,是深度学习算子的实现基础。比如矩阵乘法就要写 Kernel 去实现。 CUDA:英伟达开发的能使用 GPU 的一层软件系统,也指一套语言,本次访谈语境里指编写 GPU 算子 kernel 的语言。 Triton:由 OpenAI 开源,是对 CUDA 的一层抽象,能更简单的写 Kernel。 TileLang:一种面向 AI 高性能算子的 tile 级 DSL / 编译框架,把矩阵乘法、注意力等张量计算映射到 GPU 等硬件上执行,在 Triton 的易用性和 CUDA 的控制力之间取得了较好的平衡。 FP8、FP4、INT4:低精度数值格式,分别用 8 位、4 位浮点和 4 位整数表示模型中的权重或中间数据,用于降低显存和带宽压力、提升训练或推理效率。 FP4 比 FP8 更省显存和带宽,又比 INT4 更保留浮点动态范围,因此更适合复杂训练/采样链路,但收益取决于硬件、缩放策略和 kernel 实现。V4 在 1.6T 参数规模上实现 FP4 训练是个不小的挑战。 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
162
162: 批量生素材、模型筛网红,与飞书深诺Meetsocial沈晨岗聊AI时代的出海营销
出海对于中国企业来说并不新鲜,无论是早年的华为、中兴,还是大疆、影石、拓竹这样的消费硬件公司,再到 Tiktok、腾讯游戏、Temu 等互联网公司,成功的例子有非常多。但之所以我们说它是一个新的话题,是因为我们来到这个 AI 的时代,不仅看到大批的 AI 创业公司正在积极的向海外拓展,也见证着 AI 改造他们出海的路径、方式、增长、营销。 过去一年,我们也看到了很多借助 AI 营销翻车的案例,比如麦当劳在荷兰上线的一支几乎是由 AI 生成的节日广告,上线后就迅速遭到了大量的吐槽:不仅仅是画面看起来比较粗糙,更在于这个广告它传达出来的气质被认为是廉价的、偷懒的,没有什么诚意。 今天的播客,我们与飞书深诺 Meetsocial 的创始人兼 CEO 沈晨岗先生一起聊了聊,AI 在今天究竟是如何改变中国企业出海模式的?中国与美国的 AI 营销生态究竟有什么区别?在 AI 时代到来以后,企业需要建立起哪些新的能力,才能在营销战中脱颖而出? 本期节目由飞书深诺特别支持播出 本期嘉宾 沈晨岗,飞书深诺集团创始人兼 CEO 本期主播 高洪浩,晚点 latepost 主笔 时间线: Part 1 中国企业出海变迁史 04:17 中国企业出海的三个阶段:产品、公司、品牌 07:43 早年中国出海企业没有认识到营销的力量 09:45 2025 年开始中国企业出海营销范式发生变化 12:32 转型成功的出海企业案例:安克 16:18 衡量企业出海能力的模型指标:D-MES Part 2 AI 时代下,中国企业出海的新变化 22:47 出海营销领域在 AI 上的共识与非共识 25:29 AI 的使用应该与企业的商业化目标相匹配 30:38 过去三年,AI 如何改变出海营销 Part 3 中国与美国的 AI 营销 34:07 硅谷观察记:中美 AI 营销的差异 38:30 美国营销公司的历史包袱导致 AI 难落地 Part 4 AI 在未来将如何改变出海营销 42:16 Agent 时代的出海营销模式 48:42 案例:Agent 变革短剧投流 51:46 AI 时代,创意和审美变得更重要 57:07 出海服务商如何适应 AI 时代 01:01:30 三年和五年后,AI 将如何改变出海营销 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
161
161: 中国最早AI创业者的故事,与唐文斌聊天才策略、旷视、十年前的机器人和具身新创业
「不做人形机器人的具身智能创业。」 本期嘉宾是原力灵机的联合创始人和 CEO 唐文斌。 2011 年,他和两位清华同学,印奇、杨沐一起创立旷视,这是中国最早的 AI 创业公司。比 DeepMind 晚一年。 2025 年初,唐文斌成立原力灵机,开始具身智能的新创业。 在本科到研究生时,他做过七年中国信息奥赛国家队的总教练,认识了大量奥赛 “小天才”,其中不少人之后加入了旷视,现在又在原力灵机和文斌一起创业。 本期节目也有视频版,可在小红书、B 站、抖音、视频号平台关注「晚点聊 LateTalk」收看。 本期节目的图文版也已经发布:对话原力灵机唐文斌:当中国最早的 AI 创业者做具身,他选择先不做人形 这期我们聊了竞赛往事、旷视的创业复盘和原力灵机的这 1 年:这是一家不做人形机器人的具身智能公司。也是一家会直接参与多模态基模预训练的公司。 这两件事都是非常规的少数派选择。 原力灵机会给中国具身市场带来哪些不同?请听完整节目吧。 本期嘉宾 唐文斌,原力灵机联合创始人 & CEO 本期主播 程曼祺,晚点科技报道负责人 剪辑:杨 时间线: 竞赛、姚班、IOI 国家队总教练:解题的本质是优化,出题比难题更难 01:49 同时参与三项奥赛:信息奥赛的乐趣是解法不唯一 05:50 本科继续 TopCoder :Challenge 机制下,一次干掉 19 个队 08:29 七年 IOI 国家队教练:出题比做题难 10:31 唐杰的第一个研究生,与印奇相约创业 旷视创业:从体感游戏到 AI 技术平台 15:30 以 CV 技术做体感游戏,登上 App Store 免费榜前三 21:56 Face++ 开放平台,技术驱动 vs 产品驱动的两种创业 24:45 高中生范浩强成为旷视 6 号员工,“强进(周而进)组合” 夺得 ICCV 人脸识别全球冠军 30:19 AI to B 三个总结:价值可量化、不占客户太高成本、避免项目陷阱 十年前的智能机器人 34:31 调度系统才是提效核心,5 轮竞标拿下优衣库上海大仓 41:08 从差点搞砸到见到柳井正,拿下优衣库全球订单 从旷视机器人到原力灵机:参与预训练、不做人形机器人 49:21 从范浩强到张祥雨:旷视的一些 “老人” 为何不散? 53:37 再看「天才策略」:大牛口头禅是 “这不本质”,而影响客户体验的所有东西都本质 01:00:38 具身原生:参与 VLM 预训练,一开始就加入机器人数据 01:11:01 只有具身公司能做的事 01:23:34 不做人形机器人,用模块化组合避免 overkill 或 underkill 01:27:14 RoboChallenge 和 Dexbotic,为何创业公司要开源 Infra? 01:39:39 具身行业会先分散再集中,幸存的个位数公司多数会是中国公司 01:46:34 为了低谷的绸缪:备足干粮、专注投入相信的事 01:55:33 曾做过太多加法,发现 A+B+C≈max(A,B,C) 02:03:50 创业 15 年:感谢一波又一波浪潮,依旧兴奋 02:04:51 真正的通用智能机器人,“这值得投入 lifetime” 02:06:14 连点成线 相关链接: 157 期:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
160
160: 群核IPO后与黄晓煌聊这15年:被嫌弃的GPU、冠军酷家乐、空间智能、六小龙
「杭州六小龙开始上市了。」 4 月 17 日上午,群核科技登陆港股,成为 “杭州六小龙” 中第一家上市的企业。我们在第一时间专访了群核董事长黄晓煌。 2011 年黄晓煌从英伟达回国,和陈航、朱皓创立群核,当时科技创业还不是主流,英伟达自己也在低谷期。 过去这 15 年,黄晓煌说,他们经历过的 90% 的明星科技企业都消失了或变得默默无闻,而群核一直存在,业务还在增长,做出了中国市占率第一的在线设计软件酷家乐,历经与互联网巨头的竞争而幸存,现在又在 AI 热潮中投入空间智能。黄晓煌说: 活下来比活得亮眼重要。 如果想了解更加 “穷人版” 的 AI 创业故事,或者群核上市后的潜力如何,听听创始人怎么说吧。 本期播客也有视频版,可在小红书、抖音、B站、视频号,搜索《晚点聊》观看。 本期节目的图文版也已经发布:群核 IPO 后与黄晓煌聊这 15 年:被嫌弃的 GPU、冠军酷家乐、空间智能、六小龙 本期嘉宾 黄晓煌,群核科技联合创始人 & 董事长 本期主播 程曼祺,晚点科技报道负责人 时间线: 从 GPU 上云到家装设计软件酷家乐 01:14 2011 年回国创业,在英伟达工作过是 “减分” 的 06:54 酷家乐的诞生:13 年上线,14 年爆发,15 年赚钱 10:53 群核底层是 GPU,提前进入 “token 经济”,也跑不通广告模式 14:37 遭遇巨头竞争,更看清什么是壁垒:单纯的算法是纸老虎 从 “怀疑技术自嗨" 到投入 AI 29:48 2018 年注意到 AI 机会,但一度怀疑自嗨了 38:53 2021 年赴美上市戛然而止,山峰到谷底 40:33 2023 用 Copilot 写代码,意识到 SaaS 要变天→两条路的抉择:自己训练空间模型 vs 为大模型做配套 50:16 复盘错过:2018 年是一个做具身硬件的黄金时期 空间智能 52:10 空间智能是底层能力,不是新业务 54:27 群核的 bet:3D 路线,而非视频生成 01:00:00 欧美具身企业喜欢合成、仿真数据,国内普遍倾向真实数据 01:02:52 两百家具身智能公司不算多,各种设备都会需要智能 01:08:53 从纵到横:英伟达的启发 我创业经历的 90% 明星企业都消失了 01:12:46 先活下来,再选最大的机会 01:05:07 六小龙之后,反对的声音一下子变少了 01:21:25 现在对自己的定位:科研 leader 01:24:10 最痛苦的部分总是跟人相关 01:32:11 自由女神像下的对话,“我不是这么算的” 01:34:15 把公司带向空间智能,一半收入来自空间智能 本期剪辑:杨建宇 相关链接: 157 期:具身季报26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 图文版:《具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手》 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 图文版:《至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活》 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 图文版:《独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识》 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 图文版:《陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线》 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
159
159: 马斯克Terafab太空算力、英伟达重拾CPU,与Fusion Fund张璐聊AI算力新趋势
「马斯克不仅要成为太空经济参与者,也想成为规则制定方。」 这期节目邀请了 Fusion Fund 的创始合伙人张璐,她是 SpaceX 的投资人,而马斯克刚刚在 3 月底发布了一个大计划——Terafab,要联合特斯拉、SpaceX 和 xAI,自建史上最大芯片厂,掌握从设计到制造到部署应用的全栈产能。 其中最科幻的部分,是马斯克希望把 Terafab 80% 的算力部署到太空,建太空数据中心。 Terafab 的目标年产耗电量是惊人的 1TW,是目前全球 AI 算力年耗电量(40~50 GW,1 GW 是 100 万度电,即 100 万 kW)的约 20 倍。 从马斯克的雄心壮志出发,本期聊了太空经济的创业机会和 AI 基础设施领域的变化与机会机会,尤其是英伟达在 GTC 上展现的最新规划。 本期节目的图文版也已经发布:马斯克 Terafab 太空算力、英伟达重拾 CPU,与 Fusion Fund 张璐聊 AI 算力新趋势 | 晚点播客 本期嘉宾 张璐,Fusion Fund 创始合伙人 本期主播 程曼祺,晚点科技报道负责人 时间线: Terafab:1 TW 的超级算力计划 02:29 Terafab 的多重驱动力: 需求、机器人原生、SpaceX 上市、更少监管 06:46 对地服务有延迟,但太空应用本身也需要算力 17:57 马斯克的带动效应: 太空算力相关创业机会 AI 算力层与 Infra 层新趋势 22:48 英伟达 GTC 发布: 统一平台,异构芯片 30:00 LPU 和 CPU 背后: 是推理(使用模型)和 Agent 需求提升 41:09 xAI 动荡: 招人诚、开人快,“马斯克是一个迷人的暴君” 45:13 Google TPU,足以挑战英伟达 GPU 吗? 企业级 AI 48:54 掌握预算的大企业 CIO/CTO 在想什么? 52:15 看好医疗行业、金融行业 AI 应用 55:14 大企业收购 AI 初创企业带来退出,又催生更多连续创业者 01:02:13 连点成线 剪辑:甜食 相关链接: 115 期:华为发布超节点,如何搅动 AI 算力市场?与魔形智能徐凌杰聊芯片层新变化 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
158
158: V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标
这期 30 分钟的单口,聊一聊 DeepSeek 这家公司和它近期的变化。 上周四,《晚点 LatePost》发布了关于 DeepSeek 的报道:《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》,写了 DeepSeek 的近况,以及这家公司过去的历史和它的一些特质,还有梁文锋对 AGI 以及如何实现 AGI 目标的独特理解。 如果你已经看过这篇文章,其实播客并不会有太多新增信息,而是多了一些个人感受和观察,以及文章发布后的一些反馈与补充。 DeepSeek 真的是一朵 AI 界的奇葩,这里是“奇葩”的原意——“阆苑仙葩”,怎落凡家?在非常追求效率、追求投入的性价比,追求“用实力说话”的市场环境中,DeepSeek 的目标和风格都非常独特,它的存在本身就是小概率事件。 这包括,梁文锋和 DeepSeek 的目标:不是仅卷模型性能,也看重生态建设和探索一些“少数派”方向。也包括工作氛围:DeepSeek 是全球都少有的、不信奉超长时间工作的核心 AI Lab。 梁文锋认为,一个人每天能高质量输出和工作的时间很难超过 6~8 小时,疲劳状态下的昏庸判断反而会浪费宝贵的算力,得不偿失。 这造就了 DeepSeek 的独特和不平凡,某种程度上,也是它如今的一些内外部变化和张力的源头之一。 时间线跳转: 01:37 3 位研究员春节至今离开,为何受关注? 03:43 V4 相关信息(信息有限) 04:27 AI 人才竞争激烈,DeepSeek 要解决公司定价问题 07:54 张力的底层来源:DeepSeek 的目标不是最主流的目标 17:48 更多人为何留下,这是一个怎样的组织 本期主播:程曼祺,晚点 LatePost 科技报道负责人 剪辑:Nick 相关链接: 《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》 154 期:从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们 153 期:阿里Qwen人事变动:误读、近况、伏笔和未来 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
157
157: 具身季报26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
「不仅是比特,不仅是语言。」 这期节目是我们的第一期具身智能季报,邀请了我很喜欢的一位投资人,Alphaist Partners 创始合伙人陈哲 Peter。 Alphaist 也有自己的播客,就叫《The Alphaist》,这期节目之后也会在 The Alphaist 串台播出。 过去七年,Peter 在五源专注投资机器人和硬件科技,投资过海柔、松灵、本末、地瓜等公司。在去年创立 Alphaist 之后,他想放开手去寻找更多 Alpha Founders。我对这类创始人的理解是:哪怕不被认同,他们也极其笃定自己的判断,是可以定义规则或打破规则的人。 在跨学科、高复杂度、需要开拓精神的具身智能领域,就有不少这样的创始人,也需要更多这样的创始人。 这期节目,我们从本季度的进展着手,Peter 分享了三月中旬去 GTC 与全球从业者的交流,同时也带到了过去两年具身智能的发展。 在讨论人形机器人的部分,我们盘点了中美几家头部公司,如宇树、银河、特斯拉 Optimus、Figure 的近期进展,以及那些在智能能力或数据上给行业带来启发的公司,如 Pi、Sunday 和 Generalist。 图注:银河通用人形机器人打网球 demo。 接着重点讨论了当前具身智能的两个前沿研究方向:灵巧手和世界模型: 在灵巧手部分,我们重点聊了 Sharpa 的进展,和 Optimus 绳驱方案的争议; 在世界模型上,英伟达近期连续发布 DreamZero、DreamDojo 和 EgoScale 数据框架,提出 WAM 世界动作模型,被视为比 VLA 天花板更高的方向。 之后的季报里,我和 Peter 会邀请更多从业者一起分享。 图注:Sharpa 灵巧手 本期节目的图文版也已经发布:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 | 晚点播客 本期嘉宾 陈哲,Alphaist Partners 创始合伙人 本期主播: 程曼祺,晚点科技报道负责人 时间线: 04:48 Q1 TOP 5 进展 -宇树春晚表演,一致性 -Sharpa 灵巧手实机展示,长程任务组装风车 -英伟达发布 DreamZero、DreamDojo,WAM(世界动作模型)而非 VLA -银河通用机器人打网球 -波士顿动力新版电动 Atlas 人形机器人丨中国 10:37 宇树春晚门道:25 年下半年新技术的集中展现,一致性是大亮点 20:13 宇树做科研市场,从来不被投资市场「喜欢」,但专注才造就 G1 的成功 24:20 王兴兴和汪滔:不极致,不成活;目前的智能能力不影响宇树整体竞争力 28:22 银河通用人形机器人打网球,Karpathy 说“这肯定是 AI 生成的” 34:13 双足价值再思考,波士顿动力 Stretch 机器人的启示 人形机器人丨美国 39:45 新版 Atlas:模块化设计、左右腿可互换,人形也可超人 42:29 Optimus Gen3 再延期,已缩水的 1 万台年产目标仍激进 44:58 Optimus 灵巧手,绳驱vs直驱:绳驱真符合“第一性原理吗”? 48:57 “浮夸”的 Figure 和它“浮夸”的创始人 Brett,顺势而为 52:59 美国本土供应链复兴有长期挑战 57:58 Pi、Sunday、Generalist;Sharpa 提出的三层架构:System2(低频、规划)、System1(高频、动作执行)、System0(触觉) 灵巧手创业友好,世界模型的底层属于大厂 01:07:06 灵巧手市场可能存在宇树在人形市场的 G1 机会 01:14:30 世界模型和英伟达的 WAM(DreamZero、DreamDojo):不再以语言为底层 01:27:18 英伟达 EgoScale 数据框架 & 具身数据的金字塔 01:37:47 视频生成的底层更大厂友好,但世界模型也有创业公司:Rhoda AI 融了 4.5 亿美元 机器人端侧算力:越到新兴市场,英伟达统治力越弱 01:43:42 从云端→车载→机器人:英伟达 GPU 统治力逐步减弱,“创新者窘境” 01:46:26 国产芯片机会:地平线、地瓜在量产机器人市场领先 01:48:24 机器人终局可能高度集中 中国具身上市潮 & 下季度展望 01:53:59 宇树上市,是一家高质量公司的上市,不是泡沫 01:59:59 下季度展望:世界模型超越 VLA、灵巧手进展、马上举行的机器人马拉松比赛从“搞笑”走向竞技 02:04:20 连点成线:前几期具身访谈共性总结;触觉和语言之外 本期剪辑:甜食、Nick 相关链接: 《对话宇树科技王兴兴,造出 9.9 万元人形机器人的 90 后偏才》 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 图文版:《至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活》 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 图文版:《独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识》 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 图文版:《陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线》 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
156
156: AI季报26Q1:OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
「Coding→Agent 大主线明细,从模型的竞争到系统的竞争。」 本期播客本周内也会在《晚点 AI》公众号发布「图文版」,发布后会更新到 Shownotes 和评论区。 从 26 年 Q1 开始,《晚点聊》推出季度总结系列,会分为 AI 季报和具身季报。 其中,AI 季报的嘉宾是身在硅谷的 MoE capital 创始合伙人 Henry Yin。他此前已经两次做客晚点聊,分享过 Agentic 工具链的创新机会,和 Gemini 3 后的新进展,分别是 137 期和 146 期。 本期节目我们从 OpenClaw 开始聊 Q1 的进展,进而延展到 Anthropic 的 Claude Code 和 Cowork 产品的强劲增长,Anthropic 应用形态与 OpenClaw 的相向而行,以及 OpenAI vs Anthropic,两家公司的 coding 产品 Codex vs ClaudeCode 和这背后的最新模型 Opus 4.6 vs ChatGPT-5.4 的三重对阵。所有这一切的快速进展,居然都发生在过去 3 个月。 在 Coding 到通用 Agent 和个人 Agent 这条主线之外,我们也讨论了 AutoResearch 等项目的 AI 自进化能力,和仍处于探索中的其它方向,如持续学习和世界模型。 Henry 也分享了,他在硅谷这个 AI 密度最高的地方,感受到的社会情绪变化:科技大裁员。而我则补充了我了解的中国公司的情况。 不管是 Agent 主战场的快速发展,还是自进化开发方式端倪初现,26 年前 3 个月的变化显示,AI 越来越不只和科技圈相关。 本期节目的图文版也已经发布:AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化 | 晚点播客 本期嘉宾 Henry Yin,MoE Capital 创始合伙人 本期主播 程曼祺,晚点科技报道负责人 时间线: Openclaw:AI Agent 的 iPhone 时刻 04:30 Q1三件大事:Openclaw异常火爆、头部模型厂商竞争焦点转移、AI自我进化贴近现实 07:35 Openclaw 做对的三件事:本地运行、接入聊天APP、定时任务和长期记忆 10:42 两个使用案例:一周卸载 vs 深度试用 14:03 热度差异:中国国民级、美国不出圈,Why? 17:02 中国开源模型乘势增长:OpenClaw 之父 Peter 安利 MiniMax 22:41 三个不足:贵、不稳定、安全隐患:Meta 对齐负责人的龙虾“生死时速” OpenAI vs Anthropic 的三重竞争 30:10 大公司竞 “吃龙虾”:英伟达、Anthropic、OpenAI 各自动作 37:14 190 亿 vs 250 亿:Anthropic 收入猛追 OpenAI,Claude Code 也超过了 Cursor 43:53 CodeX 是会编程的 “弱智”,Claude Code 是驱策编程奴隶的主人 48:30 OpenAI 的反思:“我们分心了” 49:57 xAI 的人员动荡,Google 的产品发力 53:04 竞争焦点从模型转向平台:开发者生态、企业信任、成本 AutoResearch 自进化出现端倪 01:07:09 AutoResearch,明确目标的有限搜索空间里,AI 已展现 “自进化” 01:17:00 持续学习的两种方法:贫穷版外挂 & 更新权重的新探索 01:22:48 新方向上的创业机会:几个水下 (Stealth Mode) 公司案例 算力变化:推理↑ CPU↑ 01:27:00 GTC 要点回顾:推理重要性提升 01:29:05 Agent 应用带来 CPU 需求提升 科技大裁员 01:31:27 Meta 停工学 AI 一周,Token 消耗量成关键指标 01:35:20 从 “一流人才 + 二流人才” 到 “超一流人才 +AI” 01:42:39 给 Token 收税 ? 下季度展望 01:44:07 DeepSeek-V4、更新权重的持续学习从复杂到简单 01:49:21 连点成线:从 Devin 到龙虾的 1 年半,Agent 即将带来更多变化 剪辑:甜食 相关链接: 150 期:年末 AI 回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 150 期图文版:《年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线》 146 期:Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向 137 期:Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6 137 期图文版:OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
155
155: 贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士
「具身智能的竞争,本质是体系的竞争。」 今天的嘉宾是一位没有亮相过的具身智能创业者,理想前自动驾驶技术研发负责人贾鹏。 2016 年,他成为英伟达中国智驾团队的第一个员工。五年后的 2020 年,他加入刚开始自研智驾系统的理想,和团队一起实现了逆袭。 去年夏天,贾鹏创立具身智能公司至简动力,他拉来了之前的上司,理想前 CTO 王凯,以及和他并肩战斗过五年的理想智驾前量产负责人王佳佳一起创业。 它符合中国投资具身智能的一种典型审美——创始团队有丰富的研发和量产经验。在被认为与具身关系密切的自动驾驶战场,打过硬仗、打过胜仗。而且核心团队之间磨合已久,分工默契。 成立的最初半年里,至简就融资 20 亿元人民币,是现在最年轻的具身智能独角兽。 作为创业后的首次访谈,贾鹏在这期节目中完整回顾了从英伟达到理想的智驾探索,再到具身智能的创业思考。 他给公司取名至简,因为他相信,大道至简,越简单的东西,越容易规模化。 本期访谈的视频版已经发布,可在抖音、微信视频号和 B 站,搜索《晚点聊》收看。 本期节目的图文版也已经发布:至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活 本期嘉宾 贾鹏,至简动力创始人 & CEO 本期主播: 程曼祺,晚点科技报道负责人 时间线: 2016~2020 英伟达:“老黄脑门的温度比别人高一度” 00:01 英伟达智驾中国团队第一个员工 09:10 从服务 L4 自动驾驶到转向量产 13:57 从工程师到架构师、多面手 15:13 老黄凌晨 5 点起床看邮件、论文,脑门温度比太太高一度 18:07 英伟达的前瞻投入心法:能抗外压、愿景共享、主业强劲 2020~2025 理想智驾:后来者怎么先交卷 22:30 李想当时怎么想智驾:数据重要性,下半场看智能化,“车和家” 29:25 一起看《全营一杆枪》的日子 34:44 自研第一仗:双 J3 交付高速 NOA,一群 “新手” 的生死战 40:06 抗住压力的转身:有图切无图 48:03 智驾 “做成” 的 3 重指标 2025 的具身创业新起点:“挑战自我成长极限” 51:16 FSD v14 “让人又惊喜、又失望”,该做新的事了 59:41 “第一个大概率会死,但做成的会上第一批”,具身创业现在仍是第一批 01:07:51 模型、产品、组织都要简单;同时得是 “六边形” 战士 01:14:01 具身的终局是 “分散” 的垄断 01:19:46 具身研发分 3 层,“合成数据有用,但绝不是主力” 01:34:30 To A(研究)到 To B 阶段的转换会如何发生? 01:42:01 具身的本质是 Physical Agent:大公司做底座,创业公司做 Agent 01:48:13 不做流水线替代,寻找 “端到端” 任务 具身公司该如何组织 & 行业观察 01:57:23 智驾与具身:相似的、不同的 02:01:34 不设组织架构,以项目驱动团队 02:18:05 少被讨论的现象:硬件还远未成熟 02:19:29 更强具身智能到来时间仍有分歧 02:25:03 具身上市潮之后,会如何? 02:37:28 擅长从 0 到 1 逆风局,创业这半年 “挺爽的” 本期剪辑:宇亮、Nick 相关链接: 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
154
154: 从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们
「美第奇和达芬奇,大公司和 AI 研究员。」 今天的节目分两次录制。嘉宾是高岱恒,Sam,他在 AI 技术圈和开源社区非常活跃,曾是双非土木老哥,后来以因为对 AI 开源项目的贡献进入阿里达摩院,现在自己创业,做了一个找到 AI 人才的 Agent 产品 DINQ。 而本期我们聊的主要话题,却是他的副业和 “消遣”:挖掘 AI 人物故事。Sam 对此非常着迷,在达摩院时,他就很喜欢搜集 AI 大牛的人生故事,那些非典型的、充满反差的经历尤其吸引他。 本期的第一部分,我们聊了上周刚发生的阿里千问的人事变化。Sam 分享了他作为开源模型受益者和前达摩院成员的观察。这整个过程的更具体情况,大家也可以看《晚点 LatePost》从上周到本周发布的 3 篇报道,以及我们的上一期播客。 本期第二部分,我们聊了 Sam 津津乐道的 AI 人物英雄传,在 Sam 眼里,这些不问出处、不拘一格的研究者就像文艺复兴时期的大师。他们有各自的性格、癖好、执念和技术浪漫,这对大型商业组织来说是陌生的、需要适应和理解的,我们也由此聊到了未来的研发型人才市场会如何变化。 本期嘉宾: 高岱恒 Sam DINQ 创始人 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线: 千问变动后续 02:42 千问候选人被搜索量翻了 3 倍 09:34 Model Scope 魔搭社区价值几何? 14:30 美第奇和达芬奇,大公司和 AI 研究员 AI 英雄传(第一次聊,春节前) 22:38 DINQ 的诞生,AI 研究员需要更好地展示、更好地匹配 28:30 他们就像文艺复兴时期的大师 42:26 从土木老哥到达摩院,“当你有了作品,没人在问你学校” 49:52 Adam 发明者、被拒的 GPT-1 一作、旅居越南的 RAG 发明者………创新来自边缘地带 01:10:23 他们的追求、畏惧、不屑和弱点 01:19:38 AI 下的人才市场:从人和公司的匹配,到人和具体任务的匹配 01:43:48 连点成线 相关链接: 134 期:Meta AI 人才动荡,上亿美元为何留不住人?| 与 Pokee AI 朱哲清盘点 AI 组织 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
153
153: 阿里Qwen人事变动:误读、近况、伏笔和未来
这期不到 20 分钟的短播客,快速讲了 3 月 3 日(周二)到 4 日(周三)发生了什么,澄清一些广为传播但缺乏事实依据的说法,也回顾了 23 年以来 Qwen 的组织流转和这次人事巨震的伏笔。 Qwen 的变化仍在继续,《晚点 LatePost》会跟踪后续。 这期主要是一线研发人员视角得到的事实和信息,阿里公司和组层面会怎么想、怎么看,接下来怎么做,未来一段时间会更为明朗。 相关链接: 《晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整》 本期主播:程曼祺 晚点 LatePost 科技报道负责人 本期剪辑:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
152
152: 访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识
「26 年不是落地生死之年。」 本期嘉宾,是新近完成近 20 亿元融资,估值突破 100 亿元的具身智能公司 千寻智能的创始人和 CEO 韩峰涛。此前,千寻的联创 高阳也两次做客《晚点聊》,分别是 112 期和 149 期。 90 后的高阳,从伯克利回国加入清华叉院, 是典型的新锐 AI 技术力量,和他搭档的 80 后韩峰涛,则代表中国具身领域的另一条路:他是一位在 2016 年第一轮 AI 热潮时开始做智能机器人的创业老兵。他见证过被抢着要份额的热潮,正如现在的具身赛道;也一度背负个人连带债务,度过行业的冬天。 这期节目,我们回顾了过去 15 年,韩峰涛亲历的中国工业机器人、智能机器人再到具身智能的变化。也聊了近期具身领域,数笔大额融资背后的行业转折和 26 年的竞争主题。 我们提到了 1 次 VLA,0 次世界模型,但提到了好多次客户,这是韩峰涛的肌肉记忆。 但他也反复说:26 年不会是具身行业的落地生死之年,而是具身模型性能快速爆发的一年,这是一个经历过上一轮起伏的创业者,转变的决心。 本期嘉宾:韩峰涛 千寻智能创始人&CEO 本期主播:程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -2015-2024:工业协作机器人的 10 年创业: 02:03 浙大、中国核电、国机:找不到工作的模式识别研究生 09:10 国产替代 → 2016 年 AI 热潮 → 大模型:技术变革终于来了 14:37 在大厂下场前成为“中厂” -2024 第二次创业:千寻智能的成立 22:40 密集见了 100 多人,找到合伙人高阳,“靠谱的太少,骗子太多” 33:02 26 年的具身领域会像 23 年的大模型:模型性能淘汰赛 -解决数据瓶颈 35:55 主要靠真实数据,24 年 5 月开始开发 UMI、外骨骼等穿戴式数采设备 -落地应用探索 46:59 宁德时代在具身行业里广发需求 53:33 场景选择门道:当前智能能力、节拍、精度、负载、价值(用量)和容错率的综合考量 59:01 未来场景拓展:先工业、商业,再家庭;先 to B 再 to C 01:04:37 26 年不是具身落地生死之年,而是模型性能爆发的一年 -从 Robotics 到具身智能 01:15:57 第一次创业起伏:资金链 3 次紧张,背负个人连带债务 01:25:24 新一批年轻创业者有相似的“天真”,“真的见过客户”后会改变 01:28:12 从 Robotics 到 AI 思维的转变:数据,数据 01:33:57 建立一个信任、追求卓越的组织 连点成线 相关链接: 独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 本期剪辑:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
151
151: 访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
「软件应用也可以 “3D 打印” 了。」 当 Agent 构造变得越来越简单,会发生什么?Agent 交易平台 MuleRun 创始人陈宇森分享了他的观察和创业实践。 陈宇森是一名少年成名的连续创业者,22 岁从浙大毕业后创办网络安全公司长亭科技,5 年后卖给阿里云,现在他带着对 AI Agent 的理解重新出发。 MuleRun 基于这样一个核心假设,当 Vibe Coding 大幅降低了应用开发门槛,Claude Code 带来 Agent 创作新方法,大量非技术背景的人也能把自己的工作知识和流程封装成一个个勤恳的 AI 骡子,实现个人工作的自动化。 这期内容包含两次聊天,分别发生在 25 年 12 月和 26 年 1 月上旬,不到 1 个月里,随着 MuleRun AgentBuilder 开始内测,陈宇森和 MuleRun 的思路已发生了一些变化。 他认为,未来的 market place 不再会是过去我们熟悉的货架形态,而是在对话中触发交易。MuleRun 的调整本身,也是当前 AI 应用瞬息万变的一个缩影。 这期节目的后半段我们也聊了一个创业 10 年,成立过 4 家公司,经历过成败起伏的创业者,如何以「用心」避免陷入平庸和对抗自我怀疑。 本期节目的图文版也已经发布:访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的 本期嘉宾: 陈宇森,MuleRun 创始人 & CEO 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线跳转: -12 月底的访谈:寻找方向、Agent 交易平台的机会与难点 02:20 从 Vibe Coding 到 Agent 交易平台 09:20 Agent 的供给还不够丰富,但 Claude Code 带来拐点 16:41 MuleRun 做的两件事:好的 Runtime、清晰的 Skills、Prompt 的商业化 23:08 同样的技术变化,不同的做法:N8N、Dify、Coze、蚂蚁灵光、马卡龙、Youware 28:54 上线 3 个月:用户反馈、Agent 审核与上架、大量 SOP+少量大模型的开发方式 36:50 做好 Agent 的开发工具和交易平台的难点 40:29 如果 Agent 建造门槛大幅降低,通用 Agent 还存在吗? -1月中旬的访谈:Agent Builder 内测开启、交易平台不会再是货架式 42:21 再聊 Claude Code:Skills 详解,MuleRun 的 Skill 评价体系(Eval)和安全工作 47:32 “应用的 3D 打印机”,未来的软件是日抛式的,AI 是制造业 52:12 Agent Builder:从套壳模型→套壳“Claude Code” 01:01:22 Agent 构造变简单、数量变多:未来的 Market Place 不应该是货架式的 01:08:32 Agent Builder 的内测效果,Agent 开发工具和交易的界限? -12 月底的访谈:创立 4 家公司,成功退出过也低谷过,以「用心」对抗平庸 01:15:40 从长亭到同时创业做两家公司,一度觉得自己无所不能 01:25:24 走过下坡路,关过公司,痛苦带来的韧性 01:32:13 一定不要在选择题上出错,「用心」对抗平庸 01:40:16 26 AI 应用市场年会发生什么?跳出 Chatbot、跳过 1 亿甚至 10 亿美元 ARR 01:44:02 连点成线 往期相关节目: 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need|Agent#1 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6 150 期:年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
150
150: 年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线
这期是「晚点聊」的年终特别节目,在 AI 大事必定发生的春节之前,总结 2025 年和即将过去的蛇年,我们在 AI 领域的观察和见闻。 本期节目,我会以单口的形式来讲述,我将按几个大的主题来串起这一年在 AI 领域的观察,行业的一些大事件,以及「晚点聊」的相关节目,和整个《晚点 LatePost》对 AI 的更多报道。 你将你听到以下 7 个章节的内容:1.模型;2.应用;3.巨头的 AI 之战:字节、阿里、腾讯;4.创业公司们;5.具身智能;6.AI 硬件;7.AI 中的人。 在每个章节中,我会按照若干关键词来展开要点,并穿插指路《晚点聊》的相关往期节目或《晚点》的相关文章。我会把提到的文章,列在 shownotes 里。 历史正在加速发生,AI 洪流中,五色使人迷目。但人是意义的动物,我们总试图理解和抓住什么。 希望这期年底的大型“连点成线”,可以帮听友得到一份正在拓展中的 AI 地图。 时间线跳转: 1.模型 01:10 Agentic Model:R1 | Coding | 多模态 08:58 协同优化:Google | DeepSeek 开源周 | 注意力机制改进、芯片互联 15:22 下一个学习范式:从大脑获得灵感 2.应用 19:49 Agent:Coding 就是 General Agent | 垂类 Agent | Agent 工具链 32:02 Sora App:to C 的想象力 37:19 AI for Science:AI 科学家 3.巨头的 AI 之战 40:23 人才和组织之战 49:51 To C 应用大战 4.AI 创业公司们 01:01:28 大模型第一股 01:07:13 5000 万美元 ARR 01:11:36 全球化与中美之间 5.具身智能 01:14:29 投资和上市潮 01:22:09 数据、模型、本体的进展 01:28:05 5 个落地方向 6.AI 硬件 01:34:50 AI 眼镜能成为下一个入口吗? 01:44:30 深圳的公司们 7.AI 中的人 01:49:48 天价薪酬与失业 01:52:39 使用用 AI 的人 01:54:25 意义感:大模型无法替你活过 相关联链接: 《DeepSeek-V3/R1推理系统概览》 Top Lean AI-native Companies Leadboard:https://leanaileaderboard.com/ 本期中提及的《晚点聊》往期节目,可根据期数搜索;本期中提及的《晚点 LatePost》相关报道: 「应用」 《实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?》 《“先抖音后剪映” 不再成立,OiiOii 闹闹聊 AI 时代的创作工具和内容社区丨100 个 AI 创业者》 《他给普通人配了个 “AI 剧组”丨100 个 AI 创业者》 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 《25 岁,他想做 AI 时代的微信丨100 个 AI 创业者》(Intent) 《对话与爱为舞张怀亭:大哥创业不走弯路》 「巨头 AI 之战」 《腾讯在 AI 拐点到来前的 700 天》 《字节 AI 再创业:独立组织、全链条的饱和出击》 《重新认识阿里:大踏步迈向 AI》 《字节、阿里、腾讯的 AI 人才竞赛:2330 个研究者背后的共识与分歧》 《字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争》 「具身智能」 《特斯拉人形机器人再延期,因为双手只能用六星期》 视频:《具身智能的幻想与现实》 「AI 硬件」 《这个 30 克的挂件,是 AI 的眼睛丨100 个 AI 创业者》(Looki) 《“通用产品是空中楼阁”,潘宇扬聊 AI 硬件丨100 个 AI 创业者》(Odyss AI 项链) 《对话 VITURE 姜公略:把 AR 眼镜卖到美国第一 ,从负需求到离不开》 《对话拓竹陶冶:我们一群工程师,一起造一个朴素的硬核公司》 《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?丨新新访谈》 《我们要培养什么样的工程师?李泽湘教授对三十年工科教育改革的回顾》 本期剪辑:甜食、Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
149
149: 具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
「用大规模测评驱散 PR 式 demo 的迷雾。」 虚拟空间的大模型有大量 benchmark,测试非常直观;而在如火如荼的具身领域,怎么衡量模型能力,本身还是需要探索的课题。 这期,我们邀请了两位具身智能从业者,原力灵机联创范浩强和千寻智能联创与首席科学家高阳,一起聊具身模型的测评。 范浩强从高三就开始在旷视工作,有丰富的计算机视觉开发和落地经验;高阳回国前在伯克利 BAIR 攻读博士,和 PI 的联创 Sergey Levine 有诸多学术合作。 去年 10 月,原力灵机和 Hugging Face 联合发起了全球首个具身智能的大规模真机评测平台 RoboChallenge。在前不久释放的最新测评结果中,千寻的 Spirit v1.5 模型登顶榜单,表现超过 π*0.5。 RoboChallenge 测评平台网站:https://robochallenge.ai/home 图注:RoboChallenge 测评现场 在 RoboChallenge 的测评中,机器人不再只活在精挑细选的 Demo 视频里,而是要在多样化的“Table 30”任务中接受真实世界的“毒打”——任务包括碎纸、插花,扫二维码。 这期我们聊了具身模型测评的难点,RoboChallenge、RoboArena 等目前的大规模测评尝试是怎样的思路?行业里心照不宣的 demo 工程,以及 2026 年,我们可能从哪些路径逼近具身智能的 GPT-3 时刻。 范浩强和高阳说,组织和参与测评的过程,组织和参与测评的过程,本身增强了他们对具身的信心,,从 π*0 在 Table 30 任务上只有 20% 的成功率到 π*0.5 的翻倍和一些国产模型的超越,具身仍很早期,但进步速度也很惊人。 本期嘉宾: 范浩强 原力灵机联合创始人 高阳 千寻智能联合创始人、清华大学叉院助理教授 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -发起 RoboChallenge,行业呼唤大规模测评 03:24 范浩强和高阳的从业经验 06:53 RoboChallenge 的发起,见证成功率从 π0 的 20% 到 π0.5 的超 40% 12:40 以往方法的问题:环境不一致、测评不持续、仿真有局限 21:47 对比 RoboArena 和 RoboChallenge:前者是分布式 Zero-shot 测评;后者是集中 few-shot 测评 28:33 上线 2 个多月的观察:超预期的 1 万条测试提交,国产模型超越 33:04 Table 30 任务集的设计,插花、扫二维码等任务的“刁钻”考点 40:24 提交者自己做 fine-tune(微调),开源权重证明诚信;接下来会更新灵巧手的测评 -2026 年具身展望 45:07 学习原理已经收敛,Scaling Data 是 2026 年的行业主题 48:53 4 种数据类型,各团队的不同数据 bet 57:20 落地应用,具身的“Coding”任务是什么?“破圈”时刻何时出现? 01:07:00 大众与从业者之间的认知落差,行业心照不宣的“demo”工程 01:12:50 具身测评可以被 Hack 吗?如何反制 hack? 01:14:52 26 年想验证的问题:具身中国追平美国的 DeepSeek 时刻是否到?基模能否上一个台阶? 01:17:47 连点成线:总结观察具身进展的 3 个维度 & 具身创业团队的不同来源 附录:本期中出现的一些人物、技术名词、项目、公司 -Sergey Levine:Sergey Levine,加州大学伯克利分校教授,机器人强化学习与通用学习系统的重要推动者。曾参与 Google / Google Brain 的机器人与强化学习研究,并共同创立具身智能公司 Physical Intelligence(PI)。 -π 系列模型:PI 提出的通用机器人模型系列,最新版本 π*0.6。 -CIFAR:一个经典计算机视觉数据集,相比之后出现的 ImageNet,它规模更小、分辨率更低,常用于快速实验和教学。 -Sunday Robotics:由 Tony Zhao 与 Cheng Chi 在 2024 年联合创立的家庭场景通用机器人公司。 -Generalist AI:2024 年成立的美国通用机器人 / 具身智能的创业公司。 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
148
148: 访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡
「华为前自动驾驶首席科学家投身具身创业。」 本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。 2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。 陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。 在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。 这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。 本期嘉宾:陈亦伦,它石智航创始人兼 CEO 本期主播:程曼祺,晚点 LatePost 科技报道负责人 时间线: -从华为、清华到创立它石,看到具身的三道曙光 02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码 11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例 17:13 端到端、VLA、世界模型,联系与区别 20:40 三道关卡:数据、算法、后训练 24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身 30:16 定义具身模型的训练任务:建立空间概念、跟世界交互 -数据解法:真实数据而非仿真和视频数据,手套采集而非遥操 40:54 具身需要真实数据,不看好仿真和视频数据 49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解 55:08 手套+第一视角摄像头采集数据的具体实现 59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势 01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展 具身已经到了 Scaling 的临界点 01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点 01:18:04 它石的落地场景之一是处理柔性材料的线束装配 01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择 01:22:38 连点成线:往期分享 往期具身智能访谈: 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 剪辑制作:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
147
147: 访谈OiiOii闹闹:“先抖音后剪映” 不再成立,AI 时代的创作工具和内容社区
「Agent 的工具可以以终为始。」 今天这期节目,是晚点的作者祝颖丽对 OiiOii 创始人闹闹的访谈。本次访谈的文字版今天也会发布在《晚点科技》公众号上。 OiiOii 是一款动画创作 Agent。刚刚在 25 年 11 月开启内测。闹闹自己是一名动画爱好者,2014年,在微信工作 3 年后,她辞职学了半年动画。但当时她发现,做动画太难了,行业环境也很糟。 时隔10年,在自己创过业,去字节做过剪映,在大模型公司阶跃星辰做过二次元社区产品“狸谱”之后,她找到了用 AI 延续动画梦想的方法。 这期,闹闹分享了她和团队是如何构思和做出 OiiOii 的,以及她过去的创业和大厂经历。 图:OiiOii 官网页面。地址:https://www.oiioii.ai/home) 本期嘉宾:闹闹,OiiOii 创始人 本期主播:祝颖丽,《晚点 LatePost》 作者 时间线跳转: 05:06 先做好工具,再去做内容的社区:因为大家不再能忍受内容的单调了 11:40 市场现状:现在动画的产能和消费非常不对等 16:46 OiiOii为什么是这个形态? 31:04 如果做AI漫剧,商业模式、审美都不一样 41:30 怎么利用和理解不同的模型 51:50 现在的团队分工 53:50 第一次创业做极限运动社区,发现其实喜欢做内容 01:06:17 第一次创业留下的最宝贵的东西:抗体 01:18:15 在字节:对剪映和抖音特效最大贡献是… 01:27:17 去了B站:看到产能被憋着了 01:28:45 OiiOii 后面大致的节奏:填充垂类内容,去海外,做内容社区 往期「AI 应用/AI Agent」创始人访谈: 晚点聊 136:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类 晚点聊 125:用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型 晚点聊 111:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 剪辑制作:Nick ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
146
146: Gemini 3翻盘背后、Agent需要什么大模型、RL创业机会,与前 Google 创业者、硅谷投资人聊湾区动向
「一线开发者看到的前排变化。」 本期是 137 期 Agentic 工具链节目的嘉宾返场,Henry 和 Naomi,他们近期刚刚和普林斯顿 AI 加速创新中心联席主任,王梦迪教授,一起成立了一家新的早期 VC,MoE capital。 这次一起的也有两位之前在 Google DeepMind 和 谷歌云 Vertex AI 平台工作 7 年,刚刚创业,成立 Agent 工具层公司 Precur 的戴涵俊和 Bethany。 我请他们分享了,岁末年初,在硅谷观察到的 AI 水温,OpenAI、Google 等一系列新模型进展背后的故事,和围绕当今 Agent 与 RL 生态的创业机会。 这是我们本年关于 Agent 的第 8 期节目。 本期嘉宾: Bethany Wang,Precur 联创 戴涵俊,Precur 联创 Henry Yin,MoE Capital 创始合伙人 Naomi Xia,MoE Capital 创始合伙人 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线: -基础模型竞争和幕后故事:Google 在旧金山开 Gemini 3 Party 的同一天,OpenAI 发布 GPT-5.2 06:11 AI 进入实用工作:OpenAI 的 GDPval,Databricks 也发布了 Office QA 14:25 GDPval 在主流知识工作上表现优秀,但基础模型处理长尾问题的 gap 始终存在 19:09 Gemini 3 后,OpenAI、Anthropic、Google、各自的进展 22:15 NotebookLM 和 Nano Banana 策源地——Google Labs,不仅招工程师,也有主编、作家、创作者 24:54 DeemMind 研究员 Orio:Gemini 3 的秘密?预训练还有很多空间;TPU 对 Google 训练的加持 26:34 Google 的 3 层协同优化:从 TPU 到 Infra 到模型;模型和应用;数据和硬件 surface(终端) 30:18 Google TPU 已经更多对外,这对英伟达 GPU 优势的影响 38:02 回顾组织变化:DeepMind 和 Google Brain 的合并与磨合 -大厂竞争中,新公司的成长:围绕 RL 与 Agent 的创业机会 43:31 垂类的机会:弥补基础模型到具体问题的差距;水平的机会:调度层、数据层、工具层都有新公司涌现 50:17 技术新趋势——自我演化:RL、用 RAG 加长记忆有人尝试,但远不是成熟方案 53:32「可训练的工具层」背后的技术变化:code 驱动工具,如 Anthropic 的 PTC(Programmatic Tool Calling) 59:44 RL 创业方向:RL 环境,RL as a Service,RL 应用 01:08:47 Agent 开发者挑选模型的前置条件:用什么云(比如 Azure 客户用不了 Gemini),再看云厂商折扣 01:12:20 Anthropic 的 Claude Code 已成为 Agent 核心,刚发布的 Promatic to Call 探索新开发范式 01:17:13 开源模型使用体验:Qwen 很棒;驶往 NeurIPS 的飞机上,1/3 人在看 DeepSeek-V3.2 技术报告 01:22:04 选择模型时,关注什么 benchmark & 为什么? 01:29:34 模型优化方向预测:加入大量 agent trace 的开源模型,更强的多模态,长程任务优化 01:38:58 连点成线:往期节目推荐 《晚点聊》今年关于 Agent 的更多节目: 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 晚点聊 110 期:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》 晚点聊 111 期:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 晚点聊 130 期:手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机 晚点聊 136 期:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent| 晚点聊 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起 晚点聊 138 期:从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI 附录: 本期中提到的一些 benchmark: -GDPVal:OpenAI 今年 10 月发布的、用于评估大模型在复杂推理与决策场景中“价值对齐与结果质量”的验证型 benchmark,强调输出是否符合人类偏好而不只是“做对题”。 -ARC-AGI-2:ARC Prize 今年 3 月发布的、用于测试模型在少样本条件下的抽象、组合推理能力,被视为接近“通用智能门槛”的挑战集。 -OfficeQA:Databricks 今年 12 月发布的、围绕办公场景(文档、表格、邮件、日程等)的 benchmark,用来评估模型在真实工作流中的信息检索、理解与执行能力。 本期中提到的一些产品/服务、公司 -PTC(Programmatic Tool Calling):Anthropic 今年 11 月底发布的一种新的工具调用方法 https://www.anthropic.com/engineering/advanced-tool-use -Tinker:Thinking Machines Lab 今年 10 月发布的首个对外产品 https://thinkingmachines.ai/blog/announcing-tinker/ -Preference Model:一家旧金山初创企业,做强化学习环境 剪辑制作:甜食、Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
145
145: 对话极壳孙宽:首个「消费级外骨骼」的诞生
「创业治好了我的死亡焦虑。」 极壳是第一家把外骨骼做成消费级产品的公司。21 年成立以来,他们经历过账上只有20万元人民币的危急时刻,也刚在今年融到了 7000 万美元,出货量达到数万台。 图注:极壳已发布 4 款消费级外骨骼产品。 这只是个开始,远远不意味着成功。孙宽多次告诉我们,消费级外骨骼还在非常早期的阶段;他享受定义一个新品类的乐趣,也深知跨越鸿沟,走出小众市场的挑战。 这是一家起步时没有风口的公司;这是一个父母开手机卖场,从小做各种发明,但没有名校光环的创始人。 孙宽分享了他早年的“折腾”经历,他创立极壳、开发出第一款产品的故事,以及他对未来的更多想象。 图注:孙宽是一个户外爱好者;极壳的主要目标用户是户外人群,外骨骼可以帮助他们增强运动能力。 本期嘉宾:孙宽,极壳创始人 & CEO 本期主播: 程曼祺,《晚点 LatePost》科技报道负责人 李梓楠,《晚点 LatePost》科技报道作者 时间线跳转: -水滴字幕、光固化 3D 打印机、3 年轮岗、内部创业 03:05《攻壳机动队》、90 后的科学幻想、技术是魔法 13:25 第一份工作:从轮岗 3 年到模块化 PC 的内部创业 18:27 一次误诊后回到初心:做一件做着做着挂了的事也不会后悔 -从 1 人公司,到第一款消费级外骨骼 26:51 1 人公司手搓原型,一度账上只有 20 万元人民币 40:06 做“真有用”的消费级外骨骼:拉高核心正面效果,尽量降低负面影像 49:41 推倒第一代方案,用户体验比新架构重要 01:04:27 正式交付 Hpershell X,有人日行 7 万步,有人重返户外 -效率的迭代:从 40 个月到 5 个月 01:09:11 从成立到第一款产品,40 个月;第二代产品,5 个月 01:05:08 从 1 人公司,到 4 位联创和 200+团队 01:25:47 对拓竹组织的观察:好的人,希望身边都是好的人 -跨越鸿沟 01:32:52 品类跨越鸿沟:营造向往、价格、自研、形态拓展 01:49:47 组织跑得更快 -创业之后更踏实了,“活对了的感觉” 01:56:22 创业治好了我的“死亡恐惧”。 01:59:53 广义的外骨骼,最终是让我们的身体可编程。 02:05:40 连点成线:后记 & 往期节目推荐 往期「消费科技」创始人访谈: 晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动! 晚点聊 141 期:大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身 往期「AI 硬件」创始人访谈: 晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 晚点聊 118 期:天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人 晚点聊 122 期:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩 剪辑制作:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
144
144: 从「大而强」到「小而强」,密度法则、RL 的 Scaling Law 和智能的分布式未来
本期嘉宾,是清华大学的刘知远和肖朝军,他们刚在 11 月的《自然》杂志《机器学习》子刊上发表了封面文章:Densing Law of LLMS,大模型的密度法则。所谓“密度”,就是用更少的算力和数据获得相当乃至更多的智能。 刘知远是清华计算机系副教授和面壁智能首席科学家,肖朝军现在在清华做博士后,也是面壁 MiniCPM 系列的文本模型负责人。 图注:此图描述了 2023 年 4 月之后,主要开源模型的能力密度的变化。能力密度是衡量单位参数/算力下,模型能力的指标。目前版本的密度法则总结了预训练大语言模型的密度变化,o1、R1 等后训练强化学习对能力密度的提升尚未体现在指标里。 我们讨论了密度法则研究的源起,也展开聊了业界提升模型能力密度的具体做法:如何从架构、数据治理、算法和软硬协同优化 4 个环节着手提升模型能力密度。 而再往后,更大的密度提升,可能需要一些全新方法,因为强化学习的 Scaling Law 还未清晰展现,未来可能有两种技术路线:一是继续扩大强化学习的规模,观察其中是否涌现更多泛化能力;二是寻找新的学习方式。 在刘知远的设想中,未来,更高密度的模型,会支持每个人在端侧的专属模型,智能会分布式存在:也许手机都不是最终的入口,而是一个可以随身携带的个人计算设备:“就像一个可以随身携带的 NAS”。 图注:达到 GPT-4V 水平的模型参数规模随时间增长迅速缩减,而端侧算力快速增强,当芯片电路密度(摩尔定律)和模型能力密度(密度法则)两条曲线交汇,端侧设备将能运行以往只能在云端运行的大模型。 性能一直是人们更关注的模型演进的脉络,而这期我们会讨论,在另一条主线“效率”上,我们可以做出什么努力。 本期嘉宾: 刘知远,清华大学计算机系副教授、面壁智能首席科学家 肖朝军,清华大学计算机系博士后、面壁智能 MiniCPM 系列文本模型负责人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -大模型时代的“摩尔定律” 02:09 Gemini 3 和 Nano Banana Pro 的启发:统一的“自回归式视觉+语言生成”即将突破 04:31 大模型演进的两条主线:能力和效率 10:23 和摩尔定律一样,“密度法则”是行业现实,也是“自我实现” 18:43 每 3.5 个月,大模型的能力密度翻一番 21:01 2023 年下半年的抉择:花几千万再训一个更大的模型,然后呢? -提升密度的四个环节 27:08 架构、数据、算法、软硬协同优化 30:41 (1) 架构:MoE (混合专家系统) + 注意力机制改进 34:28 (2) 数据治理:Ultra-FinWeb 用 1/10 数据量达到更好效果 40:24 (3) 算法:RL 还没有 Scaling Law,接下来可能有两条路 49:21 (4) 软硬协同优化 52:02 InfLLM-V2 的核心更新:把稀疏注意力做到预训练阶段 55:18 注意力改进趋势:长文本不仅是长输入,更多关注“长输出” -大模型上车、上手机 58:53 5 年内,手机可跑 GPT-4~5 级别的模型 01:06:23 大模型在汽车上已开始量产落地 01:10:34 “别人得到的,不一定是你失去的”,AGI 既会发生在云端,也会发生在终端 01:15:07 未来入口也许不是手机,而是属于每个人的移动计算终端 -AGI 下一步:自主学习 + 分布式的智能 01:17:40 自主学习→AI 协作网络→真正的创新 01:21:04 2023 年初,有巨头说世界上只会拥有几个大模型,就像 1943 年,IBM 董事长曾说全球不需要超过 5 台主机 01:24:46 AI 助手帮成为更好的工作者 01:28:53 不担心生产过剩,未知领域还太多 01:31:39 机器制造机器,AI 制造 AI 01:40:01 ☆连点成线 相关链接: 晚点聊 143 期:《再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Densing law of LLMss(《大模型的密度法则》) Efficient GPT-4V level multimodal large language model for deployment on edge devices(本期中提到的,具身行业喜欢引用的图的原始论文。) InfLLM-V2: Dense-Sparse Switchable Attention for Seamless Short-to-Long Adaptation(InfLLM 稀疏注意力改进的第二版。) 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
143
143: 再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进
「不仅是提效,线性注意力在数据受限情况下的更多潜力。」 今年初的两期节目(103、104 期)里也讨论过注意力机制,这是大语言模型的核心机制。 9 月 和 10 月,阿里和 Kimi 都发布了相关进展,而且都用到了一个线性注意力成果,DeltaNet。 本期嘉宾,就是 DeltaNet 的核心贡献者之一,现在在 MIT 读博士的杨松琳,她也是线性注意力开源小组 FLA 的发起者。 这期节目在 25 分钟以前很硬核,松琳讲了线性注意力和 DeltaNet 的发展脉络,为何 21 年刚被提出时没引起太多注意,后来怎么进化的。 25 分钟以后,是关注 AI 比较多的文科生,比如我也能完全跟上的部分。我们讨论了,重新去做 full attention 的 MiniMax,以及未来要在旗舰模型上用线性注意力的 Kimi 和阿里的不同选择;线性注意力的优劣势;以及一些脑洞——如果算力无限,还需要线性注意力?松琳给了很有启发的回答。 最后半小时,松琳分享了她作为研究员,怎么习得交叉技能的,怎么开始发起FLA小组等成长经历。 本期嘉宾:杨松琳,MIT 博士生在读,DeltaNet 贡献者 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -DeltaNet 的诞生演进与近期动向 02:07 注意力机制是什么? 04:21 DeltaNet 的提出,用 Delta Rule 来增强 in-context retrieval 09:41 近年的改进主要是模型架构,而非“更新规则” 14:25 阿里 Qwen 团队 apple to apple 比较几种线性注意力混合方式;Kimi Linear 对 Gated Delta 的具体改进 17:00 更新规则和模型架构改进的区别:更新规则是在算子层面“动刀” 19:50 算法出身,自学 Infra;学习 Hazy Research Group 的风格 23:28 Qwen 和 Kimi 大概率在下一代旗舰模型用线性注意力,而 MiniMax 用回 full attention;DeepSeek 目前释放的改进都是“稀疏注意力” 37:07 稀疏注意力 vs 线性注意力潜力对比 39:40 即使算力无限,线性注意力仍有价值,因为它在有限数据中的学习效率更高,而高质量数据正是当前瓶颈 42:28 线性注意力在状态追踪上也可能有效果优势,而状态追踪对 Agentic 很重要 47:33 线性注意力的“归纳偏见”和 The Bitter Lesson:先验与 scalable 并不矛盾 49:30 回应 RWKV(原始智能)彭博:从未说发明 DeltaNet,一直在给 Schmidhuber 署名 -Householder 与 DeltaNet 的联想,像运营产品一样运营技术社区 51:51 关注注意力改进的起点,数学知识、Infra,交叉能力怎么积累? 58:48 发现 Hoseholder 累乘和 DeltaNet 关联的过程 01:02:44 AI 何时能像人这样产生联想?——Prompt 合适,大模型应该能独立发现这个算法 01:04:11 FLA 小组的产生,受 Tri Dao 做 FlashAttention 的启发,像运营产品一样运营技术社区;Kimi 从 FLA 小组招募了线性注意力研究者 -注意力改进的未来趋势 01:11:24 稀疏注意力的改进,DeepSeek 年初 NSA 到最近 DSA 的变化 01:16:44 线性注意力的改进,从线性混合全注意力,到线性混合稀疏注意力(比如混合 DeepSeek DSA 和 Kimi KDA 😀 01:21:10 更广泛来说,关注何种模型演进?——持续学习 相关链接: 图文版:《再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进丨晚点播客》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 晚点聊 104 期:《我给线性注意力找“金主”,字节 say No,MiniMax say Yes》 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention Linear Transformers Are Secretly Fast Weight Programmers Parallelizing Linear Transformers with the Delta Rule over Sequence Length Gated Linear Attention Transformers with Hardware-Efficient Training Recurrence-Complete Frame-based Action Models 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
142
142: 一款能主动教学的 AI 产品是如何出现的|对话斑马 CPO 修佳明
教育或许是最难被技术改造的领域,因为它太强调互动、个性化的体验与启发性的反馈,这个过程既难标准化,又无法快速复制。 直到大模型的出现,让人第一次看到了教育被技术大规模改造的可能性。市场上旋即涌现出来的各种五花八门的 AI 教育产品,它们从各种层面试图运用大模型的能力,但也反映出在原理技术到面向市场的商业产品之间,大模型在教育场景的落地还存在着一条难以被清晰描摹的鸿沟。 今天的播客,我们与斑马首席产品官修佳明探讨了这条鸿沟本身,以及斑马逾越它的方式。 基于大模型特点,原生构建的 AI 教育产品应该是什么样的?如何摆脱工具属性,让大模型 Agent 成为一个可以主导教学过程的教育产品?如何设计教学梯度、节奏和目标,既能发挥大模型的主动性,又不让一切偏离教学目的本身?如何让大模型更好理解人类在教学领域积累的各种经验,让它更好实践已被证明有效的各种教学法和教育心理学方法? 对这些问题的回应将决定一款 AI 教学产品的本质,进而决定它的商业化前景。修佳明给出了斑马的回答。 本期节目由 斑马口语 特别支持播出。 本期嘉宾:修佳明,斑马首席产品官 本期主播:申远,晚点 latepost 记者 时间线跳转: -Part1:斑马心中的全栈式 AI 教育产品 04:36 确定性的方向 08:01 与模型“搏斗” 13:58 为什么开发 delay 了? -Part2:主动性 VS 被动型,斑马产品的核心差异 20:56 从维持能力到突破能力 24:08 让大模型学会人的教学经验与教学法 29:36 更难的是对(教学)难度的控制 34:16 这种模式适合所有人吗? 35:54 让 AI 提供一种教学情绪价值 41:38 对 AI 外教人格的理解 -Part3:将 AI 产品推向市场 47:37 试用用户的反馈与规则设定 52:06 如何衡量 AI 的教学能力? 56:28 未来的 AI 教学产品会如何发展 59:22 如何运用数据和经验:斑马的 AI 壁垒在哪里 01:04:05 AI 产品还是教育产品?斑马的付费和定价策略 相关链接: 《主导型教育 Agent 产品,是口语学习的终极答案吗?》 本期主播:申远,晚点 latepost 记者 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
141
141: 大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身
「大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开。」 “大疆系”正成为创投圈的一股小风潮。2023 年夏天,洪小平创立 Strutt(若创科技),他曾任大疆光电部及激光雷达产品线览沃负责人。 Strutt 的首款产品 ev¹ 即将在明年初正式发售 ,它看起来是一台电动轮椅,而洪小平告诉我,ev¹ 不是一台智能轮椅,“而是一种新的移动出行设备”。这听起来有些抽象,直到我在旧金山遇到了 ev¹ 的用户:双臂残缺,只有两根手指的 Usman;脊椎脆弱的 16岁少女 Ali,和患有多发性硬化症的 Joe。 旧金山试用会现场,Scott、Micah 两位 YouTube 博主和 Usman 坐着 ev¹ 比赛,看谁先到达车道末端。(这张照片里就有两台 Insta360 X 系列全景相机,现场也有好几台大疆 Pocket 3。) 我更多感受到的他们与我们的相同。他们不仅想要基础保障,也想要更好的生命体验。科技爱好者 Usman 戴着 Apple Watch 和 Ray-ban Meta,他曾用 Vision Pro 操控 ev¹;Ali 给轮椅编织了花朵;Joe 那天分享了很多他年轻时旅行和玩帆船的旧照片。他们渴望的不是另一台轮椅,而是减少出行顾虑,能去更多地方的自由。 我自己也两次试用了 ev¹,Copilot+ 模式的驾驶体验对我来说也很有趣。洪小平设想,在大型公园、机场等区域,更多人可能都需要 ev¹ 这样的设备。 本期,这位曾经在伯克利研究纳米材料的物理学博士,分享了他在大疆,如何从研究者转型为业务负责人;以及创业两年半以来,组建团队,开发产品、做减法的历程。 本期访谈的图文版:《大疆览沃前负责人洪小平创业:我做的不是一台电动轮椅》 本期嘉宾:洪小平,Strutt 创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -投资人总问:为什么你们不做人形机器人? 02:07 伯克利物理学博士→组建大疆光电部:奔着量产做激光雷达 08:26 大疆→南方科技大学:新工科教育 & 思考创业,锁定「机器人」方向 14:03 直接做人形机器人和具身“终极形态”,是“有方法、没路径” 18:04 OpenAI 加大投入 LLM 时,已有早期信,具身没到这个状态;识别早期信号的核心是数据积累 22:43 看到“老龄化”去收,就是它了! 25:13 个人移动设备能获得宝贵的家庭、生活场景数据 -ev¹ 的诞生,它不是电动轮椅 29:28 ev¹ 是泛个人出行设备,它的完整体验 35:07 出行的自由和喜悦,不分健康或残疾、衰老或年轻 41:13 大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开 43:26 ev¹ 的开发,从做加法到做减法 47:51 观察用户说不出来的需求; 51:19 ev¹ 也是一个 Robot Helper 和机器人平台:可加传感器、执行器、计算单元等配件 56:50 在双滚机上做 200 万圈测试 58:33 “产品真正帮到人”的感觉,很触动 01:00:54 Go to Market 策略:定价、渠道、规模 -什么是一个好团队?大疆怎么又极致,又“舒适”? 01:03:55 创业,从“定义一个好团队”开始 01:07:25 大疆的“舒适”:技术说话、以结果论英雄、可以专注自己的事 01:12:35 应对未来可能的竞争:品牌、专利布局、团队综合性,本质是团队效率 01:19:33 消费科技公司,在高效 vs 速度上的分布:追觅、Insta360、大疆 01:22:39 为什么大疆到 2019 年才定成文价值观? 01:24:43 Next Question:跨越鸿沟——ev¹ 这样的产品怎么进入大众市场? 01:28:06 连点成线:往期推荐 附(播客中提到的部分术语、人物的表达可见图文版,如 VLA、PaLM-E、RT-2、吴景深等,以下摘录文字版中没提及的部分): 王铭钰:汝原科技创始人,大疆前研发副总裁,主导多款旗舰无人机的工程体系建设。(节目中提到的邀请洪小平加入大疆的港科本科同学) 魏基栋:松灵机器人创始人兼 CEO,大疆 Robomaster 业务的一号员工和联创,2016 年创业;库犸智能割草机即由松灵推出。 拓竹:一家 3D 打印机公司,旗下也有 WorldMaker 3D 模型共享平台;由陶冶创立,他曾任大疆动力系统部门经理、Mavic pro 产品经理、大疆消费级无人机事业部负责人。 Invacare:美国医疗辅助设备公司,以轮椅、助行器等康复产品为主营(节目中提及的已退市的行业公司)。 肖文龙:Strutt 联创,大疆早期动力系统技术负责人。 大疆 Inspire 产品线:定位于“专业级航拍/影视器材”的无人机序列,是航拍行业的主力设备与标杆产品。 张富:香港大学 工程学院机械工程系副教授,研究方向为激光雷达-惯性/视觉融合 SLAM 算法。 激光雷达 SLAM 算法:基于激光雷达点云定位与建图的算法,让机器人在未知环境中自行导航。 相关链接: 晚点聊 120 期:《科创板后再访Insta360刘靖康:这何尝不是一种极限运动!》 晚点聊 118 期:《天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人》 晚点聊 87 期:《家里又多了个“怪东西”!与云鲸聊新消费电子品的诞生》 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
140
140: AI for Science,从开始到现在 | 对话深势科技张林峰、孙伟杰
「从物理的黄金时代到 AI 的黄金时代。」 大模型热潮正在深入一个硬核领域:AI for Science,用 AI 加速科学发现。由斯坦福大学前校长参与创立的 AI for Science 公司 Xaira Therapeutics,去年一启动就募资超 10 亿美元;OpenAI 也在今年成立“OpenAI for Science”部门,刚在上个月雇了一位黑洞理论物理学家。 早在 6 年多前,中国的 AI for Science 创业实践已经开始。最适合讲述这个故事的是张林峰和孙伟杰。 2018 年,25 岁的他们创立深势科技。 2022 年 3 月,张林峰写文:《AI for Science 2022:未来已来,即将开始流行》https://mp.weixin.qq.com/s/xhGVSY5jBqVMiXrdSKgdcQ 。8个月后,ChatGPT 才发布。 深势的起点,是用 AI 加速求解量子物理中的“第一性原理计算”,即求解“薛定谔方程”等一系列基础量子物理方程。这是量子论和 AI,跨越百年的两个黄金时代的相遇。 1993 年出生的张林峰来自山西汾阳,因参加物理竞赛保送北大。在定位于跨学科教育的元培学院,他同时修了物理、数学、计算机。与张林峰同龄的孙伟杰来自佳木斯,主修政经哲。两个北方高个儿男孩是院篮球队、羽毛球队队友,也在元培学生会体育部搭档。 大二时,元培体育部举办趣味羽毛球赛后,孙伟杰(左)和张林峰(右)从邱德拔体育馆骑车回宿舍。 6 年多来,深势科技推出了 Hermite 药物计算设计平台、Piloteye 能源电池研发平台;以及一系列预训练科学模型,如分子大模型 Uni-Mol、实验表征大模型 Uni-AIMS 、蛋白质大模型 Uni-Fold、基因大模型 Uni-RNA 等;科学文献大模型 Uni-SMART;和综合这些积累的科研平台与科研 Agent,“玻尔科研空间站” 和 SciMaster;服务了宁德时代、比亚迪、多氟多、长安汽车、京东方、东阳光药、人福医药、诺泰生物等企业客户。 本次访谈,我们与张林峰、孙伟杰一起回顾了他们亲历的 AI for Science 从开始到现在的发展脉络,深势科技在有限资源下经历的焦灼、抉择,和他们在科研平台与垂直应用间的取舍。 多年前,杨振宁曾在一次高能物理学术讨论会上说:“The party is over”,上一个物理大发现的时代已然远去。大三时,张林峰一度迷茫:“我们这一代希望从底层科学出发做点儿事的同学,都缺点儿让人兴奋的大问题。” 现在,派对又开始了。 本期访谈的图文版:__ 《对话深势科技张林峰、孙伟杰:AI for Science,从开始到现在》 **本次访谈之后也会发布视频版,可在抖音、B站、小红书、微信视频号搜索“晚点聊”或“晚点”观看。* 本期嘉宾: 张林峰,深势科技创始人兼首席科学家 孙伟杰,深势科技创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -起点:用 AI 加速“第一性原理计算” 01:32 93 年生人学物理,the party is over 的迷茫 08:42 用 AI 加速第一性原理计算:薛定谔方程、密度泛函、分子动力学 -提出 DeePMD:从“两亿核时”到“笔记本跑半小时” 21:31 第一个 milestone:用一套统一方法表示多种“不变性” 26:27 普林 2017 年的 200 多块 P100→DeePMD-kit→DeepModeling 开源社区 29:51 AlphaFold 和 DeePMD,AI 做科研的两种方式 -起步的 5 年:是公司,也是“大学” 32:38 毕业、回国、创业:机会是 AI for Science,不是 get simulation done 然后发论文 42:06 做微尺度的“达索系统”,把量子物理软件化 56:14 人才培养:在 DP “读大学”的少年们 -从机器学习到 Agent,AI 科学家,AI for Science 的五个阶段 01:04:37 机器学习数理建模→预训练→大语言模型→科研 Agent→AI 科学家 01:16:20 Agent 正在重塑科研范式 01:22:46 “科研无国界”被挑战,在中国,更能推动开源、开放 01:29:00 垂直还是平台,一个必须做的取舍 01:32:57 诺奖表彰“第一个”,而基础平台要做“最后一个” 01:39:24 我们为 AI 科学家做好准备了吗? -热血少年、沙漠流浪、灌篮高手 01:49:13 欲望与勇气,《牧羊少年的奇幻之旅》 01:55:33 “老爹,你最光辉的时候是什么时候?”“就是现在!” 01:57:21 “理想主义的实干者才能改变世界” 01:57:59 Next Question:Innovator 什么样?第一批 AI 发现的新成果 02:04:04 连点成线:不约而同,我们在好多期节目里都聊到了 AI 加速科学发现 相关链接: 张林峰:《AI for Science 2022:未来已来,即将开始流行》 张林峰:《在PD“读大学”的少年们》 晚点聊 116 期:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 晚点聊 101 期:《与王小川聊AI✖️医疗:通向“生命科学的数学原理”》 附:本期节目中出现的术语、人物、公司 鄂维南:应用数学家,中国科学院院士,张林峰在普林斯顿的博士生导师之一;主攻多尺度建模与机器学习在物理系统中的应用。 黎曼几何:研究带曲率空间的几何结构,是广义相对论数学语言的核心,由黎曼在 1850 年代提出。 古典微分几何:研究曲线和曲面的局部几何性质,是现代几何的基础框架,成熟于 1820 年代。 弦论:把“点粒子”换成一维弦来描述宇宙的高能物理理论,试图统一量子力学与引力。 冯济:北京大学量子材料科学中心,博雅特聘教授;罗纳德·霍夫曼的学生。 罗纳德·霍夫曼(Roald Hoffmann):诺贝尔化学奖得主,以理论化学和化学键研究著称。 邓肯·霍尔丹(Duncan Haldane):诺贝尔物理学奖得主,因拓扑量子物态理论贡献而闻名。 罗伯特·卡尔(Roberto Car):计算化学家,张林峰在普林斯顿的博士生导师之一,Car–Parrinello 方法共同提出者。 Michele Parrinello(米歇尔·帕里内洛):Car–Parrinello 方法的共同提出者。 Ab intio Molecular Dynamics 从头算分子动力学方程 :Roberto Car 和 Michele Parrinello 在 1985 年发表了论文(Unified Approach for Molecular Dynamics and Density-Functional Theory(《分子动力学和密度泛函理论的统一方法》),提出了Car-Parrinello 分子动力学方法。 薛定谔方程:量子力学的根本方程,描述微观粒子的波函数随时间如何演化。 波函数:在量子力学中刻画系统全部信息的数学对象,其平方给出概率密度。 密度泛函方程:密度泛函理论中的基本方程,通过电子密度而不是波函数求体系能量。 王涵:北京应用物理与计算数学研究所科学家,Deep Potential 的合作者之一 Deep Potential Molecular Dynamics(DeePMD 深度势能分子动力学:深势团队提出的深度势能模型方法,基于神经网络学习原子间相互作用。 DeePMD-kit:DeePMD 方法的开源软件套件,用于训练势能模型并进行分子动力学模拟。 DeepModeling:围绕物质模拟的开源生态,包括 DeePMD 在内的工具集。 汤超:物理学家、生物物理与复杂系统研究者,在理论物理与系统生物学有影响力。2018 年与鄂维南在学术研讨会中一起提出 AI for Science。 薛定谔公司(Schrödinger):成立于 1990 年,从计算化学软件起步,后来扩展到药物发现平台。 Accelrys(现 Dassault BIOVIA):成立于 2001 年(由 Molecular Simulations Inc. 等合并而来),在 2014 年被达索系统收购并更名为 BIOVIA。 达索系统(Dassault Systèmes):成立于 1981 年,最早做 3D 设计与仿真软件(CATIA),后来扩展到材料、生物、制造等全栈建模平台。 玻尔科研空间站:深势团队打造的 AI for Science 计算科学平台。 SciMaster:深势科技 2025 年夏天推出的科研智能体 Uni-Mol:用于分子结构与药物发现任务的通用深度学习模型。 Uni-RNA:使用深度学习处理 RNA 结构与设计任务的模型体系。 Evo 2:2025 年 2 月,由 Arc 研究所、斯坦福、英伟达合作推出的生物分子科学基础模型。 AlphaGenome:2025 年 6 月 DeepMind 发布的一款能解读基因组功能和预测变异效应的模型。 Future House:2023 年 Google 前 CEO 埃里克·施密特支持成立的 AI for Science 公司,主攻新材料、新药研发和 AI 驱动实验。 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
139
139: ICCV最佳论文、光年之外、Sand.ai:曹越十年AI之旅,从研究者到CEO
「从模型驱动到垂直整合:Gaga-1 是第一个产物。」 图注:飞书“智能会议纪要”功能为本次播客生成的概要图。 本期节目由飞书特别支持播出!欢迎大家尝试“智能会议纪要”(https://www.feishu.cn/product/ai-meeting-summary?hideHeader=1&utm_from=latetalk),功能,点击前文晚点转述链接,可申请 1 个月免费使用。 2024 年初,刚听说曹越开始新一次创业时,我就找他聊过一次。那时他有一个吸引科技报道者的标签:光年之外联创。 今年 10 月的这次正式访谈中,我有点儿理解了为什么王慧文在 2023 年初见了那么多研究者后,会选择曹越来做技术合伙人——曹越是少数在 ChatGPT 之前,预判到大模型热潮的中国研究者。2021 年,他拿下 ICCV 最佳论文后,离开了微软亚研院,加入了国内最早做大模型的机构,智源研究院。 让我稍感意外的是,曹越做研究员时,就格外关注组织与机制;2021 年,在看到 DALL-E 和 CLIP 后,他开始研究 OpenAI 是怎么协作的,这也是他加入智源的原因之一。 这期节目,曹越回顾了他在清华读本科时,如何看到深度学习,那篇 ICCV 最佳论文的诞生;他从研究员到创业者的转变;对 Sora 的观察,以及 Sand.ai 打造新一代模型 Gaga-1 的思考与实践。 通过学习 OpenAI 等全球顶尖公司,更重要的是通过自己的实践和反馈,曹越现在的认知是,要做一个垂直整合的“端到端”的组织,更好平衡模型进展与从需求出发,10 月中旬 Sand.ai 新发布的模型 Gaga-1 就是垂直整合的产物。它聚焦解决人物表演问题,“人物不一致、表演假”,是许多试图使用 AI 的内容制作者之前最大的痛点。 图注:在 Gaga AI 网站 (https://gaga.art/zh/app) 上,现在可体验音画同出、聚焦人物表演能力的视频生成 在技术驱动的 AI 创业时代,一个模型出身的创始人,如何判断趋势,又怎么学习做 CEO?曹越分享了他的探索和体验。 本期嘉宾:曹越,Sand.ai 创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 **本期播客也有视频版,可在抖音、B站、小红书、视频号搜索《晚点 LatePost》观看。* 时间线跳转: -从 ICCV 最佳论文到研究 OpenAI 组织力:设计一个系统,最大化压榨算力 02:08 2014 年转向深度学习 03:37 在微软亚研院学到的-1:关注最重要、且有提升空间的 topic 05:09 Swin Transfomer 的诞生,Transformer 被引入视觉任务的两个阶段 11:15 在微软亚研院学到的-2:判断 topic 还不够,得以足够资源做出极致效果 13:02 CLIP、DALL·E 冲击:OpenAI 不是论文驱动,而是设计一个系统,最大化压榨算力 18:10 从 GPT-3 到 ChatGPT,3 年疫情阻隔使 OpenAI 巨变被忽略 -中国为什么没有出现 OpenAI 这样的组织?王慧文说是“不够富” 21:30 和王慧文、梁文锋聊;他们都在 23 年初遍历国内研究者 26:57 问老王:为什么中国没有出现 OpenAI?——“不够富” 32:54 光年之外的经验:一开始就确立了正确的“找人方法论” 34:36 CEO 容易焦虑,这时可以想想大问题 -“真的了解创业后,突然感觉什么都对了” 37:16 23 年 8 月开始思考创业:视频生成让自己兴奋 40:54 创业前的自我觉察:ambitious 46:59 第一个模型 Magi-1 花了 1 年多:低估了自回归路线的难度 50:23 正在发生的业务窗口是“音画同出” -“Sora 2 是一个端到端的模型,OpenAI 是一个端到端的组织” 52:36 Sora 2 的 3 个特点,第三点最让曹越惊艳 58:23 Sora 2 怎么实现“端到端叙事”的? 01:03:58 Vibes vs Sora,Meta 是缝合,OpenAI 是整合 -Gaga-1:从需求出发,优先解决人物表演 01:06:53 新模型 Gaga-1 聚焦人物表演,成本大幅下降 01:10:33 用 AI 做短剧,卡点正在人物表演和成本;Sora 的新启发是叙事 01:15:27 需求分析:短剧制作、广告片、C 端斗视频 01:19:42 Sora 能否成为 C 端新平台?曹越的两个判断指标 -垂直整合组织的核心就是:不同背景的人,能对齐上下文 01:23:10 PMF 一直讲,一直难:因为模型和产品的磨合就是要花时间 01:28:07 垂直整合:不同背景的人频繁交流,对齐上下文 01:31:16 再看“模型即产品”:早期产品跟着模型走,现在要互相放大 -成为 CEO 01:38:41 一个“专业”的 CEO 01:42:04 “Gemini 老师”的最大作用是对齐上下文 01:50:27 所有内容的终局都是“叙事” 01:52:29 老王的建议:研究皮克斯商业模式 01:56:06 研究者和 CEO 的“夹角” 01:58:24 最优先级的工作 02:01:01 Next Question:ASI 到来后会怎样 02:03:12 连点成线:往期推荐 相关链接: 图文版:《对话曹越:马尔奖、光年之外、Sand.ai,研究员到 CEO 的十年串起大模型变迁》 晚点聊 136:《Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent|Agent#5》 晚点聊 58:《光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?》 晚点聊 39:《从美团收购光年之外,聊聊科技公司收并购的操作与故事》 附录: CNN(卷积神经网络):由 Yann LeCun(杨立昆) 等人在 1989 年提出,用于从图像等网格数据中提取局部特征,是深度学习在计算机视觉领域的基础架构。 Transformer:由 Google Brain 在 2017 年 提出,用“自注意力机制”替代循环结构,实现了高效的并行训练,成为目前大模型的核心架构。 iGPT(Image GPT):由 OpenAI 在 2020 年提出,将 GPT 语言建模思想用于图像像素预测,验证了 Transformer 可用于视觉生成任务。 ViT(Vision Transformer):由 Google Research 在 2020 年提出,将图像分割为小块后输入 Transformer,首次在大规模数据上超越 CNN 的图像识别性能。 Swin Transformer:由微软亚洲研究院刘泽、曹越等人在 2021 年提出,通过“层次化窗口注意力”结构改进 ViT,使 Transformer 能高效处理不同尺度的视觉任务。 DALL·E:由 OpenAI 在 2021 年 发布,将 GPT-3 与图像生成结合,可根据文字生成符合语义的图像。 CLIP:由 OpenAI 在 2021 年提出,通过大规模图文对比学习,实现文本与图像的语义对齐,是后续多模态系统的基础模型之一。 Instruct-GPT:由 OpenAI 在 2022 年 发布,通过基于人类反馈的强化学习(RLHF)让 GPT-3 更好理解指令,是 ChatGPT 产品化的重要前提。 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
138
138: 从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI|Agent#7
在130 期节目中,我们聊了智谱这样的大模型公司怎么做手机 Agent。本期,我们换一个视角,邀请了 OPPO ColorOS 智能助理部总经理万玉龙博士来分享,手机公司怎么构建和思考移动端的 AI 体验。 作为最主流、最有想象力的智能硬件载体,手机是 AI 入口的必争之地。从苹果、三星、 Google 这样的手机主流厂商和系统级厂商,到掌握超级 APP 的互联网大公司,大家都想抓住这个机会来塑造消费者与 AI 接触的新入口。 在中国市场, OPPO AI 的小布助手是最早一批落地、用户规模也最大的手机智能助手之一,目前月活已超过 1.7 亿。 图注:万玉龙在 2025 OPPO 开发者大会上演讲。 在 2025 年 OPPO 开发者大会之前,我们与万玉龙博士一起讨论了 AI 与手机的结合已经发展到了什么阶段,它接下来会如何重塑这个领域的商业格局和应用服务生态,以及它会如何影响我们的工作与生活。 本期节目有视频版,可在抖音、B站、视频号、小红书等平台搜索《晚点》观看。 本期节目由 OPPO 支持播出。 本期嘉宾:万玉龙,OPPO ColorOS 智能助理部总经理 本期主播:程曼祺,晚点latepost 科技报道负责人 时间线跳转: -Part 1:手机公司做 AI:新计算、新感知、新生态 01:10 OPPO AI 的新体验 11:56 全球行业共性和 OPPO 特点 20:00 手机 AI 智能助手渗透率低于预期,why? -Part 2:OPPO 的 AI 实践 31:12 厘清三大场景:生产力、生活、影像 38:17 原点之旅访谈用户的细致发现 41:36 以前的产品是 by design,AI 产品是 by use 47:59 AI 现在还不能帮卖手机,但能增加粘性 52:32 AI 人才加入 OPPO:你想做一个影响上亿人的产品吗? -Part 3:未来端侧 AI 生态推演 59:40 三类公司的端侧 AI 竞合 01:04:40 体系重塑中:当用户通过 Agent 来使用 App,日活、时长等指标都被重塑 01:11:27 Web 端有 MCP,移动端呢? 01:13:39 用户不会有一堆“AI 管家” 01:20:46 新交互正快速发展,新应用生态还未定型 01:25:02 Next Question:更成熟的 AIOS 长什么样? 01:31:22 连点成线:过往节目推荐 相关链接: 图文版:晚点聊 130:《手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机|Agent#4》 晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专|Agent#2》 剪辑制作:XH&SU 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
137
137: Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6
「《晚点聊》✖️ AGI House 第一次聊,之后会陆续更新硅谷的 AI 新趋势。」 本期,我们邀请了两位常驻硅谷的朋友,AGI house 的 Henry Yin 和 Naomi Xia,来一起聊 Agent 工具链(Agentic Tooling)的发展趋势,和这个领域在美国的创业实践。 AGI House 是一个 2023 年开始运营的 AI 创业和投资社区,连接了Andrej Karpathy( OpenAI 联创、Eureka Labs 创始人 )、 Google 创始人 Sergey Brin、Google AI 负责人 Jeff Dean、Anthropic 联创 Ben Mann 等 AI 从业者。 图注:刚刚在 AGI House 组织的技术活动:与 Open AI 论文作者的 technical paper reading event。 Henry Yin 毕业于清华姚班,后前往伯克利攻读博士,期间退学创办思码逸(Merico),用 AI 提升开发者效率,长期关注 Agent 工具链与应用层创新。 Naomi Xia 毕业于沃顿商学院,曾任职于摩根大通 AI 投融资团队,现在负责 AGI House 早期投资,已投资 20 多家公司,如本期提及的 Composio、Livekit 等。 我们第一次录制是在十一前,而假期中的 10 月 6 日,OpenAI 举办了第三次 DevDay,即开发者日。发布了一系列与 Agent 相关的新工具,包括 AgentKit、Evals 等。这次 OpenAI 也带来了 Apps in ChatGPT 和 Apps SDK,这是 ChatGPT 试图变成操作系统的再一次尝试。 本期节目由此分为两部分: 第一部分,我们讨论了刚结束的 DevDay 的亮点; 第二部分,则是对 Agentic Tooling,即 Agent 工具链的发展脉络和当前热门环节的梳理。 这一次是《晚点聊》与 AGI house 两位第一次录制。之后我们会定期邀请 AGI House 团队及其社区连接的成员分享在美国 AI 最核心的区域的新变化。 本期嘉宾: Henry Yin:AGI House 联创 & CTO,LinkedIn @Henry Yin Naomi Xia:AGI House 合伙人 & 投资负责人,LinkedIn @Naomi Xia 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -OpenAI 开发者日 03:30 Agentic Kit 是 OpenAI 开放了自己练的“一身武功” 09:06 Apps in ChatGPT 和 2023 年 GPTs 的区别 10:53 Canva in ChatGPT 新体验 14:47 OpenAI 不会放弃 to B 18:16 一种批评,AgenticKit 与 AGI 思路背道而驰 21:15 开发者的机会与压力:在别人的地基上建房子 -Agentic Tooling 的 6 次进化 26:33 Agentic Tooling 是什么?近期 3 笔交易/收购看到的状态 31:24 Agentic Tooling 的 6 次进化,对应模型能力的 6 次提升 -当下环节梳理 工具调用 39:59 MCP Server 集成商是做什么? 43:09 当前调用 MCP Server 的数量限制,创造 Rube 等产品的机会 44:18 Composio,一家从印度来美国的公司,怎么从 Agent 厂商转型 MCP server 服务商 49:09 这真是创业机会吗?为何 Anthropic 自己不做? Voice 53:09 911 也在用的 AI voice 平台 57:25 从 LiveKit 平台看到的调用偏好:Speech to Speech(语音端到端)和 Cascade 模型现在一半一半 59:28 OpenAI 等核心 Lab 的 Voice 动作 记忆 01:01:57 四种记忆:情景、流程、事实/知识、人格/性格 01:04:26 创业案例:Letta,记忆也可以由第三方来做吗? 01:10:29 记忆和上下文工程 评估 01:11:50 一个重要,但很多人不好好做的环节 01:14:07 评估难,难在构造数据集 -2000-5000 亿的工具生态市场 01:15:27 Okta、Twilio、DataDog 都可以在 AI 时代“再做一遍” 01:21:23 2025 年,“闯美”中国 AI 创业公司变多,它们带来了不一样的野心 相关链接: 图文版:《OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客》 晚点聊 129:《中国AI founder如何直接在美国创业? | 对话FinalRound创始人Michael》 附:本期播客里提及的人、公司和具体领域 Merico(思码逸):代码质量、产能分析与工程数据平台,由 Henry Yin 在博士期间联合创立 Andrej Karpathy:OpenAI 联创、Eureka Labs 创始人 Ben Mann:Anthropic 联创 MCP 协议:让大模型能调用各种工具的协议,由 Anthropic 于 2024 年 11 月开源 MCP server:把数据和工具按 MCP 协议做成 AI 可直接调用的服务端 Composio:MCP server 市场,开发者在这个平台上能选择不同 MCP server 以调用工具、完成应用 LiveKit:基于WebRTC(实时通信)的开源音视频通话框架提供商 声网(Agora):实时音视频基础设施提供商 LightSpeed:美国 VC 光速创投,Composio A 轮的领投方 Letta:一家开源 AI 代理框架公司,为智能体研发长期记忆 身份认证:为软件产品或服务提供用户与权限管理服务的 to B 环节 Okta:一家身份认证与访问管理提供商 Twilio:通信云平台公司,开发者可通过 Twilio 平台上的 API 调用短信、语音、视频等通信功能 Observability:为软件开发提供状态或数据的观测/监控服务的 to B 环节 Datadog:Observability 领域上市公司,为应用提供服务器、数据库等监控服务, Braintrust:一家为 AI 应用提供 evaluation(评估)、observability(可观测性/监控)和 trace 分析等工具的创业公司 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
136
136: Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent|Agent#5
「不焦虑的团队,做不好 AI 创业。」 5 月内测、7 月公开上线,设计类 Agent Lovart 诞生 4 个月,做到了 20 万日活用户和 3000 万美元的年度预测订阅收入。 9 月底,我与在在旧金山呆了 3 个多月,回国不久的 Lovart 创始人陈冕,聊了他对垂类 Agent 的思考和实践。在 5 月 Lovart 刚上线时,我们有过一次交流。几个月后,这位创始人和 Lovart 这个产品又经历了快速的迭代,Lovart 几乎总能在第一时间接入 Nano Banana 等最新模型,也推出了受好评的 ChatCanvas 等新交互方式,他也在节目中聊了马上会发布的 context 新能力。 陈冕说,快源于他的焦虑。但现在也需要焦虑,因为技术正快速进化: 就在我们这次聊的几天后,OpenAI 发布 Sora app,展现了消费端 AI to C 超级应用的潜力。我们于是在假期里补充聊了他使用 Sora 的感受和接下来可能的行业变化。作为一位产品经理出身的创业者,陈冕对 Sora 有独特的观察。 本期节目分为两部分,一是 “Sora 打开的新世界”,二是陈冕对 Lovart 上线以来的复盘。 “你往往在觉得你短期可能有点高估它(模型和技术进展)的时候,过两天你又发现你低估了它。”陈冕说。这是让如今的 AI 创业者头疼的地方,这也是让他们快乐的地方。 本期嘉宾:陈冕,Lovart 创始人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -Sora 打开新世界:这不是社交吗? 01:50 4 个小时使用体验:顺滑、Cameo 的社交潜力、Remix 降低共创门槛;“最好的交互不会超过滑动和点击” 10:58 中等体量的公司,可以通过交互创新做出 Sora 吗? 13:17 “虚假的真实”和“真实的虚假”可能同时存在 14:46 巨头战场:无法接受错过,赢下的意义又太大 19:39 OpenAI 的双面性:巨头的资源,创业公司的组织 21:17 风险可能来自节奏错配:技术加速发展,而总有些事无法被加速 -20 万活跃用户、3000 万美元年度预测收入;服务“everyone who wants to create” 24:23 在湾区,反复被问热情,更想清楚了应该服务谁 30:27 旧金山 3 个月:感受氛围、建立团队、离用户更近 41:50 引入全球化投资的节奏? 44:37 20 万日活用户,3000 万 ARR,还没有覆盖服务成本,但不怀疑 Agent 商业模式 -“提前描绘出未来会发生的东西,然后等它发生” 49:06 创业之初看到了 5 个方向,为何从 “Adobe 系”切入? 02:43 垂直 AI 应用本质在做两件事:特别的交互,和特别的 context 57:34 应用公司怎么做增长?“提前描绘未来会发生的东西,然后等它发生” 01:06:00 正在做的能力:给设计更多 context,这包括 reference 和 preference 01:13:43 Lovart 到目前为止是工具,没有计划做社区 01:16:25 离用户更近,同时离技术更近,然后才能做取舍 01:22:51 为什么不再担心开源被闭源甩开 01:24:32 To P 创业窗口接近关闭,下一波机会是 to C 01:27:32 “Adobe 系” AI 公司,谁在牌桌?三类玩家的位置 -节奏感,与必需的焦虑 01:31:35 Timing 在任何时候都重要,但 AI 时代更重要 01:35:34 创业以来经历的 3 次重要 timing 01:36:32 没有错过的原因是,“我很焦虑”,而焦虑是必要的 -挺过危机,韧性来自理性判断后的信念 01:42:52 危机中坚定继续,信念是来自认知 01:44:57 最困难时得到过收购意向,但一开始就没想接受 01:45:50 创业不是残酷,而是痛并快乐 01:47:59 遇强则强,面对 3 次挑战,成就感递增 01:49:44 最害怕自己迭代不够快 01:51:09 用理性的底层,控制感性的表达 01:53:36 第一次自由的、全情的、疯狂的,想做成一件事 -连点成线 01:57:51 Lovart 投资人夏令对垂类 Agent 的思考总结(晚点聊 110 期) 相关链接: 本期图文版:《Lovart 陈冕:Sora 证明巨头无边界,AI 创业得提前描绘未来》 晚点聊 110:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
135
135: 专访张益唐:70岁数学家,追逐第二次闪电
「反正我们就看,我能不能被闪电击中两次吧?」 *本次访谈的「图文版」和「视频版」今日将同步发布,视频首发于抖音。 本次访谈的图文版链接:《晚点专访张益唐:70 岁数学家,追逐第二次闪电》 图文版里对提及的数学概念、数学家和事件有更多详细注释,可阅读了解更多。 很长一段时间里,张益唐是作为一个励志传奇,而非数学家被人谈论与记忆的。 他身上有能触动所有人的戏剧性:一个北大数学系的天才,在美国博士毕业后因未获导师推荐求职不顺,多年来辗转于列克星敦、纽约的各种临时岗位,一度住在房车里。到 2013 年,他突然在 58 岁“高龄”,以一位大学讲师的身份攻克了百年数论难题“孪生素数猜想”,震惊世界。 今年 6 月底,张益唐举家回国,全职加入中山大学香港高等研究院。我们在他回国不久后前往广州专访了他。 作为一个数学家,张益唐对挫折、低谷、孤独、命运都有自己的解读。 他一直追求独特的想法,他最喜欢的状态,就是能一个人专注地思考数学问题。 你得能想到别人想不到的地方,这很难……但如果不追求独特的想法,很难做出新成果。 在那些世俗意义上困顿的日子里,他因不被人关注,反而保持着自己的视角。在张益唐密集思考孪生素数问题的那几年,数学界曾有过一个权威研讨会,结论悲观。不过张益唐两年后才知道有这个会。 大家觉得好像有一条路有可能做出来,最后谁也没走通,“就差了一根头发丝”。可是数学,你差一根头发丝也不行。 而我是从另外一个角度想的。如果你完全跟着别人弄,别人卡在那儿,你也得卡在那儿。 张益唐长期的挫折与传奇的成功,都源于他面对数学的方式:十几年甚至数十年专注少数几个重大难题,几乎不发表阶段性成果;他像隐士一样独自思考,甚少与同行交流合作。 70 岁的张益唐,仍在攻克下一个大问题:“朗道-西格尔零点猜想”。 大量重要结论都以朗道-西格尔零点猜想的成立为条件,它也被认为可能与证明黎曼猜想有关联。所以张益唐的一位前同事会说,如果张益唐真能证出朗道-西格尔零点猜想,那就好比“被闪电击中两次”。 我们问张益唐,面对想解决的问题,他现在的数学直觉还有多强?“我觉得我还能做。”他说。在 70 岁,一个数学家在追逐他的第二次闪电。 *本期是《晚点 LatePost》的前沿视频访谈系列 Next Quesiton 的第一期,视频首发于抖音。小宇宙的这个音频版会稍长一些,放了更多内容。 本期嘉宾:张益唐,数学家,中山大学香港高等研究院首席科学家 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: 只解大问题 03:10 “反正我们就看,我能不能被闪电击中两次吧?” 05:46 长时间想少数难题,不追求发论文的频率 09:07 “好运气还是坏运气,一开始你也讲不清楚” 13:31 兴趣起点:9 岁看《十万个为什么》哥德巴赫猜想、费马大定理 14:24 23 岁从锁厂工人成为北大数学系学生 16:04 专业是“计算数学”,但大三开始转向理论数学 数学的直觉 17:17 判断什么问题重要并不难,就看能不能做,敢不敢做 18:09 直觉是对正确的一种预感 20:42 几十年一直盘桓几个难题,是一种什么状态? 22:56 朗道-西格尔零点猜想:已经做出来了,正在寻找简化 25:30 独自面对数学,“交流是个困难的事” 光靠 AI 证不出黎曼猜想 26:46 现在 AI 的很多问题归根结底是数学问题 27:25 光靠 AI 解不出黎曼猜想,数学研究的周期和脑力强度远大于奥赛 28:44 49 年前的“四色问题”,一个错误的预言 31:24 想过黎曼猜想,但没看出一条路 数学家,最重要的专注 32:20 王虹的例子,判断一个人的才能不能看短期 33:28 做数学家,最重要的是专注,这也是一种天赋 35:07 辅导孙女数学,最主要是激发兴趣 “现在是回国最好的时候” 36:10 赴美 40 年后归国,目前中国对基础科学大力投入 37:15 最喜欢的数学环境:一个人不受干扰,写论文 37:40 新计划,资料都在脑子里 41:00 改写论文,“烦得要命” 43:21 普林斯顿高等研究院,给一流人才足够的空间 45:18 北大研究生导师潘承彪先生的“小考验” 47:12 不希望学生转行,但尊重选择 自得其乐,没有退休 48:12 如果给孪生素数问题写一本《费马大定理》? 50:17 “三大悲剧的作者会被人遗忘,但阿基米德不会。”没想过不朽,也不追求 52:02 “更快活”是一句虚拟的话 52:39 25 年没回过,“不想提了” 53:34 “我还可以” 55:03 “自得其乐,你自己在享受,觉得有意思,这就够了” -55:52 连点成线:往期节目呼应 相关链接: [《晚点专访张益唐:70岁数学家,追逐第二次闪电》](待放) 「晚点聊」71 期:《“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”,与香港大学马毅聊智能》 「晚点聊」108 期:《与马毅聊智能史:“DNA是最早的大模型”,智能的本质是减熵》 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
134
134: Meta AI人才动荡,上亿美元为何留不住人?| 与Pokee AI朱哲清盘点 AI 组织
「在 Meta 工作 7 年的创始人看到了什么?」 2025 年 6 月,Meta 以 143 亿美元收购 Scale AI 49%股权,招募了 28 岁的 Scale AI 创始人亚历山大·王(Alexander Wang);这之后,Meta 又天价招募顶尖 AI 研究员,开出最高 4 年 3 亿美元的惊人薪资。 这些新血液和 Meta 原本的部分 AI 团队在 6 月底正式组成了 Meta “超级智能实验室”(Meta Superintelligence Labs,MSL),由亚历山大·王任负责人。 就在一些人期待 Meta 要一雪 Llama 4 的失利时,9 月,Meta AI 团队离职潮爆发:既有已在 Meta 工作了 12 年、参与 PyTorch 构建的 Bert Maher(确定加入 Anthropic)等老员工离开;也有两位加入不足 2 个月的 OpenAI 研究员又重返 OpenAI(Avi Verma 和 Ethan Knight)。 本期节目,我们邀请了 Pokee AI 创始人朱哲清(Bill Zhu),他在 Meta 工作 7 年多,曾担任 Meta “应用强化学习”部门的负责人,去年 10 月开始创业,做以强化学习为内核的 Agent。 朱哲清分享了他观察到的/硅谷顶尖 AI 人才的流动趋势,以及 Meta、Google、OpenAI、Anthropic 等美国核心 AI 公司的组织特点,和由此延伸的业务策略。我们也讨论了,作为一个 AI 创始人,如何在今天打造原生于 AI(AI-Native) 的新组织。 *播客中提及的斯坦福课程是 CS231N,提及的授课者是 Percy Liang。 本期嘉宾:朱哲清,Pokee AI 创始人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -Meta 人才动荡 03:00 Meta 曾是创业氛围最浓厚的硅谷大厂,但疫情时变臃肿 07:24 Meta、Google、亚马逊、OpenAI、Anthropic 组织特点盘点 14:15 “办公室政治”的实质是分功不均 17:21 一个组织能否保持目标一致:看 20% 的最关键工作能否被分完 19:24 OpenAI 的分裂,是使命的分裂 21:22 MSL(Meta Superintelligence Lab)现在缺能服众的负责人 26:24 顶尖 AI 人才有开辟新方向的野心,而大公司更想要主流路线上的进展 31:52 工程型人才决定未来 2 到 3 年发展,科学家型人才决定未来十年发展,但你可能活不过两三年 -硅谷吸引力 38:49 顶尖 AI 人才最想要什么?成为促使 AGI 到来的核心贡献者 40:34 人才吸引力:OpenAI、Anthropic 第一档,Google 1.5 档 42:03 OpenAI 和 Anthropic 如果倒了,硅谷一片 AI 投资机构都倒了 45:12 同为大公司,Google 做对了什么? 50:28 ChatGPT 在 ChatBot 的地位并非不受挑战 -AI-Native 的新组织 52:52 从 0 做来做 AI 组织的方法? 57:37 当工程师有了 10 倍产出 01:00:35 信任比以往更重要了 01:09:02 Meta 缺一个走一步、想三步的有经验经理人 01:10:56 推演明年 AI 人才争夺 01:14:17 斯坦福大课之 AI 教育一撇:“上完 CS231N,我能做出 sota 的 LLM 吗?” -01:18:11连点成线(往期节目呼应) 相关链接: 晚点聊 133:《4000日薪的实习生和零工化的程序员,与脉脉CEO林凡盘点25年AI人才市场》 晚点聊 116:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》 《对谈 Pokee.ai 朱哲清:强化学习做核心,Agent 的少数派造法》 《晚点独家丨Agent 初创公司 Pokee.ai 种子轮融资 1200 万美元,Point 72 创投,英特尔陈立武等投资》 晚点聊 111:《Agent#3|Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端》 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
133
133: 4000日薪的实习生和零工化的程序员,与脉脉CEO林凡盘点25年AI人才市场 | 串台「职」无不言
「大厂集体从从“省省省”到“花花花”。」 *本期节目,也发布在了脉脉新上线的官方播客「职」无不言。 本周二(9 月 16 日),中国职场社交平台和招聘平台脉脉发布了《2025年AI人才流动报告》,分析了字节、阿里、腾讯、百度、小红书等很多公司的 AI 人才招募情况、待遇变化和流动情况。 *扫描图中二维码,可阅读完整报告。 或点击链接:《2025年AI人才流动报告》 这期节目,我们分享了这份报告里很多有意思的事实、数据和洞察: 大厂招聘规模总体翻 10 倍; 期权行权条件变得更优惠; 活水到 AI 部门的门槛更低了; 顶尖 AI 方向博士生的日薪已来到 4000 元人民币; 最受欢迎的 AI 方向应届生毕业院校排名:第一是清华,第二是北邮。 …… 我们也讨论了未来的工作会怎么演变,AI 会给脉脉这样的职场社交平台和招聘平台,带来什么新机会?林凡看到,白领工作也有被外包和零工化的趋势,硅谷已出现了这样的公司。 AI 不仅在影响具体的工作,也在重塑整个工作的概念本身。 本期嘉宾:林凡,脉脉创始人兼CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: - AI 人才市场观察 02:55 Meta 3 亿美元买高级人才,不亏 08:41 相比去年,硅谷核心研究员的 AGI 信念更强了 19:47 中国大厂不在琢磨省钱,从降本增效到增本增效 27:03 字节 AI 岗位招募数量断崖领先,第二名是小红书(与阿里按淘宝、云等板块分开统计有关) 29:42 职言社区里的员工变化:阿里士气反弹,美团员工焦虑股价 37:58 最受欢迎 AI 应届生:清华第一、北邮第二 41:49 顶尖博士生实习生可拿到 4000 元日薪 44:38 初阶工程师招聘数减少,减少更快的还有各类管理岗 - 工作的未来 & 白领零工化 52:09 清华计算机毕业的林凡,博士退学钱经历的千禧 AI 研究 58:01 AI 浪潮给脉脉的机会:第一步是优化招聘各环节 01:03:35 出生即退休的终局之前,我们可能会先经历“人力上云” 01:08:18 当白领和知识工作也借由外包云平台来匹配,收入和职业成就感会怎么变? 01:13:03 脉脉会先做招聘的优化,有可能把招聘本身变成人机混合的企业服务 - AI 之后的教育与职场建议 01:19:57 花钱订阅用最好的 AI 产品,一天至少用十次 01:22:15 提高难以被 AI 化的复杂能力,本质是找到那些难被数据化的能力 01:25:45 工作时间会大大减少,我们都需要寻找真正的兴趣 相关链接: 《2025 年 AI 人才流动报告》(脉脉) 《脉脉林凡:企业与员工没那么对立了,但不是因为谁做了什么》 《脉脉 CEO 林凡:当所有公司都有平等对话的内网,职言就可以关掉了》 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
132
132: 350亿美元大并购后聊 EDA|两位芯片工程师的全面科普:壁垒、AI 加速、国产机会
「看不见的工具,托起每一颗芯片」 本期我们把焦点对准芯片产业链最上游的 EDA(电子设计自动化)。AI 浪潮下,GPU / 算力芯片火爆,但真正决定“芯片能不能做、做得好不好、做得快不快”的,甚至“卡脖子”的,其实是一套看不见的软件工具 —— EDA。 这个市场非常集中,基本被三巨头所垄断。 上个月,三巨头里最大的新思完成了对安似科技 350 亿美元的收购,这也是整个行业有史以来最大规模的并购,也帮新思补齐了“系统级仿真”的能力。再加上一些非市场的因素, EDA 也受到了前所未有的关注。 这期节目我们将和来自国际大厂与国产公司的两位资深工程师,拆解 EDA 的重要性、商业模式与壁垒,讨论 AI 如何重构 EDA 流程与工具栈,以及国产 EDA 的现实切口与长期路线。 本期节目由 Synopsys 新思科技支持播出。 本期嘉宾: 温戈|国际芯片设计大厂工程师,《了不起的芯片》作者 歪睿老哥|资深芯片架构师,《芯术:算力驱动架构变革》作者 本期主播: 邱豪,《晚点 LatePost》作者 程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -什么是 EDA,在半导体里的作用 02:14 摩天大楼的设计图,手机工程师每天用 EDA 比用手机还多 06:34 拆旧芯片设计流程:架构—验证—后端,分别在做什么 19:10 半导体行业的十倍定律:越早发现,越省成本 - EDA 的生意经 22:07 旱涝保收,但能赚铲子钱,赚不到金子钱 25:25 EDA 怎么收费 27:55 国产初创公司获客悖论 - AI 改变 EDA 29:23 用 AI 生成设计代码 33:04 AI 加速芯片设计,帮工程师想新 idea - 巨头成名史 39:21 长期收购补齐版图 42:10 为什么很难“完全垄断” - 国产 EDA 的机会 48:10 EDA 都是跟随产业机会发展起来 49:43 主流数字 SoC 渗透难;在模拟/版图提取等单点形成口碑更现实 *- 大模型带来了什么 * 52:33 芯片复杂度通胀 55:44 AI 会替代芯片工程师吗? 57:48 生成 Verilog 成为 AI 创业方向之一 *- 总结展望 * 01:12:59 三个词概括今年的芯片产业 01:19:17 未来十年行业地图的重心 01:24:22 对行业新人的建议 相关链接: 晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 晚点聊 36 期:OPPO 突然中止造芯,生不逢时的雄心 晚点聊 32 期:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 名词解释: EDA:Electronic Design Automation,电子设计自动化软件,用于芯片从电路设计到版图实现的全流程工具。 Verilog:一种硬件描述语言(HDL),广泛用于数字电路的建模与仿真。 IP:Intellectual Property,在芯片设计中指可复用的功能模块或电路设计单元。 Aart 博士:新思科技(Synopsys)长期 CEO Aart de Geus,被誉为“EDA 教父”,推动逻辑综合等关键技术发展。 逻辑综合:将高层次的硬件描述语言代码(如 Verilog)自动转换为可映射到芯片电路的门级网表的过程。 新思、Cadence、西门子被称为 EDA 三巨头:垄断芯片设计软件核心市场,这一说法大约形成于 2017 年西门子收购 Graphic Mentor,整合 EDA 业务之后。 安似科技(ANSYS):一家总部位于美国的工程模拟软件公司,前不久被新思收购。 剪辑制作:甜食 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
131
131: 微软怎么用AI?与微软商用市场、广告业务管理层聊AI驱动的增长
「两位微软业务 leader 的 AI 使用方法。」 大公司怎么在这轮 AI 热潮中变化和发展,关系大量经济价值和就业人群。 微软是一个典型案例:它既是 OpenAI 的大投资方和云计算服务提的供者者,是这轮热潮的推动者之一;同时,这家超过 20 万人的巨头,自己也需要让整个组织更好地与 AI 协作,抓住 AI 带来的增长机会。 微软 2025 财年第二季度财报里提到:AI 业务已实现超过 130 亿美元年化收入,同比增长 175%。(AI 业务值: Copilot、Azure AI 服务、与 OpenAI 合作带来的订阅与云收入) 这期,我们就邀请了两位微软的管理层:段微之和黄秀兰,来和我们分享,作为微软内部的业务 leader,她们怎么和团队一起,用 AI 提效和增长。两位所处的领域,分别是销售与客户服务,以及广告业务,这刚好是重要的 AI to B 场景。 两位也都是有 20 多年经验的职业女性。段微之先后任职于甲骨文、EMC、亚马逊云科技(AWS)等全球科技公司;黄秀兰先后任职于 Stripe、戴尔、Google,加入微软前曾担任大宇无限 CEO。在本期后半段,她们也分享了一些职场发展经验。 本期节目录制于 GPT-5 发布前夕,段微之在节目中提到了孩子在用“苏格拉底对话式”教育 App,而就在一周多后,“苏格拉底”模式就成了 ChatGPT 的一个功能。 颠覆、炸裂似乎正在变少,但 AI 也正在每天、每周,都变得好用一点点。在微软,这已经变成了一些可统计的业务增长指标。 本期嘉宾: 段微之,微软大中华区副总裁,商用企业及新兴市场事业部总经理 黄秀兰,微软广告业务中国区副总裁 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -在微软,AI怎么驱动业务增长? 02:45 微软内部全面使用 Copliot 365 06:43 GPT-4o 后,Copilot 能力进一步提升 08:16 使用 AI 的震惊时刻:Copliot 的视频会议即时翻译 12:18 AI 怎么提升微软广告收入:从素材生成→智能投放→数据复盘的全链路 16:42 AI 销售提效,一组数字体现 21:48 企业客户用 AI 的成败总结:前提是数据 24:34 微软做任何事,不会不考虑商业闭环 32:34 关注的 AI 趋势:GPT-5、Agent 34:52 靠编程 Agent,作为文科生也能开发、上线一款游戏小 App -非技术部门怎么学AI技能,给 15 年前自己的职场建议 36:42 大量内部课程可选,非技术人员也能用 AI DIY 业务工具 41:30 扭转工作习惯没那么容易,对 AI 渗透有 KPI 考核 46:46 AI 进入生活:旅游攻略、多语言学习、苏格拉底式教育 51:27 工作与生活的平衡?为何对两位都不是问题 58:25 给 15 年前的自己的建议:更简单化的生活,销售的关键不是 social 01:03:43 “我要坐第一排,要第一个发言”,要有自己的 voice ** -「连点成线」** 01:15:18 Coding 作为创作 & 服务企业客户时,数据治理的重要性 特别企划: 《晚点 LatePost》和 AI 产品点评网站「观猹」联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《独家专访飞书 CEO 谢欣:Office 是一个伟大的产品,而我们想做新时代的 Office》 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 《晚点聊》106: 与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 《晚点聊》127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
130
130: 手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机|Agent#4
「智谱 AutoGLM 2.0 上线,字节酝酿“豆包手机”,苹果和华米OV 也不会缺席。」 本周三,智谱发布了首个手机通用 Agent,AutoGLM 2.0,能点外卖、买票、订餐;无邀请码直接用、免费。 (这期的封面就是,AutoGLM 上周日给参加产品交流会的朋友点点的奶茶~) 从市场规模和人群广度看,网页端的 Agent 是湖,手机端的 AI Agent 才是海。因为在中国,每天用手机的人,几乎等于总人口;而每天用电脑的人则少得多,很多人的日常生活和工作里根本不需要电脑。 图注:AutoGLM 2.0,电脑端、移动端都可用 现在,大模型公司、移动互联网巨头和手机公司,都想到这片海里寻宝,手机端 Agent 将来一定会是一个兵家必争之地。 现在我们已经看到了一些苗头:《晚点》昨天就发布了一篇独家报道,讲字节的豆包手机进展;据此前市场信息,美团的王莆中亲自带队做生活服务助手 beam;苹果、华米OV也一定不会缺席手机 Agent。 这期,我们邀请 AutoGLM 2.0 的算法、工程和产品负责人,刘潇。从 AutoGLM 切入,我们一起聊了移动端 Agent 目前的产品形态;大模型公司、超级 App 厂商和手机硬件厂商,在移动端 AI 上的三方竞合关系;也通过回顾 AutoGLM 的开发过程,梳理了这类产品的难点、研发思路和未来的迭代方向。 1999 年出生的刘潇,今年 26 岁,本科毕业于清华大学计算机系。 制作这期时,我算了一下,这是我们第四期专门聊 Agent 了,之后也会有更多相关内容。所以我给这 4 期都加了 Agent 后缀和编号,方便大家检索往期。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:刘潇,智谱 AutoGLM 算法、工程、产品负责人 时间线跳转: -AutoGLM 2.0 速览 01:57 能点奶茶、能发帖,不占用屏幕、无邀请码直接上线、免费 05:作为用户的疑问:隐私、安全如何保障?关键步骤需接管,真能省事? 09:06 定时任务,高频但尚待解锁的场景 12:05 AI 竞争与外卖大战交汇:点外卖、找美食可能会被用得最多 -终端 AI 三方竞合:大模型、超级 App、手机厂商 14:14 当 AutoGLM 来到美团与用户之间,美团们怎么想? 16:12 Agent 调 App 的方式:GUI(图形界面) 和 API 会长期并存 20:59 手机个人通用 Agent 和超级 App 内部 Agent(如美团 beam项目) 的关系? 25:52 移动端尚没有 Web 端的 MCP 生态 28:44 手机厂商也在做 Agent,智谱与荣耀、三星的合作进展 32:53 华为、小米这样的公司有多种终端,它们推跨端 Agent 的优势? 33:55 智谱作为大模型公司自己做硬件?暂时没考虑 -近 30 个月的 AI Agent 探索 37:17 23 年 3 月 GPT-4 发布,刘潇的重心从预训练转向 Agent 42:39 23 年 4 月到 8 月,做出全球首个评估 Agent 能力的基准 Agent Bench 47:25 训练冷启动,人来构造数据 53:44 强化学习(RL)初现威力,离线强化学习已能大幅提升效果 01:01:22 o1、R1 的启发:做 RL 时,要用结果来 supervise 模型,而非用过程 01:04:02 RL 的两个关键:环境和激励 01:11:12 24 年 10月至今:工程上实现不占用电脑,以更大规模的在线强化学习提升纠错能力 01:15:16 激烈竞争的前提是,移动端 Agent 真的好用、成熟了 01:18:11 需要提升:模型能力、Infra、成本优化 01:28:56 产品马上发布:忐忑、期待和迭代计划 -连点成线 01:32:14 110 期,Agent 入口大战的预言回顾 01:34:54 我们聊过的那些强化学习 特别企划: 《晚点 LatePost》和 AI 产品点评网站「观猹」联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《晚点独家丨“豆包手机” 酝酿中,字节为大模型寻硬件载体》 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 《晚点聊》96: 和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 《晚点聊》111: Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
129
129: 中国AI founder如何直接在美国创业?一个千万美元订阅收入案例 | 对话FinalRound创始人Michael
「AI 面试工具、700万美元天使轮、千人Party、996、AI增长黑客、“借”川普做广告。」 对今天的一批中国 AI 应用公司,出海和全球化几乎成为必选项。但怎么出海,又有不同的做法:有人立足中国,服务海外,这是产品“出海”;有人起家在国内,做到一定阶段后,整体搬迁,这是“肉身出海”。 然而,还有第三条路,就是直接“一步到位”,在硅谷创业。 这期节目,我就邀请了AI 面试工具 Final Round AI 的创始人 Michael Guan,来和大家分享非 ABC 的华人 founder,如何在美国湾区从 0 起步。 今年 27 岁的 Michael ,本科毕业于 UIUC,后来直接去耶鲁读了 MBA,2021 年肄业创业,后被收购;23 年 10 月开始了这一次创业。 这之后,FinalRound 团队加入了湾区知名孵化器 HF0,融到了近 700 万美元的天使轮。他们在旧金山开千人音乐 Party,也睡在公司 996;他们自己开发了一套 AI 系统,试图把增长和投放效率推到极致,也会借特朗普做线下广告。目前,Michael 说,FinalRound 的 AI 面试助手全系产品已达到了 1000 万美元的 ARR,即年度订阅收入;公司也已在美国之外的上海和班加罗尔都建立了办公室。 图注:Final Round AI 组织的一次 Party 上,Michael(左)和联创 Jay(右) 这个年轻团队直接在全球市场出发的故事,也许会对有同样考虑的创业者有所启发。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:Michael Guan,Final Round AI 创始人&CEO 时间线跳转: -在旧金山,融到 700 万美元天使轮 03:45 受“贾维斯”启发做主动式 AI,99美元/个月,第一个用户紧急打钱 10:33 ARR计算套路,有人用最高单日✖️365 14:11 入选HF0孵化器,3个月收入翻3倍,那些反直觉的选择 23:29 第一笔正式融资,688 万美元的天使轮 27:46 自己也投过28家创业公司,“一起遛狗,一起音乐,相互投资” -HF0后收入再翻 3 倍:开音乐节也996、用Agent 驱动增长&“借”特朗普做广告 34:17 狂欢,也狂卷:每月一次小型音乐节,996 风靡硅谷 41:46 HF0至今收入再翻 3 倍:AI Agent 驱动的投放和增长 50:14 在拉斯维加斯做 KOL 拍摄屋,“借”特朗普做广告 58:04 B2B新产品:不是帮企业面试提效,是想把面试变成 “AI 试用期” 01:02:45 现在不是零和竞争的时候 01:09:05 最近的思考:未来的招聘不是考核结果,是考核过程 特别企划: 《晚点 LatePost》和 AI 产品点评网站「观猹」联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《晚点聊》121: PingCAP黄东旭的“内在世界源代码”:《黑镜》、程序之美和创作自由 关联:出海,“最好的全球化是本地化”。 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 关联:垂直 Agent 的机会,以服务结果为收费依据的新商业模式。 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
128
128: 小众AI场景拿到10亿级收入:测测任永亮首次讲述14年创业史
「AI泛心理、AI星座……不仅是新公司的机会。」 本期我们对话了测测的创始人兼 CEO 任永亮。 他是北大医学部预防医学毕业、2004 年就开始研究机器学习的“理科生”,却在 2011 年因一场感情低谷,开始用算法研究星座、人格、关系等“看不见”的东西,从而走上了一条独特的创业之路。他自己也经常思考:“一个对科学、理性有信仰的理科男,怎么做了测测这个产品?” 十多年后,测测已经成为国内最知名的泛心理 App 之一,陪伴了5000万用户做选择、找共鸣、寻安慰。 而现在,他又把目光投向一个看似更遥远的命题:如何用 AI 做出“陪伴感”?测测正在研发自己的陪伴机器人,试图在情绪、节律、甚至“命运系统”中,找到人和智能之间的新连接方式。 一个从未做过硬件的APP创始人,即将开始一场“有趣的探索”。 在这期节目里,我们聊了很多形而上的东西,比如激素,比如三体,比如“贪嗔痴”。当然,也聊了他的创业故事,他对大模型和具身智能趋势的判断,以及一个从高中就开始思考“混沌系统”的人,是如何一步步把这些“思考”变成产品的。 本期主播:王与桐,《晚点 LatePost》科技作者;程曼祺,《晚点 LatePost》科技报道负责人; 本期嘉宾:任永亮,测测创始人 & CEO 时间线跳转: -创业故事 01:42 创立测测,属于“病急乱投医” 02:36 “偶尔治愈,常常帮助,总是安慰” 04:08 测测和今日头条“撞”BP事件:基于大数据的个性化推荐引擎 06:21 怎么一个学医的变成程序员了? 09:15 买了个智能手机,相信一定要做手机上的产品 -四个阶段 10:39 2011年就想做AI化的服务了,但做不到,只能做工具了 12:35 任永亮说荣格是测测祖师爷 13:28 测测的定位:泛心理在线平台 13:51 2016年开始,变成双边服务平台 14:48 2019年AI对话机器人上线 16:04 测测进入第四阶段:做机器人 16:45 抖音是最大化生成多巴胺,但测测想打破这个循环 -当测测在AI热潮下 18:15 连续三个春节都被大模型搞得过不好 20:45 很多人用AI加测测里的一个小功能模块做一个单独的产品,但是任永亮说他兴趣不大了 21:20 第一创新风险大,看第二怎么创新就行了 23:43 做机器人:“我不怕千万人阻挡”? 25:03 拒绝被收购,就是为了有现金流支持创新业务 26:00 跟李想产生共鸣了 27:19 高中、大学对数学的热爱和了解到自己只是爱好 -做机器人的思考 28:26 测测是服务碳基灵魂,机器人业务是做硅基灵魂 29:50 这个机器人最重要的是交互,因为大模型带来的最大的变化是交互创新 31:00 LOVOT卖3万,也是成本价了 -情感是物质吗? 32:03 用户最多的问题还是情感问题 33:06 LOVOT在寻找激发人催产素的产品形态 35:02 Labubu更多属于社会潜意识的投射,催产素只占很小的比例 36:11 内啡肽是多巴胺和催产素之外另一种激素,痛苦后的奖励 -任永亮的用户观察 38:17 女性用户80%,一二线城市用户80% 40:40 教大家怎么用MBTI分析所有人 46:18 任永亮是一个信仰周期的人,每日心情打分是周期,生辰是周期,太阳历系统是周期 48:48 如果把人当做一个混沌系统,星座等系统都只是解释了一小部分 52:00 人为什么总想“测测”自己?我们智人希望找到规律 -对于未来 AI 和具身社会的思考 54:20 大模型还没有解决规律总结的问题 56:00 人还保留了具身性,所以是不可替代的 58:28 长期来看,测测会变成一个人工智能公司 01:00:00 AI技术对社会的影响,任永亮比较悲观 01:04:00 很多公司把测测放进自己的BP里,但任永亮不太在意 01:06:12 找一个市场和技术的夹缝,这也是过去测测一直擅长的 01:09:00 深夜惊醒,在想一个对科学有信仰的人,怎么做了测测这个产品? 01:11:30 如果做机器人不成功,可能就是报表没那么漂亮罢了 01:13:13 任永亮想问:这个世界到底是不是可被计算的? 相关链接: 晚点聊 122:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩 晚点聊 122:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 剪辑制作:甜食 本期主播: 即刻 @王与桐 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
127
127: 与真格戴雨森 25 AI 中场复盘:OpenAI的IMO金牌、Kimi K2翻盘、Agent普及和抢人大战
「一个登月时刻?」 今天的嘉宾,是 106 期曾做客《晚点聊》的真格基金管理合伙人戴雨森。这期节目分两次录制,一次是在上周,在 2025 年年中的复盘和展望时刻,我们聊了真格投资的月之暗面新鲜出炉的 K2,AI 应用普及这条大主线的变化,和近期热闹非凡的抢人大战。 一次是在今天(7月21日)下午。我们补充聊了刚刚发生的新进展:OpenAI 在上周五发(7月18日)布了ChatGPT Agent,更重要的是,这个周末(7月19日),OpenAI 又宣布用一个未公开的通用大语言模型,第一次达到了 IMO国际奥赛金牌水准。这之前,只有 Google DeepMind 针对数学专门做优化的模型达到过银牌水平。 2 年半前,曾写下《通用人工智能的火花》的现 OpenAI 研究员 Sébastien Bubeck 形容,这(通用大语言模型拿下IMO金牌)最终可能会成为一个登月级别的进展。 已持续两年多的AI竞速没有放缓,模型能力与应用创新交替上升,而两者的进化速度,可能都在被低估。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:戴雨森,真格基金管理合伙人,*投资了 Kimi(月之暗面)、与爱为舞、无问芯穹、Genspark *等 AI 项目。 时间线跳转: -OpenAI 拿下 IMO 金牌,又一个李世石时刻 01:06 OpenAI 新模型拿下 IMO 金牌:首个到这一水平的通用 LLM、强化学习也能处理难判别任务、Google 也做到了? 图注:Jason Wei 博文中“验证的非对称性”图示,落在红色斜线下方的任务更容易被 AI 全自动化地完成。 14:38 抢人大战后,Meta 谁都不服谁的情况可能更严重 16:31 ChatGPT Agent 不惊艳,但别低估它;“壳”的价值在于 context -再谈 AI 应用普及:最重要的、被高估的、被低估的 27:39 总要进展:Coding 和推理能力持续提升、Agent 形态有了初步共识、多模态更实用了 图注:OpenAI 研究院、强化学习专家 Noam Brown 发 Twitter 提到,拿到 IMO 金牌的模型与 Multi Agent 有关。 33:59 机器人进厂打螺丝的速度,被高估了;应用(壳)的价值、优秀团队的韧性、模型进展速度被低估了 40:53 从 All in AI 到外卖大战? -不同公司,走向各自的未来 42:37 DeepSeek R2,等待新基模 43:43 字节 Seed 组织的进一步分工:Edge、Focus、Base 46:39 K2,Kimi 的乔戈里峰 图注:7月22日 OpenRouter 编程类目模型调用,K2 已从上周二发布第 4 天时的第 10 上升到第 5。 58:32 技术排位变化:Google is back、ChatGPT 更强化超级应用、Anthropic 也自己“造壳” -应用的生长 01:15:23 雇佣 AI——1个月 1000 美元的 AI 订阅费 01:23:19 Agent 的应用进展需要新的 L3 模型 01:30:22 在硅谷,对创业产品的像素级模仿为何较少发生 -新的提问 01:35:35 持续好奇:如何衡量智能的边界? 01:38:00 灰犀牛:当个人有了大量生产力,怎么处理效率 vs 公平? 01:43:31 未来几个月想验证的悬念?——L3 模型如何到来 01:48:37 一款契合 AI 创业者的游戏《33 号远征队》 相关链接: 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 晚点聊 110 期:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊 103 期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 Context Engineering for AI Agents: Lessons from Building Manus 《AI Agent 的上下文工程:从构造 Manus 中学到的》(Manus 联创季逸超近期发布的 Context Engineering 文章) Sparks of Artificial General Intelligence: Early experiments with GPT-4《通用人工智能的火花:GPT-4 的早期实验》 Asymmetry of verification and verifier’s law《验证的不对称性和验证者法则》(Jason Wei 近期博文) 剪辑制作:甜食、Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
126
126: 解读智元机器人“类借壳”:6个涨停板!可想学不简单
「一场备受关注的并购,能让智元成为具身第一股吗?」 本期,我们讨论上周三发生的一起备受关注的交易:一级市场具身智能明星公司智元机器人相关主体以 7.84 亿元人民币获得科创板上市公司上纬新材 29.99% 的股份。 这之后的 6 个交易日里,上纬新材已经连续 6 天 20cm 涨停,股价从交易前的 7.78 元涨到了 23.24 元(截至 7 月 16 日中午休市时)。 围绕这场交易,有很多期待和讨论:这是不是借壳?智元会否因此有可能赶在 5 月底股改的宇树之前,成为具身第一股?其它有大量现金的一级市场明星科技公司,是否可以效仿?学习。 我们邀请了曾做客过《晚点聊 LateTalk》第 39 期节目的蓝桥资本创始人王超,来与我们详解这些问题。 成立三年来,蓝桥完成了40+融资、并购等交易。过往并购案例包括京东工业品收购工品汇并完成分拆融资、某战略集团投资石墨文档、印象笔记分拆中国区业务、百度集团收购私有云企业云途腾科技、360集团收购东巽科技、奇点云收购GrowingIO等。 简单的结论是:这不是借壳,科创板也不允许和倡导借壳;智元的操作其它公司学习有门槛,需要 5-10 亿的基础资金,需要公司股东协议的支持,能相对容易地对拿出大额资金去对外收购股份有共识。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人;王与桐,《晚点 LatePost》科技作者 本期嘉宾:王超,蓝桥资本创始人 & CEO 背景资料: 上纬新材料科技股份有限公司详式权益变动报告书 【截至要约收购报告书摘要签署日,收购人之一智元恒岳的股权控制关系图】 【此次股份转让的出让主体、购买主体,股份变化】 时间线跳转: -智元公司 & 此次交易概况 01:54 稚晖君背后,智元实控人邓泰华是谁? 04:02 7.8 亿元买上纬新材 29.99% 股份,获得相对控股 -交易性质?科创板不能借壳 08:58 科创板不能借壳,科创板也不应该有壳 12:56 科创板并购重组交易中,向上市主体注入资产的流程与难度 23:26 智元股东同意花钱收购的可能原因?——一种希望 24:42 上一波 AI 公司退出难的教训 25:48 为什么只买到 29.99% 28:56 太多报道关于智元,太少关注上纬新材 -其它科技公司能学吗?没这么容易 36:20 效仿智元的门槛:公司有没有钱?能不能拿出来? 43:32 如果去港股上市呢? 46:21 好的「壳/标的」该如何?—业务干净、业绩不掉、股权相对集中 52:01 启明、梅花作为基金 GP 收购上市公司资产的尝试 55:28 A 股二级何时更放开?指数是个好指标 相关链接: 晚点聊39:从美团收购光年之外,聊聊科技公司收并购的操作与故事 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q 即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
125
125: 用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型
「感觉自己永恒了。」 本期节目的嘉宾,心识宇宙创始人陶芳波有一套自己的 AI 助手分类法,分类标签都是人称代词: 第一类 AI 助手主攻陪伴,对应人称代词 her,就像电影《她》中承接主人公各种情绪的“萨曼莎”;第二类助手负责执行具体任务,类似《钢铁侠》中的智能管家“贾维斯”,对应人称代词 him。 陶芳波创立的心识宇宙(Mindverse),正在做第三类 AI 助手:me。他们想帮用户复制自己的“第二自我”,构建“身份大模型”(AI Identily Model)。这模型的认知、偏好、价值观和用户个人对齐,能代表用户发起、完成或验收工作。 创业前,陶芳波一直沿着 AI 研究的主线前进。他先后就读于清华大学、伊利诺伊大学香槟分校,毕业后第一份工作是在 Facebook 使用机器学习方法挖掘社交关系,随后到阿里达摩院神经符号实验室,调动跨学科知识,让 AI 模拟人脑。GPT-3 到来后,他决定下场创业。 陶芳波认为,当下已经有足够多的工具满足用户的日常需求。普通用户可能并不需要更多 AI 技术加成的工具,但需要一个 AI 版的第二自我,代理自己去和世界交互。 大部分创业公司让模型和用户对齐的方式还是把历史对话、用户偏好等内容作为上下文输入模型,每个用户使用的底层模型相同,只有上下文不同。心识宇宙团队则主张根据用户数据微调模型,把记忆、情感、价值观参数化。 除了打造身份模型的方式外,陶芳波还在本期播客中分享了身份模型的具体使用场景,以及如何通过产品设计让身份模型和用户“共生”,由此减少用户上传数据的阻力、方便身份模型迭代。 在陶芳波的终极想象里,人人拥有身份模型,意味着现实中运行的社会网络可以被复制到线上,不过在线上交互的 AI 不受人类打字、讲话速度限制,效率更高。身份模型替代人类收发任务、相互协作,人们将会从被迫使用各种工具的状态中解放出来。 本期嘉宾:心识宇宙创始人 陶芳波(即刻 @Tao水木八公) 时间线跳转: - 边创业边研究机器学习的 9 年求学生涯 01:52 大四开始第一段创业,做微博时代的达人撮合平台 04:21 读博前,自由度更高的神经网络成为显学 07:00 专攻数据挖掘方向,建模恐怖分子组织架构 10:56 读博期间的另一个创业项目:学生外卖 - 从 Facebook 到阿里,做能参与人类社会活动的 AI 13:33 既然 AI 有自主性,就要做有社会参与的 AI 16:13 过于发达的工具,让人成了工具的接口 19:28 毕业后,先去 Facebook 为社交网络建模 20:51 阿里时期,阅读认知科学、禅宗相关的书,思考如何造人 - 创业与重定向:从做 him/her 到做 me 25:46 GPT-3 出现,亲自下场的时候到了 28:16 Mindverse 重定向,从做 him/her 到做 me 33:03 用户训练完身份模型后,“觉得自己永恒”了 35:33 两个 AI 身份项目:Me.bot 开箱即用,Second Me 对外开源 37:26 不是 AI 分身,而是 AI 身份 44:04 Me.bot 的最新功能:共鸣、Talks 01:14:02 大量需要一个 AI 身份介入、互动的场景已经存在了 01:17:40 中国互联网数据孤岛和 AI 的通用性矛盾,一定会被打破 01:19:49 用开源模型、本地训练的方式帮用户克服递交数据的心理壁垒 01:23:31 设想中的商业模式:身份即服务 - 身份模型的训练方法 01:25:36 不用 RAG,把对个人的理解内化在参数中 01:29:37 把客观数据变成主观数据,重新抽象、总结 01:36:30 微调不会让模型忘掉知识,但可以放大个人相关的知识 01:39:19 公司周年庆上,身份模型预测出自己的讲话内容 01:41:41 一百份思考、一百份笔记,足够训练出一个 Second Me 01:42:43 模型应该每天微调一次,就像人每晚睡觉时形成记忆 01:44:36 只有让 AI 和用户“共生”,才能降低传输数据的阻力 相信非共识项目有成为共识的那一天 01:49:35 大厂有更多数据,更适合做身份模型,但小公司没负担、更高效 01:53:00 买量不可取,更希望通过口碑获取用户 01:54:54 不赶 AI Agent 的热门,2026 可能也是身份模型之年 剪辑制作:甜食 本期主播:孙海宁(微信 @_HaydenSun) ![]https://hv.z.wiki/autoupload/20250422/AHFm/1788X252/WechatIMG1762.jpg ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
124
124: 理想前总裁的没苦硬吃,沈亚楠怎么花5亿给中国中产造家
「当不再有钱、有闲多次换房,装得好一点,是不是选项?」 5 年前,我就采访过沈亚楠,当时他是理想汽车的联合创始人和总裁。再之前,他先后在中兴、埃森哲和联想工作,最高担任过联想全球供应链副总裁,兼摩托摩拉移动的董事长。 一位有丰富经验的科技制造业管理者,这是我 5 年前对沈亚楠的第一印象。 而去年再见到他时,沈亚楠已经从理想汽车正式离开了一年多,开始了他作为一号位的新创业,栖息地。 那一次,我见到了一个手舞足蹈、表情丰富的沈亚楠。他全情投入地描述了栖息地想做的事——给中国家庭打造一个“幸福的家”。 这不仅是装修,没那么简单。沈亚楠关于怎么开发、制造,并最终交付一个家,有一套全新的想法。 这一次,我再采访沈亚楠时,栖息地已成立整整成立 3 年。在今年 2 月正式推出了第一款一体化智能住宅整装产品 L32。标准版价格是 39.98 万元,包含全屋空调、新风、净水系统、木作柜、智能中枢等全套产品。 图注:沈亚楠说栖息地做的工作本质不是装修,是制造。他希望用“攒机(一般的装修)vs 一体化”来表达这种区别。但 2 月的发布会后,他认为整体上,栖息地应该寻找更好的与客户沟通的方式。 这 3 年里,沈亚楠已在栖息地上,投入了自己的 5 亿元。他相信,中国总会出现自己的 HomeDepot(家得宝),这是一家市值超 3600 亿美元的美国居住改善行业巨头,占美国这一市场 1/5 的份额。 中国的大家装是一个 5 万亿元规模的市场,但目前极为分散。中国家庭装房子,常常是过程不开心,最后的结果也不满意。这是一个存在已久,很多公司都没能解决的问题。 绝大多数人都劝沈亚楠,不要进入这个领域,不要做这件事,不要趟这趟浑水。他还是来了。 这是一个中年成功人士,如何回到创业、重新挑战自我极限的故事。 本期嘉宾: 沈亚楠,栖息地创始人兼 CEO 时间线跳转: -继续创业 02:41 休息不是选择,想再挑战成长极限 06:31 新命题:如何传达栖息地在做什么?不是装修,是一体化智能住宅 09:49 中国会有自己的 The Home Depot「家得宝」,4000 亿美元市值的居住改善巨头 19:50 李想的提醒:注意大环境。如何避免类似「住范儿」那样的客户利益损失? -装修之痛 25:09 装修第一步是不知道相信谁;攒机→过程和结果没有确定性→不满意 29:28 小米 YU7 的启发:功能与品牌传递的平衡 35:05 什么是幸福的家?要素一:美好的关系——空间布局设计为关系创造环境 38:18 要素二:自然、优雅的审美,栖息地不做「尖叫」的设计 41:47 要素三:健康、舒适的环境(全屋空气、光、水系统等) 43:08 二手房重装怎么操作?一个东城老楼的案例分享 47:42 什么是好的交付过程?——省心。要素一:产品化;模块化开发和制造,定制化交付 53:21 要素二:建立高效的「人料协同物流体系」 55:53 要素三:激发施工班组(工人)的积极性,做对工人激励 -栖息地 3 年走到了哪儿? 01:01:11 产品、品牌、交付,栖息地 3 大战略状态复盘,当下要着力解决品牌沟通 01:14:56 与理想从 0 形成品牌的差异?现在做智能住宅,是要定义新品类 01:17:25 定义新品类,可以学谁?一个关键也许是,怎么抓到新的时代潮流 01:19:22 一体化智能住宅背后的潮流与人心:品质、美的自信 01:25:47 何时降价?继续减少中间环节、产品化,提高交付效率→未来 25 万也能做很好的家 -现场有神灵、脾气更好了、接受「无限游戏」 01:28:00 出发时「天真」的地方,为天真付出的代价 01:32:34 中国的行业 No.1 份额也只有一点点,没人知道谁是 No.2。而栖息地想做到 20% 的市占率,对应万亿收入 01:39:30 一体化智能住宅的天时、地利、人和 01:42:16 花了自己 5 个亿,对儿子说:“世界上只有两件事儿会变穷,赌博和创业,所以你得靠自己。” 01:44:03 梦想中的研发,甚至还有家庭服务机器人 01:47:45 “现场有神灵”,在客户最容易发飙的行业,自己脾气更好了 01:51:08 「无限游戏」,方向不变,路径、规则可调,从挑战者到生态合作者 相关链接: 《理想前总裁沈亚楠再创业,从给中产家庭造车到给中产家庭装修》 《沈亚楠 “造家” 两年半后:反思激进、反行业内卷、智能不再是暗线》 封面:栖息地的一体化智能住宅示意 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
123
123: 当只有AI,人会活成怎样?与五源孟醒和两位挑战者还原72小时AI生存
「我真的就是 AI 鲁滨逊!」 今天的节目关于一场前不久刚发生的真实 AI 实验:由五源资本发起的 “72 小时 AI 生存挑战”。 几个月前,我得知五源在筹备这个挑战时,觉得新奇又奢侈。很多人的疑问是:有这个时间,为什么不多看点项目? 挑战发起人,五源资本合伙人孟醒说,五源是想跳出信息茧房,验证一个问题:背景各异的更广泛人群,到底能用 AI 做到什么?他们唯一没有考虑的,就是怎么筛项目。 “项目我们平常也在看,我们希望做一点大家不干的事。”孟醒说。 挑战有两个环节:一是生存——在没有智能手机、电脑也不具备浏览器等工具的情况下,靠大模型和 AI Coding 等 AI 工具,选手们能否取得食物等生存物资;二是创造——每组挑战者会设定一个AI目标任务,比如应用开发、内容创作,甚至尝试用AI赚钱。 最终有 7 人参加挑战,其中 2 位这次做客了《晚点聊》:他们是完全不会编程的青年导演 利建磊,和从文科生转码的 AI 产品开发者陈郅悦。 利建磊,在生存挑战中得到了灵感,创作了短片《7.41》。陈郅悦已用 AI Coding Agent 开发了数个产品,而且已有收入。这次挑战中,她做了一个让大模型给真人主播反馈的 AI 虚拟直播。让没粉丝的素人也可以在友好、安全的氛围里,以直播方式去倾诉。 这次挑战实际测量了 AI 在数字世界的环境阻力:“其实 Agent 作为一个人的替代,它在它的生存世界里面是没有尊严的。本质上就是 Agent 需要跪在验证码之前,然后来去假装他是个人。” 也再次展现了人的社会性——人还是那么需要人。7 位挑战选手想尽各种方法,在这 72 小时中彼此交流和帮助。 本期嘉宾: 孟醒,五源资本合伙人 @播客「技术不无聊」主播 利建磊,青年导演,72 小时 AI 生存挑战者 @三石先生(小红书) @三石先生「新片场」作品集 陈郅悦,AI 产品开发者,72 小时 AI 生存挑战者 @cece陈(即刻) @cece陈(游光版)(小红书) 时间线跳转: -一个实验 03:13 起点:跳出信息茧房,验证 25 年初的分歧:普通人真能用 AI 做出惊艳产品? 07:14 1999 年的互联网生存挑战给了形式启发;但这一次,不仅挑战生存 15:10 五源的准备,自己先实验是否真能“生存” 17:56 五源创始合伙人刘芹的反应?——唯一不考虑的一点是找项目 20:10 利导和郅悦,两位的参赛故事 24:22 郅悦的 AI 虚拟主播,想法在这次挑战成为现实 25:34 无任何编程基础的利导,挑战是为了“按下暂停键” -生存 34:12 第一口热食的滋味 41:04 饥饿状态,度日如年 43:22 300 多人报名,从十几岁到 60 多岁,他们眼中的 AI 46:37 不仅有人和 AI 的协作,更多是人和人的交流 50:30 回到最初的假设:普通人,真能 AI 做好东西? 51:42 现有 IT 环境下,AI Agent 是在戴着脚铐运行 56:56 对 Agent Infra 机会的一个小型试验 -创造 57:58 利建磊马航主题短片《7.41》,想验证导演是否能在 AI 时代成为超级个体 01:07:27 陈郅悦的转码经验:跟着视频一步步学没用,干中学 01:09:55 3 个月开发第一个 AI 产品,现在每月约 1000 欧元收入 01:16:32 72 小时里开发 AI 虚拟主播,挑战后也在继续完善产品,成本比想象中低很多 01:31:33 小而美能长期存在吗?AI 是否在改变组织形态。孟醒说:“两年前他更相信这件事” 01:36:39 下一个可能想验证的新问题?——世界模型,或 AI 领域的新东西,谁知道呢? 01:41:51 经过这 72 小时,没变的和改变的 相关链接: 五源「72 小时 AI 生存挑战」视频纪录 《72小时AI生存挑战,发生了什么?》(图文记录) 《暗涌》对这次活动的报道:《72小时全纪实:人类与AI的第一次亲密接触 封面:72 小时 AI 生存挑战过程 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
122
122: 10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩
「这对小学生太幼稚了,对“我”刚好好。」 你想要一个 AI 潮玩或宠物吗?它不仅可以用忽闪的大眼给你安慰,也可以在解锁“地球语后”陪你学化学公式。芙崽 Fuzozo,这个朱啸虎聊了 10 分钟就决定投资的 AI 潮玩,没有瞄准儿童市场,而是想打动成年女性。 本期《晚点聊》,我们邀请了 Fuzozo 的创造者,RoboPoet 珞博智能创始人孙兆治,来聊聊他经历的 AI 陪伴赛道。 孙兆治曾多年在欧洲设计汽车,2015年回国,先后加入小鹏、滴滴任设计负责人,21 年加入小鹏机器人公司鹏行智能。23 年底开始创业。 Fuzozo 于今年 618 期间首发。半月后,大促期间定价 399 元的芙崽 Fuzozo 在首发渠道京东,卖出超过 2000 件,进入潮流盲盒销售排行榜前10 ,它前面的产品全部来自泡泡玛特。 图注:芙崽 Fuzozo 有 5 只,分别具有金、木、水、火、土属性。 孙兆治相信,给人提供陪伴和情绪价值的 AI 硬件赛道,被大大低估。他也已经观察到一些更大的玩家在跃跃欲试。 “我们已经知道就是有些大厂也下厂开始做。比如说米哈游。”孙兆治说。 但这仍然是一个非共识。市场对 AI 陪伴硬件有很多疑问:比如产品容易被模仿?用户使用不持续?AI 含量小、技术占比低,没什么门槛等等。我们在本期中,与孙兆治一一讨论了这些问题。 本期嘉宾:孙兆治,Robopoet 珞博智能创始人 时间线跳转: -养成系 AI 潮玩,IP 要严格遵守世界观 03:20 Fuzozo 作为 AI 养成系潮玩的玩法:亲密值、“毛毛语”、“地球语”、“写日记” 07:58 吐槽答疑:2 年就得换硬件?不存在 10:47 记忆只能同种族迁移,IP 要严格遵守世界观,“生命”就会有限制 -“对小学生太幼稚,对我刚刚好” 12:37 一开始就想服务 Z 时代女性;桌面机器人是有趣的技术尝试,但用户不想要 15:48 24 年融不到钱,25 年和朱啸虎聊了 10 分钟,对方投资 18:56 具身的此刻:demo 简单,稳定落地难 20:39 陪伴硬件上,TTS 语音和大模型能力同类重要 22:10 参考养成游戏,3 要素:精力投入、情感羁绊、社交节点 27:01 做减法的过程:保留最低生命感 31:18 最激烈的争论:会说人话 or 不会?——为何最终选前者 34:47 世界观的形成:金木水火土,是中国的 MBTI 42:30 AI 还占多少比例?陪伴真的需要“智能”吗? 49:22 京东直营的采购量,就有可能让 Fuzozo 成为 AI 陪伴硬件 25 年销量第一 -米哈游、泡泡玛特、优必选,不同背景大公司都在试 52:27 游戏的、机器人的、潮玩的,都在做 54:51 不怕和大公司竞争,也只能面对竞争 01:00:46 行业下一个节点——端侧模型直接部署到陪伴硬件上 -从巴黎的 46 天年假到连轴转,回国一定是正确的选择 01:05:33 在法国做汽车设计→小鹏、滴滴→鹏行智能,从巴黎的 46 天年假到连轴转,但回国是对的选择 01:11:53 何小鹏的汽车设计审美?小鹏的设计早年为何不连贯? 01:21:22 上一次创业做智能猫砂盆的复盘 01:24:54 出来混,重要的是“出来” 01:26:27 产品设计出身,如何学习 AI 技术? 01:28:56 抚慰人的孤独,值得做深 相关链接: 晚点独家丨不投具身的朱啸虎,投了小鹏机器人前成员做的 AI 潮玩 晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动! 晚点聊 118 期: 晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 封面:5 只芙崽 Fuzozo 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
121
121: PingCAP黄东旭的“内在世界源代码”:《黑镜》、程序之美和创作自由
「一个会写诗来描述数据库内核规则的人。」 这一期,我和晚点创始人小晚一起与 PingCAP 的 CTO 黄东旭聊,聊黑镜,聊 AI,聊他个人生活方式的转变:这是一次编程、科幻、创业的通感碰撞。 从黑镜第 7 季的故事,到中国最早做开源的 PingCAP 公司和他们的数据库核心,都有一些共通的逻辑和内核: Q:你们创业第一天是不是就给公司定下几条原则? A:第一条原则就是几个创始人我们是要组成一个分布式系统。分布式系统里面有一个很很重要的原则叫做互为冗余 程序之美,曾给还是中学生的东旭带来极大震撼: 对我比较影响特别深的 John Carmack。读他的代码时,我第一次从一个软件里边有看到像看一个艺术品一样的感受。 虽然这仍是一期和 AI 相关的节目,但最后聊到生活,黄东旭的一个建议是,其实不一定要搞懂 AI: 你养了一盆花,做一道菜,然后去认真的了解你身边的人,这个事情其实作为人的一个可能是存在的。这个意义比起一些我要去高峰,非得要高峰transformer的这个原理,这个不是要更加具体。 这期的开场和结尾 BGM,与平日不同。因为我用了黄东旭今年的新专辑 《Whispers of the Silent Mountains》 里的一首歌 《drifting_dream》。对,他还是一个野生音乐家。 本期嘉宾:黄东旭 PingCAP CTO,开源老黑客、野生音乐家 时间线跳转: -美剧与创业 03:17 十年前,看《疑犯追踪》的创业启发:为未来 AI 做数据存储准备 07:52 卖掉房子,开始住房车,“没用的东西全都扔了” 12:45 PingCAP 的创业原则:几位创始人构成分布式系统,互为冗余 13:41 《黑镜》第7季第四集的启发——简单结构,产生复杂智能 22:34 元胞机/生命游戏、TiKV,都是简单结构产生复杂智能 34:06 软件系统构建的“剑宗”和“气宗” 37:10 对智能不同理解背后的哲学差异:规律真能被掌握吗? -黑客、开发者与程序之美 43:51 沃兹尼亚克的启发:有趣很重要 47:04 创造 Doom 的 John Carmack:极致受限环境,优雅编程 50:51 放弃传统调式的 John Cage:打破常规 52:15 PingCap 所有联创此前都没做过数据库,从头开始思考怎么做数据库 -云原生和出海 55:26 曾经低估云原生的发展速度 01:04:45 PingCAP 的实践与教训:全球化是更好的本地化 01:05:45 中国为何不能诞生 DataBricks? 01:06:44 想成为最受尊敬的基础软件公司 -养花、种树,也可以不用搞懂 Transformer 01:11:27 学编程——最重要的是,有目标,完成目标,动手做 01:15:07 不能一直 vibe coding 01:19:14 PingCAP 的新思考:AI 需要什么样的数据存储? 01:21:06 不想看 Saleforce,自己写了个 Agent 01:24:24 做 database不会失业,每个人都会有自己的 Personal Data 01:30:36 开源是竞争策略,也是本身想做的事 01:40:45《神的九十亿个名字》我们是不是在加速来到结尾? 01:44:43 离开计算机,我的意义是?——AI 无法替代你体验 01:49:26 欣赏非数字内容,人造的东西会很珍贵 01:51:20 如果只能往宇宙发送一曲摇滚遗产,我会选《月之暗面》 01:54:56 看到美团跟京东的商战,什么感觉?——“他们在商战吗?” 附录: 描述 TiKV 规则的诗——The Zen of TiKV Everything is KV pair Every KV pair belongs to a Region, but a Region contains multiple KV pairs Every Region belongs to a Host, but a Host contains multiple Regions Region comes from nothingness, only specifying the beginning and the end of a KV range Initial Region is (-∞, +∞) When Region is too big, it splits When Regions are too small, they merge Region can copy itself (to other hosts) Region can also destroy itself Regions live and prosper 元胞机 (Cellular Automaton):一种在网格上由简单规则驱动的离散计算模型,每个“元胞”根据其邻居状态演化。 沃兹尼亚克 (Stephen Gary Wozniak):美国电子工程师、程序员和发明家,苹果公司联合创始人之一。 约翰·卡马克(John Carmack):美国著名程序员、游戏开发者和技术企业家,id Software 联创,开创了《毁灭战士》(Doom)、《雷神之锤》等游戏及其3D引擎技术。 约翰·凯奇(John Cage):美国先锋派作曲家、音乐理论家、作家和艺术家,以实验性音乐(如作品《4分33秒》)和运用偶然性而闻名。 Doom (《毁灭战士》):由 id Software 开发、约翰·卡马克等人创作的第一人称射击游戏(FPS),极大推动了该游戏类型的发展和3D图形技术。 《神的九十亿个名字》 (The Nine Billion Names of God):阿瑟·克拉克创作的一部著名科幻短篇小说,讲述一个计算机项目旨在列出神的所有可能名字及其引发的宇宙性后果。 相关链接: 黄东旭的博客《东方美学与软件设计》 晚点聊108:与马毅聊智能史:DNA是最早的大模型,智能的本质是减熵 晚点聊116:当 AI 研究者写科幻,与 Meta 田渊栋聊他的智能想象:我们终会“所思即所得” 封面:黑镜第七季第四集 Plaything 的剧照 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
120
120: 科创板后再访Insta360刘靖康:这何尝不是一种极限运动!
「你只活一辈子,要活得不一样。」 今天的嘉宾是刚刚进入新阶段的影石 Insta360 创始人,刘靖康。 本周三,6 月 11 日,影石成功登陆 A 股科创板,开盘即大涨 285%,市值一度突破 700 亿元人民币。 影石现在把全景相机做到了世界第一,在运动相机的市场份额,也已接近目前排名第一的老牌玩家 GoPro,且有反超的趋势。 图注:搭载卫星倍长征二号火箭发射升空后,Insta360 ONE X 系列全景相机拍到的地球与银河的同框。 两年前的夏天,我们就访谈过刘靖康,文章在这里:《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?》 现在再与刘靖康聊,他对怎么做产品,怎么运营一个更复杂的组织,都有了更深的实践和思考。他更清晰地描述了自己的长期目标——一个是做世界级的产品,一个是做一个新形态的学习型商业组织。 他也分享了仍需修炼的能力,和仍然存在的困惑。 刘靖康说,他做很多事的动力之一是 YOLO,You only live once,你只活一次。那么,该怎么对待只有一次的人生?创业、做产品和做公司,都是他的答案之一。 本期嘉宾:刘靖康(JK),影石 Insta360 创始人 时间线跳转: -从“猎人策略”到“包围式差异化”进攻 01:32 这有点儿像,你 4 年前就领了证,今天才办婚礼 04:14 两年三变化 07:37 “猎人策略”进化,新的 3 种 level 13:00 AcePro 为何跳入与 DJI Action、GoPro 的更直接竞争? 18:57 包围式差异化式进攻 22:25 影像是「开放世界的市场」,就像游戏,产品之间难以等效替代 25:28 不要忽视任何环节做好带来的增益,和没做好带来的损失 -防比攻更难,但能力提升也更快 27:48 大疆也要发布全景相机了,如何应对? 31:06 Ace 系列有挫折,但此刻是好结果 34:00 两种产品思路:需求导向 vs 竞争导向的平衡 37:18 员工学滑雪、潜水,费用都报销,鼓励他们成为目标客户 41:29 全焦段、全场景,愿景是“帮助人们更好记录和分享生活”,而不只是运动 43:56 防比攻更难,但也更能带来能力提升 -开放世界竞争,有门槛、难有壁垒 49:00 大多数消费电子品类,有门槛、难有壁垒 54:18 无人机市场的门看似焊死了,其实也能推开 55:11如果我账上的钱只够活三个月,傻子才会跟他竞争 56:57 抓住大机会的公司都不是“白纸”,是机会到来时能力积累最 ready 的组织 59:16 试,这不是最经济的方式 01:03:03 say no 的方向:为何不做车载?电影机曾经的失利 01:09:24 何时谋定而后动,何时跳下水迭代 -控制住,别直接给答案 01:18:15 AcePro 2 街拍套装都要上市了,我才知道 01:22:00 提高决策能力的唯一方法是,决策、行动,然后获得反馈 01:27:03 最难的是,克制住直接给方案的冲动,这反人性 01:29:42 表扬要公开,批评要单独;给负反馈时,不要高高举起、轻轻放下 01:31:55 试图打造员工发展第一,客户第二,股东第三的组织 01:36:39 这家公司赚的是“开发新知识”的钱 01:40:35 面对员工吐槽:识别目标员工,解决共性问题 01:42:27 定期识别隐性职责和跨部门职责 01:50:00 矩阵式组织的关键是,上下左右对齐目标 01:54:49 组织上什么最难?激发人心 你的底层不是一场战争,是 YOLO 01:58:40 组织复杂性将持续,但会迭代优化 02:01:26 眼镜也许是大机会,但非 Insta360 的大机会 02:07:50 迄今为止,最勇敢的选择 02:12:07 害怕失去,所以 YOLO,所以勇敢 02:14:39 你的底层,不是一场战争 02:17:50 有了孩子后,发现家庭记录场景的更高上线 02:19:18 4 个太多 & 4 个不够 02:21:09 被采访是提炼想法、明文表达的时机 02:22:00 我们就是公司里的极限运动玩家,不求安逸,All in or nothing 相关链接: 《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?》 晚点聊 118:天生卷王郭人杰:从 97 年的扫地机总裁到创业做家庭通用机器人 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
119
119: AI视频产品怎么Go Viral?6000万用户的PixVerse的答案
「两个没完整操盘过 to C 产品的创始人,怎么找到病毒传播的法门。」 本期《晚点聊》对话爱诗科技联合创始人谢旭璋,他是创投从业者出身,现在做出了 6000 万用户的 AI 视频产品。这次播客中,他讲述了从投资人转身为 AI 创业者的动因,为什么视频生成是他眼中的终局机会,如何把产品做成爆款,以及如何在“资源节俭”的模型战略里快速推进。 同时,作为一名似乎没有等来好的投资时代的 90 后创投从业者,他也跟我们分享了从投资转向创业的心路历程。 时间线跳转: -从光源资本到创业实验 01:10 自我介绍:从光源资本到 PixVerse 联合创始人 03:46 接触 AI 生图,被 Midjourney 震撼到沉迷 06:11 周末泡在杭州线下黑客松,与技术合伙人组队创业 08:11 23年春节后,与王长虎结识及互补团队结构 08:55 视频是视觉 AI 的终局场景?变化正在发生 -要做普通人的 AI 视频工具,而不是冲击奥斯卡 12:13 别人想冲奥斯卡,爱诗想服务好普通用户 15:04 视频表达门槛高,AI 能降低表达门槛;但视频又是现在最重要的传播媒介 16:15 怎么让普通人做出第一个视频?“毒液模板”爆红,用户破千万 17:39 模板两个优势:不需要写提示词,也能提高抽卡率 18:57 收入增速翻了十倍,月收入千万人民币,(海外)订阅是主要变现方式 20:57 移动端产品上线前几个月,用户即破千万 22:23 AI 应用产品化还处于非常早期阶段 22:58 社区、共创、模版生态的未来可能性 24:12 用户不是专业剪辑者,而是普通人,新创作者 25:23 多模态生成仍有问题,正在探索 -创业公司的生存策略 27:15 稳健策略训练模型:很多同行的十分之一、二十分之一 28:40 资源节俭哲学:以少胜多 29:12 中国三家公司和 Google 是第一梯队,与 Sora 属于不同路径 34:53 不担心和大公司的竞争,因为视频行业还在快速发展 36:36 用户自发传播,不依赖平台流量 37:45 很多普通人的第一个万赞、十万赞、百万赞的视频就是用 PixVerse 做的 AI 模板:先全球化,再进入中国市场 38:25 国内市场已经验证过了:有人在咸鱼上求代做视频 39:25 视频是通用媒介,模板快、准、美是核心能力 41:54 用户主导内容趋势:AI 辅助用户而非替代创作 42:35 圣诞节“耶稣温暖你”模板在欧洲爆红 43:58 海外与国内产品版本一致,局部调整 45:08 美国、巴西、俄罗斯、印尼等人口大国主要市场 46:48 “每天刷 TikTok 的人”是 PixVerse 的目标人群 最基础的是模型能力 48:46 视频生成模型仍然有很大进步空间 49:17 模型迭代和产品相辅相成,模型技术用在什么场景很关键 52:21 看到的新架构架构趋势:DIT + 自回归 53:01 生成速度变得更快是更有意义的 54:11 探索 to C 也探索 API 模型、产品、用户的取舍 55:48 模型和产品的资源分配如何平衡? 57:00 和大语言模型不同,视频生成模型是“摄像头”,不能单卖 58:15 APP 面向普通用户,网页端更偏专业创作者 01:05:25 视频生成是无人区,所以过往有没有经验意义不大 01:10:07 什么是规模化的产品:用户留存和自然传播才算 投资人的能力迁移 01:14:50 在北大光华的读书时光:去硅谷访学,被创业氛围冲击 01:18:01 在光源资本时,经历互联网整合期 01:22:14 看过足够多的公司:看准了就要赌,要赌就要 all in 01:23:35 相信两类 founder:即使冒险也是热爱;坚持探索技术 01:24:14 同时入行的投资人,都在做什么? 01:26:28 在光源看过各种项目,但几个月达到千万月活的凤毛麟角 01:27:38 面对噪音,要相信自己 相关链接: 爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品 对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月 剪辑制作:甜食、Nick 本期主播:即刻 @王与桐 小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
118
118: 天生卷王郭人杰:从97年的扫地机总裁到创业做家庭通用机器人
「竞争起来,我才最开心。」 本期我们同时拍摄了播客视频,将稍晚在 bilibili B站发布。 今天的嘉宾,是一位去年底被一级市场争抢的明星创业者,乐享科技创始人郭人杰。他 15 岁进入西安交大少年班,专业是能源与动力工程,后在伦敦政经学院获得金融硕士学位。 图注:郭人杰和乐享的小型舵机机器人,这是乐享今年将上市的产品之一,目标场景是让极客们做开发。2025 年 1 月,乐享团队将十几台原型机背到美国,用于和美国具身智能公司 K-Scale 联合举办黑客松。 2021 年加入追觅后,郭人杰在不到 4 年的时间里,从营销负责人做到了追觅中国区执行总裁。 去年 11 月,郭人杰离职,到 12 月底,他就拿到了来自 IDG 、经纬、真格、Monolith 和绿洲等机构的天使轮投资。其实那时,他只是想好了一个大的创业方向:要做面向消费市场的智能机器人。 在没有产品和数据的极早期阶段,投资的逻辑是看人。郭人杰有非常强烈的个人特质。 他极致接受高频试错和快速迭代,不到 4 年里,他和团队把追觅自有品牌在中国市场的销售额从 1 亿人民币做到了 60 亿。 他像创业那样去上班,倾尽全力、能上能下,4 年里,他两次被降级,又重新得重用。 这期节目的前半部分,我们聊了郭人杰在宝洁和追觅的职业生涯——一个“卷王”,能在不到 6 年的职场经历中如何学得更多、成长更快。 后半段,我们聊了郭人杰这次创立乐享的思考,郭人杰的理念是“赚钱养梦想”,他并不会声称,自己要做最前沿的探索,而是希望找到出于 0-1 之间的 “0.5 的机会”,它既不是那种大公司会一齐涌入的强共识,也是一个长周期里都不会有商业结果的方向。 图注:乐享科技将推出的机器人之二,用于家庭场景的“瓦力”,计划今年秋天上市。 乐享即将上市的机器人产品也体现了这种思考:比如其中一款,是给家庭市场做的户外陪伴机器人,它还原了 瓦力 的形象,非常可爱,这期封面,就是这款机器人。郭人杰在描述需求时,主要讲了信息交互和陪伴,并没有提到让机器人干活,这确实是目前技术还很难达到的状态。 在攻克具身大脑和寻求底层系统的突破之外,乐享是另一种智能机器人的创业路径。 本期嘉宾: 郭人杰,乐享科技创始人 & CEO 时间线跳转: -去宝洁,为了了解实业 02:17 少年班经历→伦敦政经金融经济学→2021年加入追觅,参与自有品牌0-60亿增长→2023年11月离职创立乐享科技。 04:01 加入宝洁时,如何为创业做准备 10:05 宝洁为何长寿:SOP/数据库/组织架构)、"敢为天下后" -追觅 4 年:从营销负责人到中国区总裁 16:06 俞浩(追觅创始人)面试时讲:高频试错+快速迭代;敢用年轻人 21:06 破格用人,"高激励+高淘汰",让大专主播月入 5 万 23:21 2021 年首战 618 成功,押对了抖音电商红利 32:08 结果备货没跟上,第一次被降级 34:47 重被任用后:先做洗地机,再快速做扫地机,功能全包围+差异化(烘干)+便宜15%,以B站长内容引爆扫地机品类 37:16 开始全渠道布局:不依赖抖音单一红利,拓展天猫/京东/社区团购 41:39 2022 年中国区销售额达 30 亿,但亏损,再次降级 51:21 新“军令状”:3 个月扭亏,高价 & 高端化转型 -创立乐享科技 55:50 离开追觅:生病、管理千人团队超出能力边界、想要新挑战 01:10:58 乐享科技不追求技术颠覆,寻找"0到1之间的0.5机会" 01:18:08 选择创业方向的 3 个标准: 避开纯技术探索和红海市场; 全球市场可行性,海外营销+国内研发; 与AIGC结合,延长创新周期,避免功能被快速复制 01:24:00 早期探索:从“机器人玩具”切入 → 发现“可定义动作”是核心价值 01:42:01 首款产品定位调整,与 K-Scale 合作开发平台机器人(售价$1000):满足学生/极客的 Sim2Real 需求 痛点:高校买不起更贵的机器人,不敢做高风险实验,年轻极客更买不起 产品逻辑:舵机方案实现基础运动(行走/跌倒爬起),开放硬件+软件平台供二次开发。 02:16:01 未来核心愿景“家庭移动终端”:解决拟人化交互(情感连接)+ 全场景移动(室内外地形适应) 拟人化:替代冰冷硬件(如用“哪吒声音讲古诗”比平板更有温度); 移动性:突破扫地机地形限制(如履带结构适应台阶/户外)。 02:18:43 第二款产品:履带式瓦力机器人(预计 2025 年 9-10 月上市):迪士尼IP授权,一比一电影还原设计 创业策略与行业竞争 01:53:57 “赚钱养梦想”:短期,教具产品保现金流,长期,家庭终端产品探索。 02:00:00 拉来科沃斯前 CTO,招募 AI 背景年轻人:创新+经验组合 02:04:00 与 K-Scale 的分工:互补短板 → “他把我们硬件工程师的照片挂墙上致敬”。 02:13:40 完全没有竞品的赛道可能没活力:“我创业第一天就渴望竞争” 02:21:54 多产品并行逻辑:“发挥快速迭代基因,广泛洞察→收敛需求→快速验证”。 02:25:03 中国硬件公司三代演进:代工仿制→性价比出海→定义新品类和标准 02:28:43 拓竹启示:3D打印机从极客工具到家庭设备的跨越 ,“重新定义品类是硬件公司的最高追求”。 相关链接: 《晚点独家丨追觅前中国区执行总裁郭人杰创业做机器人,接近完成首轮融资,估值约 5 亿元》 晚点聊 112:与千寻科技高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 86:We,Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65:信仰充值的威力,与逐际谌华聊 GTC 和人形机器人新进展 晚点聊 40:与梅卡邵天兰聊通用机器人,AI 的下一个浪潮? 《梅卡曼德邵天兰:“通用机器人” 的吹牛竞赛与现实路径丨具身智能对话#9》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
117
117: 印奇的AI创业14年:所有不能闭环的辉煌都是暂时的
「Business model is the best model.」 本期的嘉宾是 A 股上市公司,千里科技的董事长印奇。他今年 37 岁,已 AI 创业 14 年。在 2011 年,印奇和同为清华姚班的同学,杨沐、唐文斌一起创立旷视科技时,3 人都在 22 岁上下。 图注:旷视的三位创始人(从左至右):杨沐、印奇、唐文斌 上一轮 AI 热潮中,这群年轻人打造的旷视,后来和商汤、云从、依图并称为 AI 四小龙。四家公司曾累计融资 80 亿美元,不过至今无一家规模盈利。从 2020 年到 2024 年,旷视一度在科创板上市流程里等待了 3 年多。 去年年中,印奇得到一个新机会,入股力帆科技,担任董事长,继续做与硬件终端结合的 AI,第一阶段是做 AI+车,即智驾和智舱的完整方案。力帆科技在今年初改名千里科技,千里股东之一的吉利会成为其重要的合作伙伴。 从年少成名、高歌猛进,到被资本追捧,再到公司被美国制裁、两次上市遇阻、苦寻商业闭环未果——印奇完整经历了上一轮 AI 热潮的起落。 本期包含了今年 3 月中旬和 5 月初,我们与印奇的两次访谈: 其中 3 月这次访谈,我们集中聊了从旷视到千里的转变,印奇对过去 AI 创业的总结,和千里的新进展; 最后一部分则是 5 月的访谈,我们更多聊了 AI 大模型的创业机会,和正在快速涌现的 Agent 应用市场。 印奇仍在追求 AGI,但不再是以 22 岁时那种一往无前的方式。这是一个有关 AI 创业的非爽文故事。 本期嘉宾: 印奇,千里科技董事长 时间线跳转: 3月中旬的访谈 - 从旷视到千里 03:17 AI 是 lifelong 的方向,一直想走软硬结合的 AI 05:55 继续推动旷视上市、大模型创业、AI+车(千里),三个选项里为何最终选了千里? 08:34 更倾向 AI in physical,AGI 必须有物理支撑 13:16 智能机器人未到爆发时机 - 只有技术信仰是不够的 17:43 DeepSeek 破圈,不代表能形成商业闭环 18:41 搜狗、旷视、DeepSeek,前沿科技创新的“天才少年”组织模式 20:47 技术信仰 vs. 价值务实:所有不能闭环的辉煌都是暂时的 25:24 一代版本一代神,组织能否迭代决定未来 - 千里新战略 26:10 千里战略关键词:AI 加车,差异化,聚焦智驾 28:43 开放 + 国际化,与吉利的合作不是绑定,而是起点 30:25 供应链开放:寻找各环节最优产品,组成完整方案 35:21 深度绑定车企才能形成数据闭环和技术支点 40:40 对 VLA 的判断:具身更需要 VLA,车的动作(action)很有限 44:41 中国智驾要回归基本功,提升模型化比例 49:39 技术品味来自背景积累,但也不用神话技术背景 52:17 智驾合适的商业模式是 2B2C,消费者要为软件付费,软件才能持续迭代 - 卡在上市流程的 5 年 54:46 低谷的 5 年反而是成长最快的 5 年 58:29 价值务实 + 精细经营 + 战斗型组织 01:06:01 调整研发与销售投入比例的过程——客户导向不是说出来的,而是价值链压出的 01:08:16 管理没那么多新概念,因为人没变;世界是连续的,不存在真正的突变式创新 01:11:13 好的科研关键是定义好问题,创业也一样 01:14:15 在互联网领域,what 很重要;但在大部分其它行业,how(执行力)比 what(认知) 重要。 - 节奏比方向更重要,智驾已进入冲刺期 01:17:54 节奏比方向更重要,要判断冲刺时机 01:20:04 智驾冲刺信号已出现,赢下冲刺所需的 3 个体系 - 见世界、见众生,然后见自己 01:26:50 比以前更狠了?——更追求结果了 01:30:51 聪明人用笨办法,不奢求用小的力获得大成功 01:33:50 为何在少年时就找到 lifelong 的方向? 01:35:30 姚班的科研价值观 01:41:38 人类会选择虚拟世界吗? 01:45:34 艺术家徐冰,科技边界扩大,艺术边界缩小 01:47:57 当你对这个世界有认知,跟一群人做成了很多事,最后可能才能真正知道内心支点,见自己是最后的。 5月的访谈 01:48:31 AI 现在是一个大周期的决赛环节,各公司的积累 01:52:05 Super App,短期有爆发势能,长期上限高 01:54:42 第二阶段的 Super App 方向:Agent——四种分类(办公、内容创作、生活、情感陪伴)& 机会比较 相关链接: 《晚点对话印奇:AI 1.0 的教训是,所有不能闭环的辉煌都是暂时的》 《旷视印奇入主力帆始末:放下上市执念,赌汽车智能化》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
116
116: 当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”
「到那时,高级文明最想要的宇宙资源会是:good idea.」 这是「I,AI」的第二期,这个系列中,我们会讨论 AI 和我们日常工作与生活的关系。 这一期的嘉宾是 Meta GenAI 研究总监,田渊栋。他是 AI 研究者,先后于上海交大、卡耐基梅隆大学机器人研究所获学士、硕士和博士学位。田渊栋自 2005 年开始探索智能和人工智能,最近 10 年,他一直在 Meta 从事 AI 研发。 他还有另一重职业身份——小说家。博士生期间,田渊栋就开始写小说。他在 2021 年连载完了第一部长篇科幻小说《破晓之钟》,这本书在 2024 年正式出版。 《破晓之钟》写作于 ChatGPT 热潮之前,全部内容都是田渊栋自己写的,没有借助 AI。而书里的核心科幻概念和科幻点子,则体现了一个 AI 科学家的技术思维。田渊栋认为,每个技术时代——蒸汽时代、电气时代、信息时代、智能时代——都对应的不同科幻命题和故事。他想写出有 AI 内核的科幻。 几年后再看,书里的一些设计,“预言”了后来围绕算力与智能的攻防战,本书也讨论了当人类不再需要工作时,可能带来什么危机。 这一期,我们会从《破晓之钟》这本科幻长篇开始聊,延展到田渊栋对未来 AI 技术、社会与人类命运的想象。 图注:《破晓之钟》2024 年出版版。 因为本书的主角和英雄们是一群研究者,我们也由此聊了 AI 研究人员的生活与选择。田渊栋也分享了 2023 年之后,他如何尝试在写作工作流里引入更多 AI,AI 现在能帮他做什么,还不能做什么。 由于本期节目是远程录制,音质有一些瑕疵,请听友见谅。 本期嘉宾:田渊栋,Meta GenAI 研究总监,他的个人网站 时间线跳转: -《破晓之钟》写作意图 & 故事设定 05:03 《破晓之钟》想写AI时代的科幻,融合少年热血与中年反思 07:35 主要情节:外星人非暴力入侵,以“完美虚拟生活”诱惑人类;一群研究者如何寻找出路 *-书中的 AI 思维和未来文明想象 * 12:34 灵界立方灵感来自英伟达 GPU 互联,20 年的科幻点子现在照进现实 16:44 人们的两种选择:进入虚拟世界 or 拥抱未知星海 19:38 “虚拟永生”带来的不可忍受之轻和平庸 23:24 结尾悬念:人类真的逃离灵界虚拟世界了吗? 26:03 高级文明银河联盟的动机:寻找独特的智慧和宇宙角落里的其它更优解 29:44 技术终会发展到“所思即所得”,好的发展思路被渴求 35:11 人类进入虚拟世界已成趋势,服务器更适宜星际旅行 39:53 虚拟世界带来短期冲击、中期内卷、长期机会——当我们从常规工作中被解放,创造力可能爆发 -研究者的处境与生活 45:34 AI 未来能否做科研?现阶段仍不具深层推理能力 48:50 田渊栋早年在深度学习相对冷门阶段的研究经历 55:10 小改进 vs 大革新,两类科研者的贡献与角色都很重要 01:00:04 技术 leader 的任务:掌握方向,识人用人,制定策略 01:03:02 从埋头苦干到战略设定,再回归 hands-on 的转变 01:06:08 借助 AI,现在的研发团队可以更小、更精悍 -AI 研究者 & 小说创作者的双重生活 01:12:27 AI 生成的内容,仍缺乏对人物关系的理解和长线逻辑 01:14:40 不同 AI 模型的使用体验:Claude 相对擅长人物关系;给定大纲后,Gemini 可以完成具体情节;DeepSeek 适合“脑洞”,用来写小说“很麻烦” 01:17:28 自制写作工具:人机协作,用 AI 补空、润色,保持人类创意主导 01:25:19 人类独一无二的经验,短时间内无法被 AI 替代 01:26:32 就像银河联盟想要全宇宙的好想法,大模型现在也最需要人的智慧(数据) 相关链接: 《幽夜星火》连载页面 晚点聊 115:华为发布超节点,如何搅动AI算力市场?与魔形智能徐凌杰聊芯片层新变化 晚点聊 109:数字生命卡兹克如何用 AI:把任何要重复 3 遍的事 AI 化 晚点聊106:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q 题图:ChatGPT 生成,prompt 是《破晓之钟》里的一段描述: “人类遗产信息已编辑完成,若计划失败则发送:“我们是人类,曾于银河系悬臂太阳系第三行星居住,被银河联盟毁灭。我们知道四种基本力及一百一十八种由不同原子核构成的元素,目前模式识别方式为多层非线性神经网络……我们存在过、进步过、抗争过!感谢您的收听。” (ChatGPT-4o 并未生成正确的元素周期表。) ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
115
115: 华为发布超节点,如何搅动AI算力市场?与魔形智能徐凌杰聊芯片层新变化
「从拼单颗芯片的性能,到优化多芯片互联的系统。」 AI 算力,现在是中美都最关注的 AI 底层竞争力。约 1 个月前,华为推出由 384 块昇腾 910 互联而成的/超节点 AI 集群,CloudMatrix 384。 图注:这是超节点发布会上展示的 CloudMatrix 服务器机柜组,如播客中介绍的,一共是 12 台机柜(每台机柜里又有 4 个服务器),中间有光纤、交换机等部件连接。 华为超节点发布后不久,我邀请有 20 多年芯片从业经验的徐凌杰来一起聊一聊这项算力底层的新变化。 自 2000 年代中期,徐凌杰先后在英伟达、AMD 和三星,参与设计 GPU 架构。后来加入阿里云,领导GPU 云计算基础设施的搭建;2019 年与张文等人联合创立国产 GPU 公司壁仞科技;2024 年开始新创业,成立魔形智能,专注 AI 算力集群产品设计和优化。 超节点本身就是一种从拼单芯片性能,到优化整个节点和机架的算力思路变化,徐凌杰的从业经验正好匹配了这一趋势。 本期节目的第一部分,我们聊了华为 CloudMatrix 384 是什么,它和英伟达 2024 年开始重磅推出的集群方案 NVL72 的异同。不止英伟达、华为,把节点做得越来越大,从集群芯片数量要性能,以网络能力弥补计算和存储的瓶颈,已成为算力市场的共识性趋势。 在第二部分,我们则主要讨论了超节点趋势,对英伟达、对其它国产芯片,对整个 AI 算力市场的可能影响,和一个“经典问题”:下一个改变算力格局的变量可能是什么? 节目录制后不久,华为超节点开始出货。据《金融时报》报道,一套完整的 CloudMatrix 384 售价约 800 万美元,是售价约 300 万美元的 NVL72 的 2 倍多。但要注意,这并不是华为的官方价格信息。 5 月 7 日,华为盘古大模型团队又在预印本平台 Arxiv 发表了一篇论文,称在 6000 多块昇腾芯片组成的超大集群上,实现了 7180 亿(718B)参数 MoE 模型的长期稳定训练。 本期嘉宾: 徐凌杰,魔形智能CEO,邮箱:[email protected] 时间线跳转: - 华为 Cloud 384 集群 & 把节点做大的趋势 03:15 CloudMatrix 384 是什么?Scale up vs Scale out 08:33 算力底层构成,不止 GPU,还有互联、网络、冷却等综合系统 11:09 NVLink、NVSwitch 是英伟达的另一重壁垒,69 亿美元收购 Mellanox 前后开始布局 18:22 广义与狭义的 AI Infra 20:38 第三方系统优化公司的机会?——同时掌握计算、网络能力的芯片原厂是少数 22:51 “超节点”好坏,看什么指标? 29:08 黄仁勋想推“训推一体”,实际上业界在怎么用 GPU? 33:17 模型越大,显存压力越大——显存正成为芯片主要成本 36:02 华为超节点功耗高,但中国电费成本相对小,以总量换性能 38:11 华为的多卡互联来自什么积累 ——华为在成为 Nvidia 之前已是一个 Mellanox 42:57 NV Switch 为何难?去年 AMD 49 亿美元收购 ZT 补能力 - 超节点趋势,对英伟达和 AI 算力市场的影响 45:43 华为超节点,短期不冲击英伟达,压力给到其它 AI 国产芯片商 47:51 英伟达 H20 已计提 55 亿美元损失,但可能通过技术手段提升部分性能 51:19 华为在阿里 Qwen3 发布当天宣布支持 55:12 英伟达上游有全球供应链支持,下游有客户生态,危险之一是客户集中 01:00:44 为什么 Google TPU 没有动摇英伟达的地位? 01:04:23 可能是 Nvidia 的“防守措施”:已成立“半定制”部门 01:06:17 为什么离开英伟达,十年前的老黄是什么样? 01:12:01 2024 年选择创业:看到芯片周边集群优化能做出差异化,也是长坡厚雪 01:18:44 新硬件架构的苗头?——存算一体、类脑计算(脉冲神经网络) 相关链接 一文洞悉超节点:解密AI时代的算力基 Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs(盘古超级混合专家模型:如何在昇腾 NPU 上训练超大规模混合模型 晚点聊 103:用 Attention 串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 晚点聊 49:3nm 是谎言?光刻工厂真能造芯片?与汪波聊芯片行业那些流传的误解 晚点聊 32:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 附录: GPU、GPGPU、ASIC、NPU:都是可以做 AI 模型训练和推理的 AI 芯片。GPU 是图形处理器,GPGPU 是针对通用计算(而非图形任务)优化的 GPU,AISC 是专用集成电路,它的性价比理论上比GPU 更好,但不如 GPU 通用;NPU(Neural Processing Unit)也是一种 ASIC。 DPU(Data Processing Unit)::数据处理单元,用于优化网络通信、安全和存储操作,减轻 CPU和 GPU 的负担,提升AI 算力中心整体性能。 GPU 的精度:如节目中提到的 FP8((8位浮点数)、INT8((8位浮点数) 都是 GPU 精度的一种,是不同的数据格式标准。DeepSeek-V3 和 R1 就是在预训练阶段使用了以 FP8 为主的混合低精度训练方法。 总线(Bus):计算机内部用于传输数据、地址和控制信号的通信系统,连接 CPU、内存和外设等组件,确保信息在各部分之间高效传递。 高速互联协议:用于在计算系统内部或系统之间实现高速、低延迟的数据通信的协议,如英伟达的NVLink、InfiniBand(由 IBTA 协会开发)和 PCIe (由 Intel、Dell、HP、IBM 等公司成立的联盟 PCI-SIG 开发),支持大规模并行计算和数据中心的高效运行。 Mellanox:一家提供高性能互联解决方案的以色列公司,英伟达在 2019 年以 69 亿美元收购了 Mellanox。 ZT Systems:2024 年,AMD 则以 49 亿美元收购了 ZT Systems,为云计算厂商设计、制造和部署复杂的计算、存储和加速器解决方案。 NVSwitch:英伟达推出的高带宽交换芯片,支持多 GPU 间的全互联通信,可提升系统整体性能和可扩展性。 NVLink:英伟达开发的高速互联技术,提供高带宽、低延迟的 GPU 与 GPU、GPU 与 CPU 之间的通信,支持大规模并行计算和深度学习任务。 Dynamo:英伟达推出的开源推理软件平台,支持多种 AI 框架和硬件架构。在谈到英伟达收购 Lepton.ai 的背景时提及。 英伟达的费米(Fermi)架构:英伟达 2010 前后开发、推出的 GPU 架构,开发过程很不顺利,经历两次流片失败。 神经脉冲(Neuromorphic Computing):模拟人脑神经网络结构和功能的计算方法,用脉冲神经网络处理信息,特点是高效能、低功耗。(人脑的功耗就比较低,只有 20 W 左右) 存算一体(Compute-in-Memory):将计算功能集成到存储器中的计算架构,减少数据在存储器和处理器之间的传输,提高计算效率和能效,适用于大规模数据处理和人工智能应用。 剪辑制作:甜食、Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
-
114
114: 秘塔闵可锐2:“我不是演员”
「你得相信,最坏的事情会发生。」 今天我们一次发了两期节目,嘉宾都是秘塔创始人,闵可锐。 113 期,是我和可锐在 2023 年年初的一次访谈,那次大模型热潮初期的漫谈中,有不少此后被印证的预言。本期,是 2025 年 4 月底,秘塔发布新产品“今天学点啥”之后,我和晚点科技组作者与桐,一起对闵可锐的访谈。 我们从“今天学点啥”这个新产品切入,聊了秘塔探索新产品的方法、思路和执行,以及闵可锐对 AI 应用发展的思考。 秘塔持续推出了一些有口碑和用户的 AI 产品,包括秘塔写作猫、秘塔搜索等。与之形成反差的是,在 2023 年的大模型热潮后,秘塔并没有加速扩张和融资,仅在 2024 年新融了 1 亿多人民币。整个公司的估值也是低得保守。 可锐是一个直言、坦诚,甚至有些“我行我素”的创始人。我问他为什么不融更多钱?他说,他当不了一个演员,他也不知道,为什么一些在他看起来拙劣的故事,不少投资人会 buy in,这超出了他的“能力范围”。 他说最初看到 DeepSeek 的人才组织方式,就觉得这样非常对。我问他为什么秘塔不是这么组织的,他说,因为“我们没钱”。 一方面,可锐的一些观点似乎有些悲观,他会说:“我们摸着石头过河,大厂摸着我们过河”;任何有潜力主要依靠大模型能力达到 1000 万 DAU 的软件应用,大模型厂商和大公司一定会自己做。另一方面,他依然在持续经营秘塔这家已经成立 7 年的小 AI 公司,拒绝了去年的一些收购机会。 这是一期小 AI 公司创始人的生存之道,也是一个“没有偶像包袱”的 AI 从业者的一手观察。 本期嘉宾: 闵可锐,秘塔科技创始人,@「AI秘塔」公众号 ID:METASOTA2018 时间线跳转: - 今天学点啥 03:05 今天学点啥:黑神话冯骥自来水,闵可锐自己打 70 分;马上会推出新优化 09:09 其实秘塔 80% 的产品决策是“我拍脑袋”的 11:18 to C、to B AI 产品秘塔都做过,不同的决策方式 18:14 “为什么没做 Agent 方向产品”——为什么做大家都在做的事? 20:32 Manus 的很多效果得益于 Claude;25 年的模型来做通用 Agent,成功率仍是问题 25:58 秘塔为何没沿着法律场景、做垂直 Agent? 27:56 收入是产品决策的重要指标;过去 7 年多少名噪一时的 AI 公司,要么死了,要么大幅收缩 29:45 我融不了很多钱;我讲真话大家也不信,也做不了演员 - 再聊两年前的「预言」 34:44 模型做不到全球 top 的 foundation model 创业公司挑战重重 36:14 做基础模型就应该是 DeepSeek 的人才组织方式 37:27 AI 战场都是聪明人,不要奢望兼顾 8 个产品、同时开几条模型线,还能在某个方向碾压别人 38:11 AI 一定要算 ROI 吗?AGI 也可以是消费 41:46 Llama4 再次证明,“一流资源、二流团队”打不过“二流资源、一流团队”;字节人才密度很高,关键是怎么发挥价值 42:55 梁文锋最懂什么? - 模型和应用的边界 44:56 to B、to C 应用,基础模型,我都可以做,不过没人相信 49:48 法律翻译、秘塔搜索,都不适合出海,但“今天学点啥”之后会出海 52:48 我们的对手会是 1 万亿的公司,你得相信,最坏的事情会发生 54:30 因为保守错失了哪些机会? 57:36 去年为什么拒绝被收购? 01:01:21 谨慎与抛弃沉末成本,闵可锐的双面性 01:03:28 Jasper 没死,但大家都要“踩一脚” 01:05:06 所有主要依靠大模型有潜力到 1000 万 DAU 的软件应用,大(模型)公司都会自己做 -模型技术讨论 01:10:19 大模型和小模型结合,只是个很简单描述;整体思路是:1.服务自己的用户 2.及时跟进下一代模型解锁的能力 01:16:46 o 和 R 真的在推理吗?智能的形式比本质更可验证 01:23:58 用强化学习做推理模型之后,很多人低估了好的预训练的重要性 01:25:42 Grok3 和 Llama4 是两件事,Grok3 成功证明了一个后出发的团队,能快速追赶一线能力 01:29:55 Scaling Laws 不是线性外推,很可能到了新卡点,又会有新突破 01:32:59 过去曾有哪些技术误判,导致错失机会? -过去两年,我各方面都更会了 01:37:26 我们摸着石头过河,大厂摸着我们过河,创业公司得更快找到下一个石头 01:38:43 一个足够灵敏的组织,理想 vs 现实 01:41:03 目前秘塔的团队分工、协作 01:45:52 为什么没找产品合伙人? 01:49:33 热潮前后,秘塔团队节奏的变化 01:55:25 23 年至今的变化:自己“更会了”,接下来希望能和整个组织一起成长 相关链接: 晚点聊108:与马毅聊智能史:DNA是最早的大模型,智能的本质是减熵 晚点聊110:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊107:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:甜食 *本期主播: *小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q **即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
ABOUT THIS SHOW
《晚点聊 LateTalk》由《晚点 LatePost》出品。最一手的科技访谈,最真实的从业者思考。
HOSTED BY
晚点 LatePost
CATEGORIES
Loading similar podcasts...