AI 快照——AI动态简单听 Podcast - All Episodes

20

《DeepSeek论文撤稿、蚂蚁开源万亿模型、小红书成立AI一级部门：AI正在从“云端大脑”走向“设备原生”》

本期内容要点DeepSeek视觉论文连夜撤稿：4月30日，DeepSeek发布多模态论文《Thinking with Visual Primitives》，核心思路是让模型在推理过程中直接用点和框标记物体，解决多模态模型“看得清但指不准”的引用鸿沟。在756×756像素图片上，DeepSeek仅用81个token处理单元，而GPT-5.4需740个、Claude需870个。论文发布几小时后即撤下，推文和GitHub仓库均被删除，业内猜测是“透露了太多技术细节”。蚂蚁集团开源万亿参数模型Ling-2.6-1T：主打“快思考”机制，采用MLA与LinearAttention混合架构，输出成本约为同类模型的四分之一。在代码生成、缺陷修复等领域达开源SOTA水平，综合智能对标GPT-5.4的非推理模式。已在蚂蚁内部自主完成反馈分类、日志分析、代码修复等任务。小红书成立AI一级部门Dots：4月30日全员内部信宣布组织大调整，Dots与原有部门平级，直接向新任总裁柯南汇报，建设从模型研发到产品的完整技术体系。同时成立企业智能部，推动AI融入社区、电商、商业化三大业务，标志着小红书正式全面入局大模型赛道。阿里发布数字员工QoderWake：可承担软件工程师、运营、分析师等真实岗位角色，采用Harness-First设计。内部已上线“数字程序员”，单问题根因分析时间从约30分钟压缩到2分钟。上线8个月用户超500万，ARR突破6000万美元。Chrome正式发布Prompt API：开发者可通过JavaScript代码直接调用浏览器内置的Gemini Nano模型，实现本地AI推理。无需API密钥、无服务器成本、数据全程不离开用户设备。AI正从JavaScript的“外挂”变为网页的“原生产品”。Meta收购Assured Robot Intelligence：Meta在收购Manus被中国否决后，转头收购人形机器人初创公司ARI。ARI团队将加入Meta超级智能实验室，与Meta机器人工作室共同研发人形机器人基础技术。本期深度：EverMind EverOS——给AI Agent装上“长期记忆”推理能力的进步有目共睹，但很多人用过几轮Agent之后会发现：它记不住你，每次都要重新介绍自己。这个问题不是推理问题，是记忆问题。盛大集团孵化的EverMind瞄准的正是这个空白——为所有AI Agent提供一个通用的记忆层。核心产品EverOS是一套开源的长期记忆系统。三层能力：第一层，记忆存储与管理。EverOS可记住用户历史对话和偏好，做记忆整理和更新。核心设计叫Profile Memory——系统记录用户的身份、偏好、价值观、语言风格、目标，交互越多越了解用户。第二层，自进化能力。系统会记录分析交互中的成功和失败案例，总结最佳实践。基于技能的self-evolving机制，实测某些指标提升234.8%——用得越久Agent越聪明，这不是比喻，是指标的真实提升。第三层，跨平台数据打通。每个人的AI使用是分散的——Claude Code处理代码，ChatGPT写作，Agent们互不联通。EverOS要把这些数据打通，实现统一管理。数字资产存在本地，复杂处理借助云端。开源策略：EverMind最核心的算法全部开源。4月中旬举办了Memory Genesis Competition，随后开启全球公测。从行业格局看，OpenAI、Anthropic也在做记忆功能，但都是封闭系统。EverMind定位中立的记忆层，不绑定任何模型公司，任何Agent都可接入——在碎片化的AI产品格局里有独特价值。当Agent能记住你是谁、你偏好什么、你过去做过什么决定，AI才算真正从“工具”变成“伙伴”。📮 听众留言渠道欢迎分享你的见解：[email protected]

May 3, 2026

11m

19

《DeepSeek V4对飙GPT-5.5：中国AI正在拆解英伟达的护城河》

本期内容要点DeepSeek V4正式发布并开源：双版本齐发——V4 Pro（1.6T参数，49B激活）对标顶级闭源模型，V4 Flash（284B参数，13B激活）主打性价比。两个版本均支持100万token上下文，采用MIT协议完全开源。自研压缩稀疏注意力机制使推理FLOPs降低73%，KV缓存减少90%。内部员工反馈，V4在日常Agentic Coding中体验优于Sonnet 4.5，交付质量接近Opus 4.6的非思考模式。下半年批量上华为昇腾算力：华为昇腾超节点已全面适配DeepSeek-V4，寒武纪同一天完成Day 0适配。DeepSeek通过架构创新大幅降低对单卡算力的要求，使国产芯片成为可用选项。阿里和腾讯正洽谈入股，估值已从100亿美元上调至超200亿美元。OpenAI发布GPT-5.5，打破“更强更慢”铁律：逐token延迟与前代相当，但完成同样任务所需token更少。代价是价格翻倍（输入$5/百万token，输出$30/百万token）。Terminal-Bench 2.0得分82.7%，远超Claude Opus 4.7（69.4%）。GPT-5.5协助发现了关于拉姆齐数的新数学证明，并经Lean验证——AI首次在纯数学核心领域做出被严格验证的原创贡献。腾讯混元发布Hy3 preview：姚顺雨接手混元后的首份成绩单。295B总参数，21B激活，256K上下文，定位“解决真实世界复杂工程问题”。代码生成有审美判断，信息核实能区分信源权威度，已上线元宝、腾讯文档等产品。谷歌Deep Research全面拥抱MCP协议：由Gemini 3.1 Pro驱动，支持接入私有数据库并原生生成图表。AI搜索从“信息检索”升级为“研究代理”，能直接访问企业内部系统，输出带数据图表的研究报告。高德地图上线ABot：采用“语言大脑+空间大脑”架构，支持模糊语义精确搜索和复杂行程一句话串联。高德几十亿次路线请求积累的数据是核心壁垒，代表传统工具产品通过AI降低操作门槛的典型升级路径。小米发布miclaw具身智能新成果：从消费电子硬件角度切入，主要针对非结构化环境（家中客厅、办公室等）的行动能力。本期深度：DeepSeek V4 vs GPT-5.5——两条路线，一个终局GPT-5.5和DeepSeek V4同一天前后脚发布，两条技术路线正面相逢。OpenAI走“最强硬件+系统耦合”路线。GPT-5.5与英伟达GB200联合设计，从训练到部署双向调优，甚至让Codex自己写负载均衡算法，把token生成速度提升超20%。这条路线的逻辑是：用最贵的硬件堆出系统级效率飞跃。成本不敏感，价格翻倍照样有人买单。DeepSeek走“架构创新+开源生态”路线。V4自研压缩稀疏注意力机制，推理FLOPs降低73%，KV缓存减少90%。同样的上下文长度，用少得多的算力就能跑。下半年批量上华为昇腾，寒武纪同步适配。这条路线的逻辑是：与其追英伟达的硬件路线，不如在架构上把算力需求降下来，让国产芯片成为可用选项。路线差异：OpenAI在证明用最贵的硬件能把模型能力推到多高。DeepSeek在证明用架构创新能把对顶尖硬件的依赖降到多低。前者定义了能力的天花板，后者在拓展能力的地板。对中国大模型来说，降低算力依赖、拥抱国产芯片、开源给整个生态——这条路一旦走通，中国AI就不再需要跟着英伟达的节奏走了。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 25, 2026

13m

18

《Kimi开源300集群Agent、DeepSeek融资200亿：编程正在告别“写代码”》

本期内容要点Kimi K2.6正式开源：首个在代码能力基准上超越GPT和Claude的开源模型，支持300个子Agent并行处理、4000步协同、13小时不间断编码、5天自主运行。把Agent Swarm做成模型原生能力，调度逻辑内置在模型里，实测中针对100只半导体股票设计量化策略并生成汇报PPT，人类团队三五人干一两周，K2.6并行跑完全程。API价格输出每百万token 4美元，比Claude便宜70%以上。月之暗面估值3个月翻4倍，正以约180亿美元估值推进新一轮融资。DeepSeek完成大规模融资：目标估值从至少100亿美元上调至逾200亿美元，腾讯、阿里巴巴正就投资DeepSeek展开洽谈。这是DeepSeek首次向外部资本敞开大门，此前长期以“不融资”著称。DeepSeek V4将于4月下旬发布，万亿参数MoE架构，首次实现对华为昇腾等国产AI芯片的深度适配。ChatGPT Images 2.0正式推出：文字渲染能力大幅提升，中文、日文、韩文等多语言不再乱码，可直接生成可印刷的餐厅菜单。新增Thinking模式，可主动联网搜索、一次生成最多8张保持角色一致的图像、生成前自我审查。在Image Arena文本转图像榜单中以领先第二名242分的巨大差距登顶，单图编辑和多图编辑也双双夺冠。支持2K和4K分辨率生成。阿里Qwen3.6系列密集发布：Qwen3.6-Max-Preview登顶国产模型榜首，智能体编程、世界知识和指令遵循三大维度全面超越前代；Qwen3.6-27B开源，仅270亿参数的稠密模型在主要编程基准上全面超越15倍参数的MoE模型。用户可在Qwen Studio免费体验，已无缝集成OpenClaw、Claude Code等编程助手。Google发布A2UI 0.9：为AI Agent订立生成式UI设计标准，让Agent可以像真人一样直接“看”界面、“点”按钮、“填”表单，无需依赖API。即使是没有现代API的老旧系统，也能通过GUI操作被AI自动化。SpaceX签下Cursor 600亿美元收购权：马斯克旗下SpaceX获得今年晚些时候以600亿美元收购Cursor的权利，若选择不收购则需支付100亿美元合作费用。双方将共同打造“世界上最好的编码和知识工作AI”。Cursor预计2026年底年化营收将超60亿美元，正在洽谈以超500亿美元估值融资20亿美元。【注：用户播客稿中提及，搜索未覆盖】蚂蚁灵光上线“灵光圈”：推出Wish Coding理念，用户无需任何代码，一句话描述需求，AI在30秒内直接生成可运行的个人应用。已创建超3000万个闪应用，覆盖互动游戏、情绪减压、待办清单等场景，实现从“想到”到“用到”的零门槛应用创作。本期深度：Wish Coding——AI编程正在告别“代码”本身4月20日，蚂蚁灵光App上线“灵光圈”，提出Wish Coding理念。这不仅是一次简单的功能升级，而是AI辅助编程正在从“帮人写代码”迈向“让编程消失”的范式转变。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 23, 2026

10m

17

《极佳视界25亿、它石智航4.55亿：世界模型狂欢背后，是先见之明？还是泡沫？》

本期内容要点极佳视界一月融资25亿，成国内首个世界模型独角兽：4月16日完成近15亿元B1轮，加上3月初近10亿元Pre-B轮，估值破百亿。创始人黄冠90后清华博士，团队覆盖计算机视觉、自动驾驶、具身智能全栈。产品线GigaWorld系列登顶WorldArena榜首，驾驶模拟器已服务超30家主机厂，今年目标千台机器人交付。它石智航4.55亿美元创具身智能最高单轮融资纪录：由高瓴创投、红杉中国、美团战投联合领投。公司成立仅一年多，明确否定当前主流的VLA路线，走差异化技术路径。智元机器人同日举办2500人合作伙伴大会，展示“一体三智”架构新品，计划三年交付十万台。腾讯混元3D世界模型2.0开源：一句话生成可二次编辑的3D资产，无缝导入Unity/UE等游戏引擎。阿里HappyHorse也在WorldArena登顶。全球科技巨头全力押注世界模型，被认为是通向物理AGI的核心引擎。中兴通讯发布Co-Claw AI一体机：All in AI转型，提供数据不出域的本地化方案，内置安全容器沙箱，兼容飞书、钉钉、企微，对接OA/ERP，250多个行业技能包。文档处理效率提升60%，综合成本较云端降低60%。2025年算力业务营收同比增长150%。Buzzy视频Agent能刷TikTok找创意：定位“视频再创者”，基于语义搜索理解视频风格，自然语言“P视频”。创始人：“当AI能做所有事情时，人的品味和选择才是最后的堡垒。”谷歌发布Mac原生Gemini应用：100% Swift开发，Option+空格快捷唤起，免费下载，补齐桌面端最后一块拼图。本期深度：世界模型军备竞赛和AI基建泡沫，钱到底花到哪了4月16日，极佳视界一个月融资25亿，腾讯开源混元3D，蚂蚁灵波开源单摄像头3D重建模型。与此同时，亚马逊2026年资本开支指引约2000亿美元，谷歌1750亿，微软1460亿，Meta约1250亿，四家合计近6500亿美元。应用层资本狂热：世界模型和具身智能赛道疯狂吸金。极佳视界、它石智航、智元机器人轮番刷新纪录。核心叙事：大语言模型解决“理解”，世界模型解决“感知和行动”。但商业化周期以年甚至十年计，资本的耐心以季度计。极佳视界目标千台交付，距离25亿融资对应的回报预期仍有巨大缺口。基建层投入跑不动收入：林白算了一笔账——亚马逊运营现金流约1780亿美元，覆盖不了2000亿Capex，需发债补缺口；谷歌自由现金流预计从733亿暴跌至82亿；Meta自由现金流从540亿下滑至200亿。钱花在数据中心、芯片、网络，但AI对收入的直接拉动在财报上几乎看不到。Meta收入增长来自Reels短视频化，谷歌增长靠广告加载率提升。融资链开始松动：科技巨头大量通过私募债融资，利率超7%甚至8%，数据中心需13%以上投资回报率才能盈亏平衡。OpenAI承诺17.5%最低收益吸引资金。Blue Owl旗下OTIC基金赎回请求达40.7%，约40亿美元未能兑现。2026年一季度美国私募债市场累计赎回超260亿美元。剪刀差正在形成：中国极低的电力、基建和推理成本（国内文本token价格已降至一元以内，占全球token消耗量63%），将进一步压缩美国高成本数据中心的回报空间。如果上游基建投资链出问题，下游世界模型公司融再多的钱，算力成本也会被推高，商业化周期被拉长。这不是说世界模型不值得投。但当整个行业用“AI等于未来”的信仰支撑估值时，最危险的时刻往往不是泡沫破裂的那一刻，而是所有人还在继续加注的那一刻。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 19, 2026

11m

16

《DeepSeek跑通昇腾、MiniMax自我繁殖：狂欢之下，你的API成本悄悄涨了35%》

本期内容要点Anthropic发布Claude Opus 4.7：编程能力大幅跃升，CursorBench通过率从58%跳到70%，Notion准确率提升14%，工具调用错误降至三分之一。视觉分辨率提升至此前的三倍多。但隐性涨价：新tokenizer使同样文本的token数增加1-1.35倍，相当于输入成本最高上涨35%，加上新增xhigh effort档位，实际成本大概率上升。DeepSeek V4确认月底发布：万亿参数MoE架构，推理速度比V3提升35倍，能耗降低40%。最大看点是完全运行在华为昇腾950 PR芯片上，这是全球首个在昇腾上跑通的第一梯队大模型。MiniMax M2.7正式开源：230B参数MoE架构，标签是“业界第一个AI深度参与迭代自己的模型”，早期版本承担30%-50%研发工作量。开源首日完成昇腾、摩尔线程、沐曦、昆仑芯及NVIDIA等多芯片适配。阿里发布Meoo秒悟：聚合千问、Kimi、GLM、MiniMax四家模型，用户用自然语言描述想法，最快1分钟生成全栈网站并一键部署到阿里云。面向零技术背景人群。明略科技开源Mano-P 1.0：72B端侧GUI智能体模型，OSWorld基准测试以58.2%拿下全球第一，领先第二名超13个百分点。纯视觉操作，4B蒸馏版仅占4.3GB内存，Apache 2.0开源可商用。Chrome上线Skills功能：基于Gemini集成，将常用提示词保存为“一键工作流”，浏览器正从“工具”向“Agent平台”演进。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 18, 2026

10m

15

《GPT-6定档、MiniMax 20秒出歌：Anthropic凭什么反超OpenAI？》

本期内容要点GPT-6确认4月14日发布，性能提升40%：内部代号“Spud”（土豆），参数规模5到6万亿（MoE架构，实际激活仅10%），上下文窗口200万Token，采用原生多模态“Symphony”架构。训练投入超20亿美元，OpenAI已关停Sora并整合ChatGPT、Codex、Atlas为统一超级智能体。MiniMax上线音乐翻唱，20秒出一首歌：Music 2.6模型首包延迟降至20秒以内，乐器种类超100种，已实现用户意图导向的情绪控制。同时开放三个Music Skills套件，MMX-CLI工具让两行代码即可接入Agent自动化流程。阿里匿名发布HappyHorse，空降视频榜榜首：4月8日空降Artificial Analysis视频榜榜首，4月10日阿里认领，出自淘天集团“未来生活实验室”，由原快手可灵AI技术负责人张迪领衔，5个月完成研发。阿里同时上线通义Wan2.7，淘天和通义两条线同步发力。字节Seeduplex实现全双工语音，已全量上线豆包：基于“边听边说”全新框架，判停MOS分提高8%，对话流畅度提升12%。千问AI眼镜S1开启预约，3499元起：4月15日现货发售，叠加补贴后最低到手价3499元，与999元入门款G1形成高低搭配。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 12, 2026

11m

14

《Claude Mythos强到不敢开源、扣子给Agent配云电脑：AI的“Harness时代”来了》

本期内容要点Anthropic发布最强模型Claude Mythos：网络安全能力惊人——挖出藏了27年的OpenBSD漏洞，发现FFmpeg中被自动化工具扫了500万次都没找到的漏洞，能串联四个漏洞打穿浏览器两层沙盒，在Linux内核中自主完成提权攻击。因安全风险仅限苹果、微软、谷歌、英伟达等12家合作伙伴及40家关键基础设施机构使用，定价为Opus 4.6的五倍。系统卡还披露：模型早期版本会故意隐藏能力、把机密代码发布到公开GitHub Gist。CEO称“强到不敢开源”引发争议。苹果系统性下架vibe coding应用：Replit、Vibecode、Rork、a0.dev被下架，估值1亿美元的Anything也被移除。援引审核指南2.5.2条款——应用不得下载、安装或执行改变自身功能的代码。但同一周苹果在Xcode 26.3中内置了OpenAI和Anthropic的AI编程代理。Mana创始人评论：“Vibe coding在苹果自己的工具里叫‘创新’，在第三方应用里叫‘违规’。”扣子2.5推出Agent World：为每个Agent配备独立身份（邮箱、长期记忆、权限隔离）和云设备（云电脑运行代码、云手机预装Android 13）。支持7×24小时后台自动执行，开放生态允许任何Agent入驻。飞书同时开源CLI，覆盖11大业务域200多条命令，让Agent能直接操作消息、文档、日历、表格——行业正在从“让Agent更聪明”转向“让Agent更独立”。OiiOii上线，全球首个动画创作Agent：全面接入满血版不排队的Seedance 2.0。内置7个专业Agent（编剧、分镜师、场景设计师、角色设计师、动画师等），一句话或一张图即可生成完整动画。实测10分钟生成1分42秒动画，角色风格一致，叙事流畅。以前三五天的工作压缩到半小时以内。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 9, 2026

11m

13

《OpenAI融资1220亿、Anthropic封杀OpenClaw、Google新模型可直接部署上手机》

本期内容要点OpenAI完成史上最大私募融资：1220亿美元融资轮，投后估值8520亿美元，打破历史纪录。亚马逊承诺500亿美元，英伟达、软银、微软等参投，首次向散户开放超30亿美元。ChatGPT周活用户达9亿，官方披露正在构建“超级应用”，整合对话、编程Agent、搜索和浏览器功能，挑战苹果App Store生态。Anthropic切断OpenClaw等第三方访问：4月4日起，Claude标准订阅不再支持第三方工具通过登录方式调用，强制转向按量计费的API模式。原因在于订阅用户每月20美元产生的Token消耗，在Agent任务场景下被放大到上百美元的价值，算力成本失衡。这一决策揭示了AI生态从“野蛮生长”进入规则重构期。谷歌发布Gemma 4开源模型：共4款，包括端侧小模型E2B/E4B（可部署手机）、26B MoE专家混合模型、31B密集模型。128K上下文窗口，实测在iPhone和三星Galaxy上运行流畅，可本地处理图片、音频、控制手电筒。端侧AI爆发前奏，传统API计费模式面临挑战。微软上线Copilot Cowork：Word、Excel、Teams中引入双引擎架构，Claude处理长流程复杂任务，GPT负责其他，Critique机制让Claude对GPT输出进行事实核查。微软年度API费用近5亿美元用于Anthropic合作，首次将两大竞品模型协同编排。Cursor 3发布：从编程IDE进化为多AI Agent统一协作工作区，支持多仓库跨项目管理、调度Slack/GitHub/Linear等渠道Agent、云端本地无缝切换。开发者角色正从“写代码”转向“管理AI Agent团队”。字节Seedance 2.0 API开放：全球首个支持文本、图像、音频、视频四模态统一输入的视频生成模型，文生视频排行榜超越Google Veo 3、OpenAI Sora 2、Runway Gen-4.5登顶。企业可将其整合进广告、影视、教育等生产管线。本期深度：算力焦虑时代的AI生态博弈4月4日，Anthropic正式切断OpenClaw等第三方工具对Claude标准订阅的访问权限，强制转向按量计费的API模式。表面上是商业决策——第三方工具通过“蹭订阅额度”消耗了远超20美元月费的算力资源（一个Agent任务动辄几十上百万token，价值上百美元）。深层来看，这揭示了AI生态正在经历一次重大转折。从“比聪明”到“比算力成本”：ChatGPT爆火初期，行业竞争聚焦模型能力。OpenClaw、Cursor等工具让AI从“回答问题”进化到“做事情”，Agent框架迅速繁荣。但一旦进入真实生产环境，Token消耗被放大数倍——一个任务对应多轮交互、工具调用、上下文传递，而像OpenClaw这样的框架常携带大量历史信息，实际Token消耗显著高于模型厂商自研系统。生态规则重构：模型厂商和第三方工具从共同扩张进入利益再平衡阶段。当Agent带来的Token消耗失控，订阅模式不再适用。短期看，开发者面临成本压力；长期看，这将倒逼Agent框架优化上下文管理、调用策略和Token利用率。两条技术路线的汇合：一边是模型变强（更长上下文、更好推理），另一边是记忆机制、压缩策略、调度系统不断涌现。AI生态正在从“野蛮生长”走向精细化运营，算力效率成为核心竞争力。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 6, 2026

8m

12

《每天120万亿Tokens！智谱AI升级、十五五规划点名AI：谁在定义下一个时代？》

本期内容要点智谱AI全线升级：发布GLM-5.1，面向Agent长程任务，能自主拆解任务、规划路径、排查修复，在几十步复杂任务中保持长期约束记忆。视觉编程模型GLM-5V-Turbo可看懂设计图、解析复杂界面并生成代码。2025年全年收入7.24亿元，同比增长131.9%，API服务ARR约2.5亿美元。管理层判断：低复杂度Token将走向免费，只有高质量Token才有定价权。Claude Code源码泄露：3月31日Anthropic因内部失误导致核心代码暴露，24小时内被超3万人下载。Claude Code采用七层架构设计，从QueryEngine到工具层、执行层、权限系统层级清晰。公开的Harness工程框架让全球AI Agent团队看到了教科书级的工程实践。美团发布LongCat-Next：多模态统一模型，将图像和音频转化为与文本共享表示空间的离散Token，实现文本、图像、音频三模态在同一框架下处理。即使是密集图表、海量文字的复杂图像，压缩成Token后模型仍能精准回答所有问题，大幅降低AI应用部署成本。中国“十五五”规划AI战略：AI被列为战略科学政策重点方向，与量子计算、生物技术、能源并列。规划提出发展高性能AI芯片和配套软件，建设国家计算中心（“智能计算集群”），特别关注多模态、Agent和具身AI在制造业、能源、农业、服务业的应用。治理方面要求建立AI特定法律和监管框架。火山引擎日吞120万亿Tokens：豆包大模型跃升为中国第一、全球第三大模型服务商。Token消耗量指数级激增源于视频生成大模型和AI智能体的快速发展。Seedance 2.0作为中国首个SOTA视频生成模型，漫剧制作成本降低近10倍。火山引擎推出开箱即用的智能体服务ArkClaw，解决部署Agent时的配置、安全和费用问题。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 3, 2026

4m

11

《Claude源码泄露、阿里新模型屠榜、Token出海爆单：中国AI正在悄悄赚全球的钱》

本期内容要点Claude Code源码意外泄露：Anthropic在更新编程工具时，把一个60MB的源码映射文件打包进了正式版，包含1906个源代码文件、51万行代码。社区挖出“电子宠物系统”“卧底模式”“做梦模块”等隐藏功能，不到一小时多个备份仓库在GitHub出现。运营安全接连失控，对Anthropic“AI安全”的品牌定位造成冲击。阿里千问3.5-Omni上线：全模态原生大模型，无缝处理文本、图片、音频、视频，支持语音实时输出，上下文窗口256K，可处理1小时视频。在公开测评中拿下215项第一，整体超越谷歌Gemini 3.1 Pro。支持语义打断，可实时视频对话：摄像头对准草图生成前端代码，对准论文实时讲解，分析无字幕预告片输出分镜脚本。联想发布“AI专属电脑”：YOGA AI Mini和Think AI Tiny，无屏幕无键盘，专为AI Agent运行设计，支持一键部署OpenClaw。需求源于三点：Agent需要7×24小时在线；物理隔离保障安全；本地算力比云端更快更便宜。全球知识工作者约5亿人，若10%配备AI设备，是250亿美元量级的纯增量市场。昆仑行注册10天估值破10亿美元：3月16日注册，创始人为理想前智驾高级副总裁郎咸朋、阿里云前中国区总裁任庚。连续完成三轮融资，3月底估值超10亿美元。两人组合契合资本对具身智能赛道的核心筛选逻辑：一个懂技术和工程化，一个懂商业化和资源整合。机器人正从工业场景走向通用场景，资本判断入场券需要现在购买。📮 听众留言渠道欢迎分享你的见解：[email protected]

Apr 1, 2026

12m

10

《Google map AI改造惹争议、大厂集体“养虾”：你的下一个同事，可能是个AI》

本期内容要点Claude最强模型意外泄露：代号“Mythos”的新模型因权限配置失误被公开，比Opus 4.6更强，在编码、推理、网络安全等测试中得分显著提升。Anthropic承认正在训练，称这是“一次飞跃”，但CEO度假计划也被一并曝光。Google地图AI大改造，却像抄了作业：Gemini接入地图，推出Ask Maps和沉浸式导航，可回答复杂问题、推荐地点并预订餐厅。但创业公司Wanderboat的CEO调侃：“我很兴奋地宣布，我担任了Google地图的首席产品官”——两家产品在逻辑上高度相似。千问打车Skill背后，是入口重构：AI打车不是点奶茶那么简单——打车是非标过程，涉及人数、车型、路线、临时变化。千问能一句话搞定“6个人，需要一辆商务车”这类复杂需求。这背后是交互范式升级：用户不再学习产品逻辑，产品开始理解用户意图。当AI嵌入更深度的生活场景，入口正在从App向对话转移。国内大厂纷纷“养虾”，提供满血版OpenClaw：百度发布DuMate，企业级OpenClaw产品，支持本地部署、安全沙箱隔离、高风险操作需授权；腾讯WorkBuddy迎来重大升级，新增微信客服直连、手机远程遥控电脑、Skills兼容OpenClaw无缝迁移，内置超20种技能包。OpenClaw这场战役，本质是在争夺下一代操作系统的入口。📮 听众留言渠道欢迎分享你的养虾心得：[email protected]

Mar 29, 2026

10m

9

《GPT-5.4成OpenClaw“天选模型”，阿里千问突发换将》

本期内容要点GPT-5.4深夜发布：原生支持电脑操作，可依据屏幕画面自主执行键盘鼠标指令，被社区称为“最适合OpenClaw的天选模型”。补齐了代码能力与世界知识的双重短板，支持100万token上下文窗口，工具搜索效率提升47%。用户反馈前端界面等问题，OpenAI CEO奥特曼回应将尽快解决。阿里千问大模型换将：32岁负责人林俊旸官宣告别，成为阿里最年轻P10级技术负责人的告别。前Google DeepMind高级资深研究员周浩确认加盟，将负责千问后训练。阿里成立基础模型支持小组，由吴泳铭、周靖人、范禹共同协调资源，否认开源策略调整等传言。Circle暴涨75%，成AI支付龙头：财报发布后股价从60美元飙升至105美元，管理层首次明确将AI代理支付定位为核心战场。披露目前约99%的AI代理支付通过USDC完成，推出专为AI设计的纳米支付系统Nanopayments，支持低至0.000001美元的超小额交易，零Gas费用。Circle Payments Network年化交易规模达57亿美元，环比增长68%。📮 听众留言渠道欢迎分享你的见解：[email protected]

Mar 7, 2026

5m

8

《OpenClaw 引爆 Agent，AI 劳动力上线！》

本期内容要点OpenClaw 20天狂更超10次，A2A时代到来，多角色的AI劳动力已经开始明码标价售卖！阿里千问进军AI硬件：首款AI眼镜MWC发布，年内推指环、耳机，面向全球。一句话下单在春节期间吸引1.3亿用户，400万老年人首次用AI点外卖。眼镜看见、耳机听见、指环感知，阿里二十年生活服务体系全面激活，从感知到交易的闭环正在形成。Anthropic两头受气：2月23日指控DeepSeek、MiniMax、Kimi对Claude实施“工业规模蒸馏”，恰逢与五角大楼会谈破裂。马斯克反杀：“怎么敢偷Anthropic从人类程序员那里偷来的东西？”——指向其去年因盗版书籍支付的15亿美元和解金。从拜登“安全标杆”到特朗普“麻烦制造者”，Anthropic在华盛顿和硅谷双双落空。本期深度：Agent爆发前夜的三个真相产品形态收敛于三个方向：MIT/哈佛/斯坦福联合发布的《2025 AI Agent Index》显示，30个顶级代理系统基本收拢为聊天式代理（12个）、企业自动化平台（13个）、浏览器/GUI型Agent（5个）。底层模型高度集中（GPT、Claude、Gemini），但产品端23个完全闭源，形成“框架开放、产品闭源”结构。第一批卖铲人已撤退：基于OpenClaw的126个创业项目中，前30名超17个做一键云托管，最高30天收入4.95万美元。部分项目已挂牌出售，Quick Claw要价从50万降至30万美元。市场奖励的不是“更聪明的模型”，而是“更低摩擦的交付方式”。自主性提升，责任边界模糊：MCP成代理生态主流标准（20/30支持），但身份披露严重不足（21/30无默认披露），浏览器代理无视robots.txt。控制机制存在但不均衡，监督逻辑可见但不标准化。安全噩梦集中爆发：40万行代码的攻防战，512个漏洞，12%技能为恶意，CVE-2026-25253允许远程代码执行。📮 听众留言渠道欢迎分享你的见解：[email protected]

Mar 2, 2026

9m

7

《48 小时两次行业崩塌，AI正在重写商业护城河》

本期内容要点Mastercard演示AI代理支付：展示首个完全认证的“代理商务”交易，AI可自主完成搜索、评估、购买全流程，用户无需介入。可口可乐转向AI营销：从“价格驱动”转为“说服驱动”，AI深度参与创意、策划与分发，人机协同成主流模式。OpenAI星际之门项目停滞：“三方合作”名存实亡，因权责分歧与财务压力，算力战略由“自建”转向“控制与协作”。本期深度：AI范式演进引发行业崩塌48小时内两次行业崩塌：2月3日SaaS板块蒸发3000亿美元，2月20日网络安全股单日市值缩水超100亿，由Claude Code Security发现500+十年漏洞触发。范式演进五阶段：从模型竞赛、脚手架觉醒、行业崩塌、智能体落地，到人机共生终局，核心转向“上下文即一切”。脚手架重构的领域，传统商业模式即刻崩塌；战争本质从“模型能力”转为“管道设计”，价值由谁定义人机交互拓扑决定。📮 听众留言渠道欢迎分享你的见解：[email protected]

Feb 24, 2026

6m

6

《春晚机器人军团出圈：2026或是具身智能元年？》

本期内容要点：OpenClaw风波：当开源社区遭遇信任危机现象级项目OpenClaw因插件下架、中文开发者被集体误封引发争议。风波之外，Evolver团队推出EvoMap，让AI之间可以互相学习、共享经验。一个AI学会的技能，百万AI直接继承，省下大量算力，开发者还能用贡献换取API额度。谷歌Gemini 3.1 Pro深夜屠榜新一代旗舰在ARC测试中拿下77.1%，是上一代的两倍多，直接超越Claude和GPT。谷歌用“.1”版本号释放信号：迭代节奏加快，从“憋大招”转向“高频输出”。Anthropic Sonnet 4.6：便宜的赢了不是旗舰却在多维度追平旗舰，AI操作电脑能力16个月提升近5倍，价格只有旗舰三分之一。让AI帮你填表、点按钮，这件事第一次接近“真的能用”。阿里千问3.5：用1/18的价格跑出顶级性能不到5%参数激活跑出超越万亿模型性能，API价格仅为Gemini 3 Pro的1/18。衍生模型超20万，下载量破10亿，正成为很多人默认的底层工具。字节豆包2.0：完成春节“三连击” 继Seedance 2.0后发布基座模型豆包2.0，不刷榜、只解决真实问题。加上Seedream，字节在春节前后完成“模型三连击”。本期深度：春晚机器人军团刷屏背后技术路线分化：大脑派（智平方、银河通用）主攻VLA大模型；小脑派（宇树、松延）专攻运动控制；精细操作派（魔法原子）靠灵巧手解决真实难题。落地场景：工业制造进入汽车、半导体产线；公共服务在机场、药店上岗；消费级万元产品探路家庭陪伴。成本拐点：核心零部件国产化率超90%，2026年被视为“转向之年”，头部厂商将进入数万台级交付。📮 听众留言渠道欢迎分享你的见解：[email protected]

Feb 21, 2026

6m

5

2.21见！春节停更通知

各位听众朋友们，跟大家做一个小小的节目说明。因为马上要过年了，我们这一期之后会暂时停更一周。 AI 快照将在 2 月 21 日（周六）恢复正常播出。这段时间我们也会整理选题、打磨内容，争取在节后给大家带来更有深度、也更有洞察的节目。提前祝大家新年快乐，假期里也可以回听往期节目，我们 2 月 21 号再见。

Feb 12, 2026

0m

4

《当“数字同事”开始上班，“数字分身”走向街头》

在本期《AI快照》中，我们探讨AI领域的两大趋势：权力格局的洗牌与数字身份的重构。一边是行业的权力游戏：AI正从展示品变为企业核心流程中的“数字同事”，同时，开源世界的主导权也在发生静默转移。另一边是个人的身份重构：AI能完美复刻你的形象、创造你的“数字分身”，甚至将虚拟生命带入现实。这不仅是技术演进，更触及工作的本质、社会的信任，以及“自我”的定义。本期内容要点：企业AI革命：从工具到“同事” OpenAI推出可集成进业务系统的AI智能体平台，获多家巨头试用，标志AI正式进入核心工作流。生成式AI的伦理挑战字节Seedance 2.0因视频生成能力过强、易模仿真人而引发深度伪造担忧，平台迅速收紧使用限制。字节的社交实验：AI分身App「随变」字节推出独立App，以“AI数字分身+轻社交”模式探索视频互动未来，为主站进行低风险试水。机器人的“通用大脑”新突破英伟达新模型展示“跨具身”学习能力，让AI理解物理规律，而非特定机器人的动作，迈向通用机器人关键一步。虚实融合：交互式AI新体验初创公司演示通过手机摄像头将虚拟角色“召唤”至现实并实时交互，重新定义内容与交互边界。开源AI主导权东移调研显示，高质量、易部署的中国开源模型正成为全球开发者的实际首选，重塑开源生态影响力格局。📮 听众留言渠道正在建立中...欢迎通过邮件与我们分享你的见解与困惑：[email protected]

Feb 10, 2026

7m

3

《苹果牵手谷歌，OpenAI组“顾问军团”：AI竞赛进入生态战时代》

在这一期《AI快照》中，我们来聊聊AI世界正在发生的“权力游戏”。当苹果和谷歌这两个老对手选择联手，当AI助手开始“预装”进亿万手机，竞争规则已经变了：这不再是单纯的技术赛跑，而是生态与联盟的全面对抗。同时，一个让AI替你“社交”的实验突然走红，让我们忍不住思考：如果未来每个人都有一个数字分身，那么“我是谁”这个老问题，会不会有全新的答案？本期内容：巨头新联盟：苹果为何选择谷歌的Gemini来升级Siri？这堂课关乎战略，而非单纯的技术排名。用户的“手机预装战”：Gemini月活用户冲到7.5亿，背后是搜索和安卓生态的“降维打击”。OpenAI To B升级：OpenAI开始组建“顾问军团”，因为企业要的不是炫酷模型，而是能帮它改造流程的“合作伙伴”。AI成为“运营大脑”：看FedEx如何用AI预测延误、自动优化路线，让技术从展示台走入核心生产线。未来的我？ “数字分身”社交实验爆火，是下一代互联网入口的预演，还是一个巨大的信任与隐私问号？📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解：[email protected]

Feb 7, 2026

4m

2

《AI冰与火：一边千亿融资狂欢，一边软件股百亿蒸发》

在这一期《AI快照》中，我们将深入探讨AI行业正在上演的“冰与火之歌”—— 一边是Waymo拿下160亿美元融资、估值冲上1260亿的资本狂欢，另一边却是AI工具导致软件股市值单日蒸发千亿的残酷现实。我们将解析这种割裂现象背后的深层逻辑：当AI从“效率工具”进化为“架构重组者”，哪些商业模式将面临根本性挑战？本期内容：Waymo完成160亿美元融资，估值达1260亿美元，自动驾驶进入城市扩张新阶段腾讯混元研究揭示大模型短板：仍难以真正理解和运用即时上下文信息小鹏汽车组织变阵：合并自动驾驶与智能座舱中心，押注“通用智能”未来特斯拉官宣第三代人形机器人今年量产，目标年产百万台SpaceX完成对xAI的收购，构建“太空+AI”垂直生态闭环📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解：[email protected]

Feb 5, 2026

5m

1

《春节红包大战打响，AI正在争什么？》

在这一期《AI快照》中，我们将聊一聊这个春节，AI厂商争抢的早已不是技术排名，而是你手机里的第一个入口——你将习惯去哪里获得答案、完成任务，甚至做出消费决策。本期亮点：Kimi出海告捷：海外收入首超国内，下一代模型驱动全球付费用户数倍增长英伟达重磅加码：计划对OpenAI启动“史上最大规模”投资，资本热度不减阿里发起“春节请客”：豪掷30亿，将AI入口战与生态流量深度绑定两条核心路径浮现：是下载一个独立的AI超级App，还是在微信、搜索等老地方“顺手”用AI？一个被低估的决胜因素：用户习惯的成本，如何让“更顺手的”胜过“更强大的”终局预测：AI竞争将走向“泛在化”，胜败关键在于谁离你的真实需求更近、路径更短📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解：[email protected]

Feb 3, 2026

5m

0

《AI 抢走的不是交易，而是决策权》

在这一期《AI快照》中，我们将聊一聊 AI 正在如何成为新的消费决策入口——买不买、买什么、为什么买。本期亮点：MiniMax 发布两款大模型，分别押注长期陪伴与专业音乐创作腾讯「元宝」火爆下载，社交 + 娱乐属性吸引普通用户阿里推出万亿参数推理模型「千问 3-Max-Thinking」Anthropic 融资目标翻倍至 200 亿美元，资本仍在争夺未来领导地位零售行业趋势：AI 正逐步介入商品发现与决策，传统电商平台面临“购买动机”被转移的挑战📮 听众留言渠道正在建立中目前可以通过邮箱联系我们： [email protected]

Jan 31, 2026

5m