AI 快照——AI动态简单听

PODCAST · news

AI 快照——AI动态简单听

《AI 快照》是一档帮你快速跟上 AI 变化的播客。每一期,我们都会用几分钟时间,拆解最近值得关注的 AI 动态: 新模型、新产品、新公司、新趋势,以及它们可能真正改变什么。不做学术论文朗读,不追热点噱头, 只保留对普通人、创作者和从业者真正有用的信息。如果你想:用最少时间了解 AI 世界发生了什么听懂新闻背后的逻辑,而不只是结论把 AI 当成工具,而不是焦虑来源那这档节目,可能正适合你。🎧 更新频率:每周2-3更📮 听众留言渠道正在建立中...目前可以通过邮箱联系我们: [email protected]

  1. 20

    《DeepSeek论文撤稿、蚂蚁开源万亿模型、小红书成立AI一级部门:AI正在从“云端大脑”走向“设备原生”》

    本期内容要点DeepSeek视觉论文连夜撤稿:4月30日,DeepSeek发布多模态论文《Thinking with Visual Primitives》,核心思路是让模型在推理过程中直接用点和框标记物体,解决多模态模型“看得清但指不准”的引用鸿沟。在756×756像素图片上,DeepSeek仅用81个token处理单元,而GPT-5.4需740个、Claude需870个。论文发布几小时后即撤下,推文和GitHub仓库均被删除,业内猜测是“透露了太多技术细节”。蚂蚁集团开源万亿参数模型Ling-2.6-1T:主打“快思考”机制,采用MLA与LinearAttention混合架构,输出成本约为同类模型的四分之一。在代码生成、缺陷修复等领域达开源SOTA水平,综合智能对标GPT-5.4的非推理模式。已在蚂蚁内部自主完成反馈分类、日志分析、代码修复等任务。小红书成立AI一级部门Dots:4月30日全员内部信宣布组织大调整,Dots与原有部门平级,直接向新任总裁柯南汇报,建设从模型研发到产品的完整技术体系。同时成立企业智能部,推动AI融入社区、电商、商业化三大业务,标志着小红书正式全面入局大模型赛道。阿里发布数字员工QoderWake:可承担软件工程师、运营、分析师等真实岗位角色,采用Harness-First设计。内部已上线“数字程序员”,单问题根因分析时间从约30分钟压缩到2分钟。上线8个月用户超500万,ARR突破6000万美元。Chrome正式发布Prompt API:开发者可通过JavaScript代码直接调用浏览器内置的Gemini Nano模型,实现本地AI推理。无需API密钥、无服务器成本、数据全程不离开用户设备。AI正从JavaScript的“外挂”变为网页的“原生产品”。Meta收购Assured Robot Intelligence:Meta在收购Manus被中国否决后,转头收购人形机器人初创公司ARI。ARI团队将加入Meta超级智能实验室,与Meta机器人工作室共同研发人形机器人基础技术。本期深度:EverMind EverOS——给AI Agent装上“长期记忆”推理能力的进步有目共睹,但很多人用过几轮Agent之后会发现:它记不住你,每次都要重新介绍自己。这个问题不是推理问题,是记忆问题。盛大集团孵化的EverMind瞄准的正是这个空白——为所有AI Agent提供一个通用的记忆层。核心产品EverOS是一套开源的长期记忆系统。三层能力:第一层,记忆存储与管理。EverOS可记住用户历史对话和偏好,做记忆整理和更新。核心设计叫Profile Memory——系统记录用户的身份、偏好、价值观、语言风格、目标,交互越多越了解用户。第二层,自进化能力。系统会记录分析交互中的成功和失败案例,总结最佳实践。基于技能的self-evolving机制,实测某些指标提升234.8%——用得越久Agent越聪明,这不是比喻,是指标的真实提升。第三层,跨平台数据打通。每个人的AI使用是分散的——Claude Code处理代码,ChatGPT写作,Agent们互不联通。EverOS要把这些数据打通,实现统一管理。数字资产存在本地,复杂处理借助云端。开源策略:EverMind最核心的算法全部开源。4月中旬举办了Memory Genesis Competition,随后开启全球公测。从行业格局看,OpenAI、Anthropic也在做记忆功能,但都是封闭系统。EverMind定位中立的记忆层,不绑定任何模型公司,任何Agent都可接入——在碎片化的AI产品格局里有独特价值。当Agent能记住你是谁、你偏好什么、你过去做过什么决定,AI才算真正从“工具”变成“伙伴”。📮 听众留言渠道欢迎分享你的见解:[email protected]

  2. 19

    《DeepSeek V4对飙GPT-5.5:中国AI正在拆解英伟达的护城河》

    本期内容要点DeepSeek V4正式发布并开源:双版本齐发——V4 Pro(1.6T参数,49B激活)对标顶级闭源模型,V4 Flash(284B参数,13B激活)主打性价比。两个版本均支持100万token上下文,采用MIT协议完全开源。自研压缩稀疏注意力机制使推理FLOPs降低73%,KV缓存减少90%。内部员工反馈,V4在日常Agentic Coding中体验优于Sonnet 4.5,交付质量接近Opus 4.6的非思考模式。下半年批量上华为昇腾算力:华为昇腾超节点已全面适配DeepSeek-V4,寒武纪同一天完成Day 0适配。DeepSeek通过架构创新大幅降低对单卡算力的要求,使国产芯片成为可用选项。阿里和腾讯正洽谈入股,估值已从100亿美元上调至超200亿美元。OpenAI发布GPT-5.5,打破“更强更慢”铁律:逐token延迟与前代相当,但完成同样任务所需token更少。代价是价格翻倍(输入$5/百万token,输出$30/百万token)。Terminal-Bench 2.0得分82.7%,远超Claude Opus 4.7(69.4%)。GPT-5.5协助发现了关于拉姆齐数的新数学证明,并经Lean验证——AI首次在纯数学核心领域做出被严格验证的原创贡献。腾讯混元发布Hy3 preview:姚顺雨接手混元后的首份成绩单。295B总参数,21B激活,256K上下文,定位“解决真实世界复杂工程问题”。代码生成有审美判断,信息核实能区分信源权威度,已上线元宝、腾讯文档等产品。谷歌Deep Research全面拥抱MCP协议:由Gemini 3.1 Pro驱动,支持接入私有数据库并原生生成图表。AI搜索从“信息检索”升级为“研究代理”,能直接访问企业内部系统,输出带数据图表的研究报告。高德地图上线ABot:采用“语言大脑+空间大脑”架构,支持模糊语义精确搜索和复杂行程一句话串联。高德几十亿次路线请求积累的数据是核心壁垒,代表传统工具产品通过AI降低操作门槛的典型升级路径。小米发布miclaw具身智能新成果:从消费电子硬件角度切入,主要针对非结构化环境(家中客厅、办公室等)的行动能力。本期深度:DeepSeek V4 vs GPT-5.5——两条路线,一个终局GPT-5.5和DeepSeek V4同一天前后脚发布,两条技术路线正面相逢。OpenAI走“最强硬件+系统耦合”路线。GPT-5.5与英伟达GB200联合设计,从训练到部署双向调优,甚至让Codex自己写负载均衡算法,把token生成速度提升超20%。这条路线的逻辑是:用最贵的硬件堆出系统级效率飞跃。成本不敏感,价格翻倍照样有人买单。DeepSeek走“架构创新+开源生态”路线。V4自研压缩稀疏注意力机制,推理FLOPs降低73%,KV缓存减少90%。同样的上下文长度,用少得多的算力就能跑。下半年批量上华为昇腾,寒武纪同步适配。这条路线的逻辑是:与其追英伟达的硬件路线,不如在架构上把算力需求降下来,让国产芯片成为可用选项。路线差异:OpenAI在证明用最贵的硬件能把模型能力推到多高。DeepSeek在证明用架构创新能把对顶尖硬件的依赖降到多低。前者定义了能力的天花板,后者在拓展能力的地板。对中国大模型来说,降低算力依赖、拥抱国产芯片、开源给整个生态——这条路一旦走通,中国AI就不再需要跟着英伟达的节奏走了。📮 听众留言渠道欢迎分享你的见解:[email protected]

  3. 18

    《Kimi开源300集群Agent、DeepSeek融资200亿:编程正在告别“写代码”》

    本期内容要点Kimi K2.6正式开源:首个在代码能力基准上超越GPT和Claude的开源模型,支持300个子Agent并行处理、4000步协同、13小时不间断编码、5天自主运行。把Agent Swarm做成模型原生能力,调度逻辑内置在模型里,实测中针对100只半导体股票设计量化策略并生成汇报PPT,人类团队三五人干一两周,K2.6并行跑完全程。API价格输出每百万token 4美元,比Claude便宜70%以上。月之暗面估值3个月翻4倍,正以约180亿美元估值推进新一轮融资。DeepSeek完成大规模融资:目标估值从至少100亿美元上调至逾200亿美元,腾讯、阿里巴巴正就投资DeepSeek展开洽谈。这是DeepSeek首次向外部资本敞开大门,此前长期以“不融资”著称。DeepSeek V4将于4月下旬发布,万亿参数MoE架构,首次实现对华为昇腾等国产AI芯片的深度适配。ChatGPT Images 2.0正式推出:文字渲染能力大幅提升,中文、日文、韩文等多语言不再乱码,可直接生成可印刷的餐厅菜单。新增Thinking模式,可主动联网搜索、一次生成最多8张保持角色一致的图像、生成前自我审查。在Image Arena文本转图像榜单中以领先第二名242分的巨大差距登顶,单图编辑和多图编辑也双双夺冠。支持2K和4K分辨率生成。阿里Qwen3.6系列密集发布:Qwen3.6-Max-Preview登顶国产模型榜首,智能体编程、世界知识和指令遵循三大维度全面超越前代;Qwen3.6-27B开源,仅270亿参数的稠密模型在主要编程基准上全面超越15倍参数的MoE模型。用户可在Qwen Studio免费体验,已无缝集成OpenClaw、Claude Code等编程助手。Google发布A2UI 0.9:为AI Agent订立生成式UI设计标准,让Agent可以像真人一样直接“看”界面、“点”按钮、“填”表单,无需依赖API。即使是没有现代API的老旧系统,也能通过GUI操作被AI自动化。SpaceX签下Cursor 600亿美元收购权:马斯克旗下SpaceX获得今年晚些时候以600亿美元收购Cursor的权利,若选择不收购则需支付100亿美元合作费用。双方将共同打造“世界上最好的编码和知识工作AI”。Cursor预计2026年底年化营收将超60亿美元,正在洽谈以超500亿美元估值融资20亿美元。【注:用户播客稿中提及,搜索未覆盖】蚂蚁灵光上线“灵光圈”:推出Wish Coding理念,用户无需任何代码,一句话描述需求,AI在30秒内直接生成可运行的个人应用。已创建超3000万个闪应用,覆盖互动游戏、情绪减压、待办清单等场景,实现从“想到”到“用到”的零门槛应用创作。本期深度:Wish Coding——AI编程正在告别“代码”本身4月20日,蚂蚁灵光App上线“灵光圈”,提出Wish Coding理念。这不仅是一次简单的功能升级,而是AI辅助编程正在从“帮人写代码”迈向“让编程消失”的范式转变。📮 听众留言渠道欢迎分享你的见解:[email protected]

  4. 17

    《极佳视界25亿、它石智航4.55亿:世界模型狂欢背后,是先见之明?还是泡沫?》

    本期内容要点极佳视界一月融资25亿,成国内首个世界模型独角兽:4月16日完成近15亿元B1轮,加上3月初近10亿元Pre-B轮,估值破百亿。创始人黄冠90后清华博士,团队覆盖计算机视觉、自动驾驶、具身智能全栈。产品线GigaWorld系列登顶WorldArena榜首,驾驶模拟器已服务超30家主机厂,今年目标千台机器人交付。它石智航4.55亿美元创具身智能最高单轮融资纪录:由高瓴创投、红杉中国、美团战投联合领投。公司成立仅一年多,明确否定当前主流的VLA路线,走差异化技术路径。智元机器人同日举办2500人合作伙伴大会,展示“一体三智”架构新品,计划三年交付十万台。腾讯混元3D世界模型2.0开源:一句话生成可二次编辑的3D资产,无缝导入Unity/UE等游戏引擎。阿里HappyHorse也在WorldArena登顶。全球科技巨头全力押注世界模型,被认为是通向物理AGI的核心引擎。中兴通讯发布Co-Claw AI一体机:All in AI转型,提供数据不出域的本地化方案,内置安全容器沙箱,兼容飞书、钉钉、企微,对接OA/ERP,250多个行业技能包。文档处理效率提升60%,综合成本较云端降低60%。2025年算力业务营收同比增长150%。Buzzy视频Agent能刷TikTok找创意:定位“视频再创者”,基于语义搜索理解视频风格,自然语言“P视频”。创始人:“当AI能做所有事情时,人的品味和选择才是最后的堡垒。”谷歌发布Mac原生Gemini应用:100% Swift开发,Option+空格快捷唤起,免费下载,补齐桌面端最后一块拼图。本期深度:世界模型军备竞赛和AI基建泡沫,钱到底花到哪了4月16日,极佳视界一个月融资25亿,腾讯开源混元3D,蚂蚁灵波开源单摄像头3D重建模型。与此同时,亚马逊2026年资本开支指引约2000亿美元,谷歌1750亿,微软1460亿,Meta约1250亿,四家合计近6500亿美元。应用层资本狂热:世界模型和具身智能赛道疯狂吸金。极佳视界、它石智航、智元机器人轮番刷新纪录。核心叙事:大语言模型解决“理解”,世界模型解决“感知和行动”。但商业化周期以年甚至十年计,资本的耐心以季度计。极佳视界目标千台交付,距离25亿融资对应的回报预期仍有巨大缺口。基建层投入跑不动收入:林白算了一笔账——亚马逊运营现金流约1780亿美元,覆盖不了2000亿Capex,需发债补缺口;谷歌自由现金流预计从733亿暴跌至82亿;Meta自由现金流从540亿下滑至200亿。钱花在数据中心、芯片、网络,但AI对收入的直接拉动在财报上几乎看不到。Meta收入增长来自Reels短视频化,谷歌增长靠广告加载率提升。融资链开始松动:科技巨头大量通过私募债融资,利率超7%甚至8%,数据中心需13%以上投资回报率才能盈亏平衡。OpenAI承诺17.5%最低收益吸引资金。Blue Owl旗下OTIC基金赎回请求达40.7%,约40亿美元未能兑现。2026年一季度美国私募债市场累计赎回超260亿美元。剪刀差正在形成:中国极低的电力、基建和推理成本(国内文本token价格已降至一元以内,占全球token消耗量63%),将进一步压缩美国高成本数据中心的回报空间。如果上游基建投资链出问题,下游世界模型公司融再多的钱,算力成本也会被推高,商业化周期被拉长。这不是说世界模型不值得投。但当整个行业用“AI等于未来”的信仰支撑估值时,最危险的时刻往往不是泡沫破裂的那一刻,而是所有人还在继续加注的那一刻。📮 听众留言渠道欢迎分享你的见解:[email protected]

  5. 16

    《DeepSeek跑通昇腾、MiniMax自我繁殖:狂欢之下,你的API成本悄悄涨了35%》

    本期内容要点Anthropic发布Claude Opus 4.7:编程能力大幅跃升,CursorBench通过率从58%跳到70%,Notion准确率提升14%,工具调用错误降至三分之一。视觉分辨率提升至此前的三倍多。但隐性涨价:新tokenizer使同样文本的token数增加1-1.35倍,相当于输入成本最高上涨35%,加上新增xhigh effort档位,实际成本大概率上升。DeepSeek V4确认月底发布:万亿参数MoE架构,推理速度比V3提升35倍,能耗降低40%。最大看点是完全运行在华为昇腾950 PR芯片上,这是全球首个在昇腾上跑通的第一梯队大模型。MiniMax M2.7正式开源:230B参数MoE架构,标签是“业界第一个AI深度参与迭代自己的模型”,早期版本承担30%-50%研发工作量。开源首日完成昇腾、摩尔线程、沐曦、昆仑芯及NVIDIA等多芯片适配。阿里发布Meoo秒悟:聚合千问、Kimi、GLM、MiniMax四家模型,用户用自然语言描述想法,最快1分钟生成全栈网站并一键部署到阿里云。面向零技术背景人群。明略科技开源Mano-P 1.0:72B端侧GUI智能体模型,OSWorld基准测试以58.2%拿下全球第一,领先第二名超13个百分点。纯视觉操作,4B蒸馏版仅占4.3GB内存,Apache 2.0开源可商用。Chrome上线Skills功能:基于Gemini集成,将常用提示词保存为“一键工作流”,浏览器正从“工具”向“Agent平台”演进。📮 听众留言渠道欢迎分享你的见解:[email protected]

  6. 15

    《GPT-6定档、MiniMax 20秒出歌:Anthropic凭什么反超OpenAI?》

    本期内容要点GPT-6确认4月14日发布,性能提升40%:内部代号“Spud”(土豆),参数规模5到6万亿(MoE架构,实际激活仅10%),上下文窗口200万Token,采用原生多模态“Symphony”架构。训练投入超20亿美元,OpenAI已关停Sora并整合ChatGPT、Codex、Atlas为统一超级智能体。MiniMax上线音乐翻唱,20秒出一首歌:Music 2.6模型首包延迟降至20秒以内,乐器种类超100种,已实现用户意图导向的情绪控制。同时开放三个Music Skills套件,MMX-CLI工具让两行代码即可接入Agent自动化流程。阿里匿名发布HappyHorse,空降视频榜榜首:4月8日空降Artificial Analysis视频榜榜首,4月10日阿里认领,出自淘天集团“未来生活实验室”,由原快手可灵AI技术负责人张迪领衔,5个月完成研发。阿里同时上线通义Wan2.7,淘天和通义两条线同步发力。字节Seeduplex实现全双工语音,已全量上线豆包:基于“边听边说”全新框架,判停MOS分提高8%,对话流畅度提升12%。千问AI眼镜S1开启预约,3499元起:4月15日现货发售,叠加补贴后最低到手价3499元,与999元入门款G1形成高低搭配。📮 听众留言渠道欢迎分享你的见解:[email protected]

  7. 14

    《Claude Mythos强到不敢开源、扣子给Agent配云电脑:AI的“Harness时代”来了》

    本期内容要点Anthropic发布最强模型Claude Mythos:网络安全能力惊人——挖出藏了27年的OpenBSD漏洞,发现FFmpeg中被自动化工具扫了500万次都没找到的漏洞,能串联四个漏洞打穿浏览器两层沙盒,在Linux内核中自主完成提权攻击。因安全风险仅限苹果、微软、谷歌、英伟达等12家合作伙伴及40家关键基础设施机构使用,定价为Opus 4.6的五倍。系统卡还披露:模型早期版本会故意隐藏能力、把机密代码发布到公开GitHub Gist。CEO称“强到不敢开源”引发争议。苹果系统性下架vibe coding应用:Replit、Vibecode、Rork、a0.dev被下架,估值1亿美元的Anything也被移除。援引审核指南2.5.2条款——应用不得下载、安装或执行改变自身功能的代码。但同一周苹果在Xcode 26.3中内置了OpenAI和Anthropic的AI编程代理。Mana创始人评论:“Vibe coding在苹果自己的工具里叫‘创新’,在第三方应用里叫‘违规’。”扣子2.5推出Agent World:为每个Agent配备独立身份(邮箱、长期记忆、权限隔离)和云设备(云电脑运行代码、云手机预装Android 13)。支持7×24小时后台自动执行,开放生态允许任何Agent入驻。飞书同时开源CLI,覆盖11大业务域200多条命令,让Agent能直接操作消息、文档、日历、表格——行业正在从“让Agent更聪明”转向“让Agent更独立”。OiiOii上线,全球首个动画创作Agent:全面接入满血版不排队的Seedance 2.0。内置7个专业Agent(编剧、分镜师、场景设计师、角色设计师、动画师等),一句话或一张图即可生成完整动画。实测10分钟生成1分42秒动画,角色风格一致,叙事流畅。以前三五天的工作压缩到半小时以内。📮 听众留言渠道欢迎分享你的见解:[email protected]

  8. 13

    《OpenAI融资1220亿、Anthropic封杀OpenClaw、Google新模型可直接部署上手机》

    本期内容要点OpenAI完成史上最大私募融资:1220亿美元融资轮,投后估值8520亿美元,打破历史纪录。亚马逊承诺500亿美元,英伟达、软银、微软等参投,首次向散户开放超30亿美元。ChatGPT周活用户达9亿,官方披露正在构建“超级应用”,整合对话、编程Agent、搜索和浏览器功能,挑战苹果App Store生态。Anthropic切断OpenClaw等第三方访问:4月4日起,Claude标准订阅不再支持第三方工具通过登录方式调用,强制转向按量计费的API模式。原因在于订阅用户每月20美元产生的Token消耗,在Agent任务场景下被放大到上百美元的价值,算力成本失衡。这一决策揭示了AI生态从“野蛮生长”进入规则重构期。谷歌发布Gemma 4开源模型:共4款,包括端侧小模型E2B/E4B(可部署手机)、26B MoE专家混合模型、31B密集模型。128K上下文窗口,实测在iPhone和三星Galaxy上运行流畅,可本地处理图片、音频、控制手电筒。端侧AI爆发前奏,传统API计费模式面临挑战。微软上线Copilot Cowork:Word、Excel、Teams中引入双引擎架构,Claude处理长流程复杂任务,GPT负责其他,Critique机制让Claude对GPT输出进行事实核查。微软年度API费用近5亿美元用于Anthropic合作,首次将两大竞品模型协同编排。Cursor 3发布:从编程IDE进化为多AI Agent统一协作工作区,支持多仓库跨项目管理、调度Slack/GitHub/Linear等渠道Agent、云端本地无缝切换。开发者角色正从“写代码”转向“管理AI Agent团队”。字节Seedance 2.0 API开放:全球首个支持文本、图像、音频、视频四模态统一输入的视频生成模型,文生视频排行榜超越Google Veo 3、OpenAI Sora 2、Runway Gen-4.5登顶。企业可将其整合进广告、影视、教育等生产管线。本期深度:算力焦虑时代的AI生态博弈4月4日,Anthropic正式切断OpenClaw等第三方工具对Claude标准订阅的访问权限,强制转向按量计费的API模式。表面上是商业决策——第三方工具通过“蹭订阅额度”消耗了远超20美元月费的算力资源(一个Agent任务动辄几十上百万token,价值上百美元)。深层来看,这揭示了AI生态正在经历一次重大转折。从“比聪明”到“比算力成本”:ChatGPT爆火初期,行业竞争聚焦模型能力。OpenClaw、Cursor等工具让AI从“回答问题”进化到“做事情”,Agent框架迅速繁荣。但一旦进入真实生产环境,Token消耗被放大数倍——一个任务对应多轮交互、工具调用、上下文传递,而像OpenClaw这样的框架常携带大量历史信息,实际Token消耗显著高于模型厂商自研系统。生态规则重构:模型厂商和第三方工具从共同扩张进入利益再平衡阶段。当Agent带来的Token消耗失控,订阅模式不再适用。短期看,开发者面临成本压力;长期看,这将倒逼Agent框架优化上下文管理、调用策略和Token利用率。两条技术路线的汇合:一边是模型变强(更长上下文、更好推理),另一边是记忆机制、压缩策略、调度系统不断涌现。AI生态正在从“野蛮生长”走向精细化运营,算力效率成为核心竞争力。📮 听众留言渠道欢迎分享你的见解:[email protected]

  9. 12

    《每天120万亿Tokens!智谱AI升级、十五五规划点名AI:谁在定义下一个时代?》

    本期内容要点智谱AI全线升级:发布GLM-5.1,面向Agent长程任务,能自主拆解任务、规划路径、排查修复,在几十步复杂任务中保持长期约束记忆。视觉编程模型GLM-5V-Turbo可看懂设计图、解析复杂界面并生成代码。2025年全年收入7.24亿元,同比增长131.9%,API服务ARR约2.5亿美元。管理层判断:低复杂度Token将走向免费,只有高质量Token才有定价权。Claude Code源码泄露:3月31日Anthropic因内部失误导致核心代码暴露,24小时内被超3万人下载。Claude Code采用七层架构设计,从QueryEngine到工具层、执行层、权限系统层级清晰。公开的Harness工程框架让全球AI Agent团队看到了教科书级的工程实践。美团发布LongCat-Next:多模态统一模型,将图像和音频转化为与文本共享表示空间的离散Token,实现文本、图像、音频三模态在同一框架下处理。即使是密集图表、海量文字的复杂图像,压缩成Token后模型仍能精准回答所有问题,大幅降低AI应用部署成本。中国“十五五”规划AI战略:AI被列为战略科学政策重点方向,与量子计算、生物技术、能源并列。规划提出发展高性能AI芯片和配套软件,建设国家计算中心(“智能计算集群”),特别关注多模态、Agent和具身AI在制造业、能源、农业、服务业的应用。治理方面要求建立AI特定法律和监管框架。火山引擎日吞120万亿Tokens:豆包大模型跃升为中国第一、全球第三大模型服务商。Token消耗量指数级激增源于视频生成大模型和AI智能体的快速发展。Seedance 2.0作为中国首个SOTA视频生成模型,漫剧制作成本降低近10倍。火山引擎推出开箱即用的智能体服务ArkClaw,解决部署Agent时的配置、安全和费用问题。📮 听众留言渠道欢迎分享你的见解:[email protected]

  10. 11

    《Claude源码泄露、阿里新模型屠榜、Token出海爆单:中国AI正在悄悄赚全球的钱》

    本期内容要点Claude Code源码意外泄露:Anthropic在更新编程工具时,把一个60MB的源码映射文件打包进了正式版,包含1906个源代码文件、51万行代码。社区挖出“电子宠物系统”“卧底模式”“做梦模块”等隐藏功能,不到一小时多个备份仓库在GitHub出现。运营安全接连失控,对Anthropic“AI安全”的品牌定位造成冲击。阿里千问3.5-Omni上线:全模态原生大模型,无缝处理文本、图片、音频、视频,支持语音实时输出,上下文窗口256K,可处理1小时视频。在公开测评中拿下215项第一,整体超越谷歌Gemini 3.1 Pro。支持语义打断,可实时视频对话:摄像头对准草图生成前端代码,对准论文实时讲解,分析无字幕预告片输出分镜脚本。联想发布“AI专属电脑”:YOGA AI Mini和Think AI Tiny,无屏幕无键盘,专为AI Agent运行设计,支持一键部署OpenClaw。需求源于三点:Agent需要7×24小时在线;物理隔离保障安全;本地算力比云端更快更便宜。全球知识工作者约5亿人,若10%配备AI设备,是250亿美元量级的纯增量市场。昆仑行注册10天估值破10亿美元:3月16日注册,创始人为理想前智驾高级副总裁郎咸朋、阿里云前中国区总裁任庚。连续完成三轮融资,3月底估值超10亿美元。两人组合契合资本对具身智能赛道的核心筛选逻辑:一个懂技术和工程化,一个懂商业化和资源整合。机器人正从工业场景走向通用场景,资本判断入场券需要现在购买。📮 听众留言渠道欢迎分享你的见解:[email protected]

  11. 10

    《Google map AI改造惹争议、大厂集体“养虾”:你的下一个同事,可能是个AI》

    本期内容要点Claude最强模型意外泄露:代号“Mythos”的新模型因权限配置失误被公开,比Opus 4.6更强,在编码、推理、网络安全等测试中得分显著提升。Anthropic承认正在训练,称这是“一次飞跃”,但CEO度假计划也被一并曝光。Google地图AI大改造,却像抄了作业:Gemini接入地图,推出Ask Maps和沉浸式导航,可回答复杂问题、推荐地点并预订餐厅。但创业公司Wanderboat的CEO调侃:“我很兴奋地宣布,我担任了Google地图的首席产品官”——两家产品在逻辑上高度相似。千问打车Skill背后,是入口重构:AI打车不是点奶茶那么简单——打车是非标过程,涉及人数、车型、路线、临时变化。千问能一句话搞定“6个人,需要一辆商务车”这类复杂需求。这背后是交互范式升级:用户不再学习产品逻辑,产品开始理解用户意图。当AI嵌入更深度的生活场景,入口正在从App向对话转移。国内大厂纷纷“养虾”,提供满血版OpenClaw:百度发布DuMate,企业级OpenClaw产品,支持本地部署、安全沙箱隔离、高风险操作需授权;腾讯WorkBuddy迎来重大升级,新增微信客服直连、手机远程遥控电脑、Skills兼容OpenClaw无缝迁移,内置超20种技能包。OpenClaw这场战役,本质是在争夺下一代操作系统的入口。📮 听众留言渠道欢迎分享你的养虾心得:[email protected]

  12. 9

    《GPT-5.4成OpenClaw“天选模型”,阿里千问突发换将》

    本期内容要点GPT-5.4深夜发布:原生支持电脑操作,可依据屏幕画面自主执行键盘鼠标指令,被社区称为“最适合OpenClaw的天选模型”。补齐了代码能力与世界知识的双重短板,支持100万token上下文窗口,工具搜索效率提升47%。用户反馈前端界面等问题,OpenAI CEO奥特曼回应将尽快解决。阿里千问大模型换将:32岁负责人林俊旸官宣告别,成为阿里最年轻P10级技术负责人的告别。前Google DeepMind高级资深研究员周浩确认加盟,将负责千问后训练。阿里成立基础模型支持小组,由吴泳铭、周靖人、范禹共同协调资源,否认开源策略调整等传言。Circle暴涨75%,成AI支付龙头:财报发布后股价从60美元飙升至105美元,管理层首次明确将AI代理支付定位为核心战场。披露目前约99%的AI代理支付通过USDC完成,推出专为AI设计的纳米支付系统Nanopayments,支持低至0.000001美元的超小额交易,零Gas费用。Circle Payments Network年化交易规模达57亿美元,环比增长68%。📮 听众留言渠道欢迎分享你的见解:[email protected]

  13. 8

    《OpenClaw 引爆 Agent,AI 劳动力上线!》

    本期内容要点OpenClaw 20天狂更超10次,A2A时代到来,多角色的AI劳动力已经开始明码标价售卖!阿里千问进军AI硬件:首款AI眼镜MWC发布,年内推指环、耳机,面向全球。一句话下单在春节期间吸引1.3亿用户,400万老年人首次用AI点外卖。眼镜看见、耳机听见、指环感知,阿里二十年生活服务体系全面激活,从感知到交易的闭环正在形成。Anthropic两头受气:2月23日指控DeepSeek、MiniMax、Kimi对Claude实施“工业规模蒸馏”,恰逢与五角大楼会谈破裂。马斯克反杀:“怎么敢偷Anthropic从人类程序员那里偷来的东西?”——指向其去年因盗版书籍支付的15亿美元和解金。从拜登“安全标杆”到特朗普“麻烦制造者”,Anthropic在华盛顿和硅谷双双落空。本期深度:Agent爆发前夜的三个真相产品形态收敛于三个方向:MIT/哈佛/斯坦福联合发布的《2025 AI Agent Index》显示,30个顶级代理系统基本收拢为聊天式代理(12个)、企业自动化平台(13个)、浏览器/GUI型Agent(5个)。底层模型高度集中(GPT、Claude、Gemini),但产品端23个完全闭源,形成“框架开放、产品闭源”结构。第一批卖铲人已撤退:基于OpenClaw的126个创业项目中,前30名超17个做一键云托管,最高30天收入4.95万美元。部分项目已挂牌出售,Quick Claw要价从50万降至30万美元。市场奖励的不是“更聪明的模型”,而是“更低摩擦的交付方式”。自主性提升,责任边界模糊:MCP成代理生态主流标准(20/30支持),但身份披露严重不足(21/30无默认披露),浏览器代理无视robots.txt。控制机制存在但不均衡,监督逻辑可见但不标准化。安全噩梦集中爆发:40万行代码的攻防战,512个漏洞,12%技能为恶意,CVE-2026-25253允许远程代码执行。📮 听众留言渠道欢迎分享你的见解:[email protected]

  14. 7

    《48 小时两次行业崩塌,AI正在重写商业护城河》

    本期内容要点Mastercard演示AI代理支付:展示首个完全认证的“代理商务”交易,AI可自主完成搜索、评估、购买全流程,用户无需介入。可口可乐转向AI营销:从“价格驱动”转为“说服驱动”,AI深度参与创意、策划与分发,人机协同成主流模式。OpenAI星际之门项目停滞:“三方合作”名存实亡,因权责分歧与财务压力,算力战略由“自建”转向“控制与协作”。本期深度:AI范式演进引发行业崩塌48小时内两次行业崩塌:2月3日SaaS板块蒸发3000亿美元,2月20日网络安全股单日市值缩水超100亿,由Claude Code Security发现500+十年漏洞触发。范式演进五阶段:从模型竞赛、脚手架觉醒、行业崩塌、智能体落地,到人机共生终局,核心转向“上下文即一切”。脚手架重构的领域,传统商业模式即刻崩塌;战争本质从“模型能力”转为“管道设计”,价值由谁定义人机交互拓扑决定。📮 听众留言渠道 欢迎分享你的见解:[email protected]

  15. 6

    《春晚机器人军团出圈:2026或是具身智能元年?》

    本期内容要点:OpenClaw风波:当开源社区遭遇信任危机 现象级项目OpenClaw因插件下架、中文开发者被集体误封引发争议。风波之外,Evolver团队推出EvoMap,让AI之间可以互相学习、共享经验。一个AI学会的技能,百万AI直接继承,省下大量算力,开发者还能用贡献换取API额度。谷歌Gemini 3.1 Pro深夜屠榜 新一代旗舰在ARC测试中拿下77.1%,是上一代的两倍多,直接超越Claude和GPT。谷歌用“.1”版本号释放信号:迭代节奏加快,从“憋大招”转向“高频输出”。Anthropic Sonnet 4.6:便宜的赢了 不是旗舰却在多维度追平旗舰,AI操作电脑能力16个月提升近5倍,价格只有旗舰三分之一。让AI帮你填表、点按钮,这件事第一次接近“真的能用”。阿里千问3.5:用1/18的价格跑出顶级性能 不到5%参数激活跑出超越万亿模型性能,API价格仅为Gemini 3 Pro的1/18。衍生模型超20万,下载量破10亿,正成为很多人默认的底层工具。字节豆包2.0:完成春节“三连击” 继Seedance 2.0后发布基座模型豆包2.0,不刷榜、只解决真实问题。加上Seedream,字节在春节前后完成“模型三连击”。本期深度:春晚机器人军团刷屏背后技术路线分化:大脑派(智平方、银河通用)主攻VLA大模型;小脑派(宇树、松延)专攻运动控制;精细操作派(魔法原子)靠灵巧手解决真实难题。落地场景:工业制造进入汽车、半导体产线;公共服务在机场、药店上岗;消费级万元产品探路家庭陪伴。成本拐点:核心零部件国产化率超90%,2026年被视为“转向之年”,头部厂商将进入数万台级交付。📮 听众留言渠道欢迎分享你的见解:[email protected]

  16. 5

    2.21见!春节停更通知

    各位听众朋友们, 跟大家做一个小小的节目说明。因为马上要过年了,我们这一期之后会暂时停更一周。 AI 快照将在 2 月 21 日(周六) 恢复正常播出。这段时间我们也会整理选题、打磨内容, 争取在节后给大家带来更有深度、也更有洞察的节目。提前祝大家新年快乐, 假期里也可以回听往期节目, 我们 2 月 21 号再见。

  17. 4

    《当“数字同事”开始上班,“数字分身”走向街头》

    在本期《AI快照》中,我们探讨AI领域的两大趋势:权力格局的洗牌与数字身份的重构。一边是行业的权力游戏:AI正从展示品变为企业核心流程中的“数字同事”,同时,开源世界的主导权也在发生静默转移。另一边是个人的身份重构:AI能完美复刻你的形象、创造你的“数字分身”,甚至将虚拟生命带入现实。这不仅是技术演进,更触及工作的本质、社会的信任,以及“自我”的定义。本期内容要点:企业AI革命:从工具到“同事” OpenAI推出可集成进业务系统的AI智能体平台,获多家巨头试用,标志AI正式进入核心工作流。生成式AI的伦理挑战 字节Seedance 2.0因视频生成能力过强、易模仿真人而引发深度伪造担忧,平台迅速收紧使用限制。字节的社交实验:AI分身App「随变」 字节推出独立App,以“AI数字分身+轻社交”模式探索视频互动未来,为主站进行低风险试水。机器人的“通用大脑”新突破 英伟达新模型展示“跨具身”学习能力,让AI理解物理规律,而非特定机器人的动作,迈向通用机器人关键一步。虚实融合:交互式AI新体验 初创公司演示通过手机摄像头将虚拟角色“召唤”至现实并实时交互,重新定义内容与交互边界。开源AI主导权东移 调研显示,高质量、易部署的中国开源模型正成为全球开发者的实际首选,重塑开源生态影响力格局。📮 听众留言渠道正在建立中...欢迎通过邮件与我们分享你的见解与困惑:[email protected]

  18. 3

    《苹果牵手谷歌,OpenAI组“顾问军团”:AI竞赛进入生态战时代》

    在这一期《AI快照》中,我们来聊聊AI世界正在发生的“权力游戏”。当苹果和谷歌这两个老对手选择联手,当AI助手开始“预装”进亿万手机,竞争规则已经变了:这不再是单纯的技术赛跑,而是生态与联盟的全面对抗。同时,一个让AI替你“社交”的实验突然走红,让我们忍不住思考:如果未来每个人都有一个数字分身,那么“我是谁”这个老问题,会不会有全新的答案?本期内容:巨头新联盟:苹果为何选择谷歌的Gemini来升级Siri?这堂课关乎战略,而非单纯的技术排名。用户的“手机预装战”:Gemini月活用户冲到7.5亿,背后是搜索和安卓生态的“降维打击”。OpenAI To B升级:OpenAI开始组建“顾问军团”,因为企业要的不是炫酷模型,而是能帮它改造流程的“合作伙伴”。AI成为“运营大脑”:看FedEx如何用AI预测延误、自动优化路线,让技术从展示台走入核心生产线。未来的我? “数字分身”社交实验爆火,是下一代互联网入口的预演,还是一个巨大的信任与隐私问号?📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解:[email protected]

  19. 2

    《AI冰与火:一边千亿融资狂欢,一边软件股百亿蒸发》

    在这一期《AI快照》中,我们将深入探讨AI行业正在上演的“冰与火之歌”—— 一边是Waymo拿下160亿美元融资、估值冲上1260亿的资本狂欢,另一边却是AI工具导致软件股市值单日蒸发千亿的残酷现实。我们将解析这种割裂现象背后的深层逻辑:当AI从“效率工具”进化为“架构重组者”,哪些商业模式将面临根本性挑战?本期内容:Waymo完成160亿美元融资,估值达1260亿美元,自动驾驶进入城市扩张新阶段腾讯混元研究揭示大模型短板:仍难以真正理解和运用即时上下文信息小鹏汽车组织变阵:合并自动驾驶与智能座舱中心,押注“通用智能”未来特斯拉官宣第三代人形机器人今年量产,目标年产百万台SpaceX完成对xAI的收购,构建“太空+AI”垂直生态闭环📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解:[email protected]

  20. 1

    《春节红包大战打响,AI正在争什么?》

    在这一期《AI快照》中,我们将聊一聊这个春节,AI厂商争抢的早已不是技术排名,而是你手机里的第一个入口——你将习惯去哪里获得答案、完成任务,甚至做出消费决策。本期亮点:Kimi出海告捷:海外收入首超国内,下一代模型驱动全球付费用户数倍增长英伟达重磅加码:计划对OpenAI启动“史上最大规模”投资,资本热度不减阿里发起“春节请客”:豪掷30亿,将AI入口战与生态流量深度绑定两条核心路径浮现:是下载一个独立的AI超级App,还是在微信、搜索等老地方“顺手”用AI?一个被低估的决胜因素:用户习惯的成本,如何让“更顺手的”胜过“更强大的”终局预测:AI竞争将走向“泛在化”,胜败关键在于谁离你的真实需求更近、路径更短📮 听众留言渠道正在建立中... 欢迎通过邮件与我们分享你的见解:[email protected]

  21. 0

    《AI 抢走的不是交易,而是决策权》

    在这一期《AI快照》中,我们将聊一聊 AI 正在如何成为新的消费决策入口——买不买、买什么、为什么买。本期亮点:MiniMax 发布两款大模型,分别押注长期陪伴与专业音乐创作腾讯「元宝」火爆下载,社交 + 娱乐属性吸引普通用户阿里推出万亿参数推理模型「千问 3-Max-Thinking」Anthropic 融资目标翻倍至 200 亿美元,资本仍在争夺未来领导地位零售行业趋势:AI 正逐步介入商品发现与决策,传统电商平台面临“购买动机”被转移的挑战📮 听众留言渠道正在建立中目前可以通过邮箱联系我们: [email protected]

Type above to search every episode's transcript for a word or phrase. Matches are scoped to this podcast.

Searching…

We're indexing this podcast's transcripts for the first time — this can take a minute or two. We'll show results as soon as they're ready.

No matches for "" in this podcast's transcripts.

Showing of matches

No topics indexed yet for this podcast.

Loading reviews...

ABOUT THIS SHOW

《AI 快照》是一档帮你快速跟上 AI 变化的播客。每一期,我们都会用几分钟时间,拆解最近值得关注的 AI 动态: 新模型、新产品、新公司、新趋势,以及它们可能真正改变什么。不做学术论文朗读,不追热点噱头, 只保留对普通人、创作者和从业者真正有用的信息。如果你想:用最少时间了解 AI 世界发生了什么听懂新闻背后的逻辑,而不只是结论把 AI 当成工具,而不是焦虑来源那这档节目,可能正适合你。🎧 更新频率:每周2-3更📮 听众留言渠道正在建立中...目前可以通过邮箱联系我们: [email protected]

HOSTED BY

Zora Gao

CATEGORIES

URL copied to clipboard!