PODCAST · technology
AI观测站-AI Observatory
by xiaoyaole
聚焦AI圈与科技行业的最新新闻、产品动态和趋势变化。我们不只聊发生了什么,更关注这些事件背后的竞争逻辑、商业机会和行业走向。希望用轻松但有信息量的方式,陪你快速看懂AI世界正在发生的变化。
-
89
默认模型换了,内存超级周期来了
🧠 本期要点1) OpenAI于5月5日发布GPT-5.5 Instant,并更新为ChatGPT面向所有用户的默认模型,影响数亿日常用户的底层体验。2) Alphabet股价一年上涨160%,Mizuho估算到2027年Google云积压订单中约610亿美元可能来自TPU销售,多数收入预计明年确认。3) Micron一周上涨近38%,创2008年以来最佳单周表现;Samsung进入万亿美元估值俱乐部,平泽P5 Fab 2新厂建设提前六个月。4) Google在印度评估AI基础设施、服务器生产和无人机制造投资,此前宣布2026-2030年投入150亿美元建设首个印度智能基础设施枢纽。5) xAI文档显示,5月15日太平洋时间中午12点后,旧模型请求将不再可用,开发者需在截止点前完成迁移。6) CopilotKit完成2700万美元A轮融资,由Glilot Capital、NFX和SignalFire领投,帮助开发者部署应用内原生智能体。⏱ 时间线00:44 OpenAI于5月5日发布GPT-5.5 Instant,并更新为ChatGPT面向所有用户的默认模型,影响数亿日常用户的底层体验。01:36 Alphabet股价一年上涨160%,Mizuho估算到2027年Google云积压订单中约610亿美元可能来自TPU销售,多数收入预计明年确认。02:38 Micron一周上涨近38%,创2008年以来最佳单周表现;Samsung进入万亿美元估值俱乐部,平泽P5 Fab 2新厂建设提前六个月。03:35 Google在印度评估AI基础设施、服务器生产和无人机制造投资,此前宣布2026-2030年投入150亿美元建设首个印度智能基础设施枢纽。04:38 xAI文档显示,5月15日太平洋时间中午12点后,旧模型请求将不再可用,开发者需在截止点前完成迁移。05:25 CopilotKit完成2700万美元A轮融资
-
88
2026年5月:光纤内存告急,AI淘金者不如卖铲人
2026年5月,AI产业的焦点正从模型能力本身转向其基础设施瓶颈。NVIDIA与康宁签订的32亿美元光纤协议,以及美光2026年HBM产能的全面售罄,都表明数据中心的互联和内存供应正成为新的制约因素。这预示着AI的价值创造正在从模型公司向基础设施公司转移,模型竞赛也开始侧重于“自主时长”这一新维度。AI数据中心光互联重建NVIDIA与康宁签署32亿美元协议,计划提升光纤产能50%,光模块产量1000%。Veeco获得2.5亿美元订单,用于生产800G/1.6T光收发器设备。AI数据中心互联瓶颈从“算力不够”转向“带宽不够”,推动从“电互联”到“光互联”转变。这32亿美元是NVIDIA的护城河,让其DGX集群拥有竞争优势。HBM内存市场“通胀”美光宣布其2026年HBM产能已全部预售完毕。全球内存市场预计将从2025年2163亿美元增至2026年6333亿美元,涨近三倍。HBM因制造复杂、产能受限,成为AI部署的第二大瓶颈,导致“内存通胀”。这影响AI初创公司的推理成本,并使三星和SK海力士获得定价权。模型能力转向“自主时长”Anthropic Claude Mythos预览版在METR基准上“时间跨度”超第二名2倍。OpenAI的实时语音API和本地运行的百万token编码代理(如Garry Tan提到的)预示“代理式AI”发展。模型竞赛焦点从传统基准分数(如MMLU)转向模型自主完成多周期任务的能力。AI产业价值创造重心转移AI产业瓶颈正从GPU、封装,逐步转移到光互联和HBM内存。基础设施扩张(24-36个月)慢于模型能力提升(12-18个月)的速度,形成结构性矛盾。未来AI基础设施公司(如康宁、美光)的市值增速,可能超越模型公司(如OpenAI、Anthropic)。
-
87
模型安全审查、Nvidia股权投资、Veeco订单:算力链条重新定价
🧠 本期要点1) OpenAI向审核团队开放GPT-5.5-Cyber有限预览,该版本对安全任务更开放,同时提供更严格护栏版本供申请使用。2) Politico报道白宫考虑收紧先进模型控制,Microsoft、Google和xAI已同意将模型交白宫进行安全审查。3) Anthropic联合创始人Jack Clark将未来风险拆为四块,早期Claude Mythos快照在METR基准上超过最好模型两倍以上。4) TechCrunch报道Nvidia今年已承诺400亿美元股权交易,用股权、算力和生态绑定将客户关系从卖卡推进到共同扩张。5) Veeco宣布获得超2.5亿美元磷化铟激光制造设备订单,计划2026年交付,指向数据中心光互连扩容。6) PitchBook报告显示2026年第一季度欧洲独角兽新晋数量同比翻倍,法国AMI Labs首次融资后估值达45亿美元。⏱ 时间线00:37 模型竞争先从安全场景开口。CNBC与Axios在5月7日交叉确认,OpenAI向。01:35 紧跟这条线的是美国监管动作。昨天我们讲过欧洲把部分规则时间表往后挪,今天新一层变。02:35 能力透明这一侧,Anthropic也在把话题往前推。Axios在5月7日写到,A。03:46 资本线再往上游看。TechCrunch在5月9日报道,Nvidia今年已经承诺了。04:33 硬件供给的细颗粒度变化,也正在从光互连冒出来。Veeco在5月6日宣布拿到超过2。05:25 最后看融资结构,欧洲这边也出现了不同于纯模型竞赛的信号。InvestorDail。
-
86
2026年5月:Meta的AI账单,员工成了行项目
AI带来的巨额资本支出正在重塑科技公司,导致大规模裁员,并深刻影响了股东回报。Meta等巨头将AI投入视为核心战略,其支出远超人力成本,将员工裁员视为“AI账单中的行项目”。这不仅改变了企业组织结构和对劳动力的需求,也引发了对未来公司形态和行业竞争格局的深思,预示着科技公司正从“人力组织”进化为“资本组织”。Meta:巨额AI投入与员工裁员的“AI账单”Meta将2026年资本支出指引上调至1250亿至1450亿美元,并裁减约8000名员工。扎克伯格直言裁员是“AI账单中的一个行项目”,AI资本支出是人力总薪酬的4到5倍。AI正使“一两个人用一周完成过去几十人工作”成为现实,推动“超级个体”化。高额AI投入正挤压股东回报,超大规模企业回购占比已从27%降至15%。Cloudflare:AI驱动的组织重构与中层企业冲击Cloudflare宣布裁员20%(超过1100人),同期内部AI使用量三个月内暴增600%。公司称裁员是“流程和角色重新设计”结果,标志着AI替代效应从中层基础设施企业蔓延。案例表明AI替代不再是“大厂专属”,任何拥有大量标准化知识工作流程的公司都可能面临类似路径。Cloudflare营收预期低于华尔街预期,短期裁员压缩成本,长期增长引擎待AI重新点燃。高盛报告:AI资本支出对股东回报的挤压高盛数据显示,AI超大规模企业2026年资本支出预计达7550亿美元,同比增长83%。资本支出预计将达到运营现金流的100%,大幅挤压向股东返还现金的空间。这些公司回购占总现金支出比例已从2017-2022年平均的27%降至15%。传统“买入并持有科技巨头”的逻辑正在被打破,投资者需重新评估科技股估值模型。
-
85
千亿AI账单压顶,裁掉人喂饱机器?
🧠 本期要点1) 欧盟将AI Act部分规则推迟至2027年和2028年生效,并达成临时协议禁止生成色情深度伪造应用,59家公司联名警告欧洲可能落后。2) Goldman Sachs分析显示,Amazon、Google、Meta等五家公司2026年资本开支预计达7550亿美元,同比增长83%,占经营现金流约100%。3) Meta将2026年资本开支指引上调至1250亿到1450亿美元,一个季度内新增1070亿美元合同承诺,员工数较上季度下降1%。4) Cloudflare裁员约20%即1100多个岗位,解释为围绕智能工具重新设计流程,预计第二季度营收略低于华尔街预期。5) Claude for Excel、PowerPoint和Word面向所有付费计划正式可用,Claude for Outlook进入公开测试,支持跨应用上下文延续。6) 巴黎公司Outsight宣布实时Physical AI数据处理跨过100PB里程碑,专注于基础设施场景中的3D空间智能。⏱ 时间线00:36 监管线先给今天的产业情绪定了底色。Telecoms在5月8日报道,欧盟把AI A。01:40 顺着这条监管压力往企业账本看,资本开支已经变成巨头必须先回答的问题。Busine。02:45 资本开支落到单家公司,Meta给了更具体的样本。Yahoo Finance在5月。03:55 组织重排这边,Cloudflare把同一逻辑推到了运营层。路透社在5月7日报道。05:00 智能体入口这一侧,昨天我们讲过Claude的记忆和结果验收,今天新一层变化是它开。06:03 最后看物理世界的数据入口,Outsight给出了另一种落地方式。The Nati。
-
84
2026年5月:AI裁员潮,欧盟法案也让步了?
本文深入探讨了当前AI领域的三大关键趋势:欧盟AI法案因多方压力推迟生效,反映了监管与创新之间的复杂平衡;企业AI推理正从云端转向本地部署,以应对数据隐私和成本挑战;与此同时,AI引发的裁员潮加剧,部分企业存在“AI洗白”现象,共同揭示了AI产业增长模式和就业结构的深远变革。AI监管政策的灵活调整欧盟AI法案推迟生效: 原定2026年8月生效的高风险AI规则,现已延期至2027年12月。让步原因: 主要受到美国施压以及欧洲本土企业抱怨,旨在平衡严格监管与创新发展,避免欧洲AI产业落后。短期影响: 消费者保护可能延迟,欧洲AI公司获得更多适应时间,美国大型AI企业在欧洲部署产品将面临更少限制。企业AI推理模式的“云端撤退”部署策略转变: F5的《2026应用战略报告》指出,企业AI推理正从云端回撤至企业本地部署。主要驱动因素: 数据隐私安全、长期运营成本考量(自建比按次付费经济)、以及本地部署能提供更低的延迟和更快的响应速度。行业连锁反应: 对英伟达等GPU供应商是利好(但订单更分散),对AWS、Azure等云服务商则意味着需要从单纯卖算力转向提供工具和增值服务。AI对全球就业市场的冲击与“AI洗白”裁员首要理由: Forbes报道显示,AI连续第二个月成为企业裁员的首要理由,CEO们归因于AI提升了效率。知识型工作受影响: 程序员、分析师等知识型工作面临被AI替代的风险,Coinbase裁员14%亦称AI驱动。“AI洗白”现象: 部分公司借AI之名进行本来就要进行的裁员,掩盖真实原因。AI产业的“落地悖论”: AI技术越强,可能导致客户公司裁员、预算减少,从而反向影响AI公司的市场增长。AI前沿技术与投资新动向AI Agent发展: Anthropic推出“Outcomes”和“Dreaming”功能,分别用于AI Agent的自我迭代和记忆学习;Andrej Karpathy提出“Agentic Engineering”,强调由AI Agent完成复杂任务,人类管理工作流程。模型自训练预测: Anthropic联合创始人预测,到2028年底60%以上AI模型可能实现自我训练,预示着潜在的“智能爆炸”。产业投资侧重: 投资主要流向基础模型(如中国DeepSeek估值可能高达500亿美元)和AI数据中心基础设施(如Veeco获得2.5亿美元InP激光器订单,用于高速光纤互连)。
-
83
DeepSeek估值500亿背后:算力烧钱结束
🧠 本期要点1) DeepSeek首次外部融资估值最高500亿美元,中国集成电路产业投资基金正洽谈领投,资金结构从实验室自供转向国家级资本。2) Claude发布Dreaming和Outcomes两个新能力,分别实现智能体长期记忆和结果验收,竞争从工具调用进入记忆与交付阶段。3) F5发布报告显示推理工作负载进入生产环境,企业倾向自管推理而非外包,网络、安全与应用交付需求上升。4) Samsung网络业务转向数据中心客户,开发硅光子和CPO技术,通信设备商向算力网络迁移。5) 欧洲大学衍生深科技初创投资占比创纪录,Lace Lithography融资4000万美元,Equal1融资6000万美元,资本追逐硬件与实验室能力。6) Forbes数据显示人工智能连续第二个月成美国企业裁员主要驱动因素,Coinbase裁员15%,自动化进入人力预算。⏱ 时间线00:35 DeepSeek首次外部融资估值最高500亿美元,中国集成电路产业投资基金正洽谈领投,资金结构从实验室自供转向国家级资本。01:28 Claude发布Dreaming和Outcomes两个新能力,分别实现智能体长期记忆和结果验收,竞争从工具调用进入记忆与交付阶段。02:26 F5发布报告显示推理工作负载进入生产环境,企业倾向自管推理而非外包,网络、安全与应用交付需求上升。03:18 Samsung网络业务转向数据中心客户,开发硅光子和CPO技术,通信设备商向算力网络迁移。04:08 欧洲大学衍生深科技初创投资占比创纪录,Lace Lithography融资4000万美元,Equal1融资6000万美元,资本追逐硬件与实验室能力。05:09 Forbes数据显示人工智能连续第二个月成美国企业裁员主要驱动因素,Coinbase裁员15%,自动化进入人力预算。
-
82
2026年5月:AI狂潮,利益分配大洗牌
2026年5月,AI产业狂潮揭示了利益分配的深层矛盾与格局重塑。三星内部因AI红利分配不均而撕裂,算力交易从“军备竞赛”转向“资源互通”,以及欧盟AI监管在产业压力下出现“软化”。这些现象共同指向AI热潮中基础设施层赚得盆满钵满,而模型和应用层面临烧钱困境的“利益错配”,预示着未来12-18个月内产业将迎来“再平衡”。三星内部的AI红利分配冲突股价飙升与员工罢工: 三星市值因AI(特别是HBM高带宽内存)飙升至万亿,但员工因认为未分享到AI红利而计划罢工。内部采购困境: 三星手机部门被迫以高价购买自家芯片部门生产的HBM,导致芯片部门盈利而手机部门亏损,引发内部撕裂。HBM涨价: 高带宽内存(HBM)作为AI系统关键部件,价格持续上涨,预计将再涨两到三成。算力策略从竞争转向交易竞争对手间的合作: Anthropic购买了竞争对手xAI(马斯克公司)的Colossus超算服务,用于模型训练。算力资源化: AI算力从过去企业“军备竞赛”的护城河,转变为稀缺资源间的“资源交易”,闲置算力可被变现。竞争焦点转移: 随着算力可交易,未来AI竞争的重点可能从算力大小转向算法和模型效率。欧盟AI监管的妥协与影响德国推动监管软化: 欧盟原计划严格的AI法案,因德国等国为保护机械设备产业竞争力而推动,高风险AI规则被推迟至2027年实施。产业保护与安全顾虑: 监管的妥协反映了产业发展与严格监管间的冲突,可能导致全球安全标准下降,引发“逐底竞争”。刺激欧洲AI发展: 监管放松对欧洲AI公司是利好,促进了独角兽公司的增长,但长期安全性存疑。AI产业的利益错配与再平衡基础设施层获利: 当前AI产业链中,以HBM为代表的基础设施层是主要获利者,而模型层烧钱,应用层挣扎。“卖铲子者”的红利: 这种现象被比喻为“淘金热中卖铲子的最赚钱”,指出了利润分配的不均衡性。未来趋势预测: 预计未来12-18个月内,AI产业将经历“再平衡”,HBM价格可能下降,算力或出现过剩,监管环境将更趋混乱。
-
81
AI默认入口之战,欧盟监管回调
🧠 本期要点1) OpenAI将GPT-5.5 Instant更新为ChatGPT默认模型,并进入Codex模型选择器,支持复杂编码和知识工作,但API key认证暂不可用。2) 欧盟复审AI Act,拟将高风险用途限制推迟一年以上,并给生成内容水印设置宽限期,原定2026年8月2日完整适用节点面临延后。3) Google发布Gemma 4开放模型,采用speculative decoding使生成速度提升3倍,许可改为Apache 2.0,量化后可进入消费级GPU。4) Nvidia与Corning达成多年期光纤合作,Corning计划开设3座先进制造工厂,消息公布后Corning股价一度上涨超23%。5) SAP拟投入10亿欧元收购成立18个月的Prior Labs,将其打造成面向企业表格、数据库和ERP系统的结构化数据智能实验室。6) Bret Taylor创办的Sierra融资9.5亿美元,投后估值超150亿美元,年化经常性收入升至1.5亿美元,客户覆盖超40%的财富50强企业。⏱ 时间线00:35 OpenAI将GPT-5.5 Instant更新为ChatGPT默认模型,并进入Codex模型选择器,支持复杂编码和知识工作,但API key认证暂不可用。01:32 欧盟复审AI Act,拟将高风险用途限制推迟一年以上,并给生成内容水印设置宽限期,原定2026年8月2日完整适用节点面临延后。02:33 Google发布Gemma 4开放模型,采用speculative decoding使生成速度提升3倍,许可改为Apache 2.0,量化后可进入消费级GPU。03:28 Nvidia与Corning达成多年期光纤合作,Corning计划开设3座先进制造工厂,消息公布后Corning股价一度上涨超23%。04:21 SAP拟投入10亿欧元收购成立18个月的Prior Labs,将其打造成面向企业表格、数据库和ERP系统的结构化数据智能实验室。05:18 Bret Taylor创办的Sierra融资9.5亿美元,投后估值超150亿美元,年化经常性收入升至1.5亿美元,客户覆盖超40%的财富50强企业。
-
80
2026年5月:AI告别创新?芯片监管资本说了算
今日AI领域呈现三大关键趋势:内存“超级通胀”导致HBM产能成为AI军备竞赛的新瓶颈;美国白宫正从“放手”转向“伸手”,酝酿对新AI模型进行强制安全审查;同时,OpenAI和Anthropic同日成立百亿级企业部署基金,将AI竞争推向资本运作新阶段。这些事件共同预示着AI产业正从创新驱动转向资源驱动,供应链掌控、政策游说和资本实力成为新的竞争焦点。内存“超级通胀”与AI算力瓶颈Gartner预测2026年全球内存收入达6333亿美元,DRAM价格年涨125%,NAND闪存涨234%,被称为“memflation”。Micron 2026年HBM产能已全部预售,SK Hynix、三星预测内存短缺将持续至2027年。HBM是AI大模型训练和推理的“血管”,产能垄断在SK Hynix、三星、Micron三家,扩产周期长达18-24个月。HBM短缺限制NVIDIA GPU出货,推高中国AI厂商和云厂商成本,倒逼AI芯片架构变革。白宫AI监管转向:模型强制审查特朗普政府酝酿行政令,要求所有新AI模型上市前接受联邦政府安全审查。白宫已向Anthropic、Google、OpenAI高管通报计划,选项包括“政府优先访问”机制。此举标志着美国AI监管从“放手”到“伸手”的根本性转变,与欧盟的立法路径不同。模型预审制度将大幅提高AI模型发布门槛和成本,对初创公司影响尤甚。头部AI公司资本战:百亿部署基金OpenAI与TPG、Brookfield等PE募资超40亿美元,Anthropic与Blackstone、Goldman Sachs等组建类似实体。两家公司同日宣布成立企业AI部署基金,将AI竞争从“模型能力”升级到“资本运作”。此模式将PE资本引入企业AI部署市场,把模型提供商升级为“AI基础设施运营商”。这将直接竞争传统IT咨询公司,并可能在AI部署市场形成“双寡头”格局。AI产业新格局:资源与政策主导内存通胀与模型审查共同形成AI产业的“硬件瓶颈”和“软件枷锁”,导致训练成本和发布门槛双重升高。AI产业的竞争壁垒正从“算法创新”转向“供应链掌控”和“政策游说”。行业赢家不再是模型最强者,而是供应链最稳、政策关系最深、资本储备最厚的公司。2026年将是AI产业的“分水岭之年”,下半年竞争焦点将是资源和执行力。
-
79
当搜索数据成战略矿产
🧠 本期要点1) Google资深科学家Sergei Vassilvitskii将于5月5日与欧盟反垄断官员会面,反对欧盟强制其向OpenAI等竞争者共享搜索引擎数据。2) 美国政府将Google、Microsoft和xAI的新模型纳入安全测试,BBC与Axios于5月5日报道白宫正权衡行政令,拟要求前沿模型上市前通过联邦安全评估。3) OpenAI于5月4日敲定100亿美元企业部署合资项目,已从TPG、Brookfield Asset Management、Advent和Bain Capital募集超40亿美元。4) Micron 2026年HBM产能已被全部预售,TD Cowen于5月5日披露,Gartner预测全球内存收入将从2025年2163亿美元增至2026年6333亿美元。5) Anthropic工程页于5月6日清晨更新Claude Code auto mode功能:默认需用户批准命令执行,实际授权接受率为93%,旨在平衡沙箱安全与操作效率。6) SoundHound于5月5日发布OASYS(Orchestrated Agent System),宣称企业可几分钟内创建自我构建、持续学习并覆盖数字与物理渠道的对话智能体。⏱ 时间线00:38 Google资深科学家Sergei Vassilvitskii将于5月5日与欧盟反垄断官员会面,反对欧盟强制其向OpenAI等竞争者共享搜索引擎数据。01:30 美国政府将Google、Microsoft和xAI的新模型纳入安全测试,BBC与Axios于5月5日报道白宫正权衡行政令,拟要求前沿模型上市前通过联邦安全评估。02:25 OpenAI于5月4日敲定100亿美元企业部署合资项目,已从TPG、Brookfield Asset Management、Advent和Bain Capital募集超40亿美元。03:17 Micron 2026年HBM产能已被全部预售,TD Cowen于5月5日披露,Gartner预测全球内存收入将从2025年2163亿美元增至2026年6333亿美元。04:23 Anthropic工程页于5月6日清晨更新Claude Code auto mode功能:默认需用户批准命令执行,实际授权接受率为93%,旨在平衡沙箱安全与操作效率。05:16 SoundHound于5月5日发布OASYS(Orchestrated Agent System),宣称企业可几分钟内创建自我构建、持续学习并覆盖数字与物理渠道的对话智能体。
-
78
2026年5月:AI算力:光缆内存,物理层之战
AI产业正经历一场物理层面的“地震”,主要体现在OpenAI打破了与微软的独家绑定、AI服务器对光模块的需求远超现有产能,以及HBM供应严重短缺并加速DDR6内存研发。这些现象共同揭示了AI技术扩张速度已超越物理制造周期,导致AI基础设施走向主权化、内存架构范式转移,并最终形成硬件定义软件的趋势,甚至可能导致初创公司因硬件瓶颈而倒闭。OpenAI打破云厂商绑定与市场重塑OpenAI将Codex模型(含Codex-4.2和Codex-Agent Pro)全面接入Amazon Bedrock平台,结束与微软的独家绑定,带来400万周活用户。此举打破大模型厂商与云厂商绑定模式,加速GPU通用化部署压力,并倒逼国内云厂商在6个月内推出兼容Codex API的国产替代方案。对NVIDIA而言,H100出货结构将被迫调整,面向Azure的定制版订单占比或从68%降至52%。市场竞争白热化,将催生专注于Prompt编排、RAG加速等“Codex中间件”创业项目。光模块产能瓶颈与AI基建主权化Applied Optoelectronics (AOI) 获德州2090万美元补贴,扩建硅光子产线,目标2026年底实现月产5万只1.6T CPO模块。B300服务器单机需128个1.6T光模块,全球产能仅能满足35%需求,导致NVIDIA B300交付周期从18周延长至24周。美国首次以州级财政直接补贴光通信设备商扩产,标志着AI竞争主战场正从芯片设计下沉到光芯片制造细节。AI基建主权化加速,全球将形成独立光互连技术路线,预计2027年后跨区域数据中心互联成本将上升300%。内存供需失衡与DDR6技术迭代三星、SK Hynix、Micron同步启动DDR6内存研发,目标2028–2029年商用,速率较DDR5提升120%。HBM供应缺口已扩大至2027年,全球HBM3年产能仅够支撑1900台B300服务器,不足英伟达全年规划出货量的1/8。内存正取代GPU成为AI扩张第一瓶颈,DDR6的设计是为“CPU主导推理”服务,将成为新的性能分水岭。对中国存储厂商(长鑫存储、长江存储)而言,DDR6是弯道超车机会,但需突破EUV光刻胶和High-K介质薄膜壁垒。AI扩张与物理极限的结构性冲突AI扩张速度与物理制造周期(如GPU设计18个月、光模块爬坡24个月、HBM3基板认证36个月)存在根本错配。资本虽涌入AI基建,但无法缩短晶圆厂建设周期,所有AI公司都面临“物理延迟窗口”。长期趋势包括AI基建主权化加速、内存架构范式转移(倾向CPU主导推理),以及硬件定义软件(Agent性能SLA直接写入硬件寄存器)。预测2026年底前,可能出现首个因光模块短缺而倒闭的AI初创公司,这代表了物理世界对摩尔定律幻觉的“终极清算”。
-
77
算力烧钱之后,供应链成赢家
🧠 本期要点1) OpenAI将Codex等最新模型接入AWS Bedrock,由AWS向企业客户分发,Codex周活跃用户已超400万。2) 白宫可能要求新模型在公开发布前接受审查,监管节点从使用约束提前到发布前闸门,头部实验室需准备安全评估和政府沟通。3) OpenAI销售负责人Dyett离职,转投Thrive Capital担任Operator in Residence,显示模型公司商业化人才在资本网络间流动。4) FII一季度净利润同比增长102%,计划2026年Q3量产CPO全光交换机,目标超一万台,推动代工厂向数据中心网络核心靠近。5) Samsung、SK hynix和Micron推进DDR6,目标2028-2029年商业化,规格8.4Gbps起步,最高17.6Gbps,内存短缺或延续至2027年。6) Replit CEO晒出运行状态:10个active、198个draft、超700个done,体现智能体平台以任务吞吐和状态队列证明价值。⏱ 时间线00:43 OpenAI将Codex等最新模型接入AWS Bedrock,由AWS向企业客户分发,Codex周活跃用户已超400万。01:39 白宫可能要求新模型在公开发布前接受审查,监管节点从使用约束提前到发布前闸门,头部实验室需准备安全评估和政府沟通。02:30 OpenAI销售负责人Dyett离职,转投Thrive Capital担任Operator in Residence,显示模型公司商业化人才在资本网络间流动。03:21 FII一季度净利润同比增长102%,计划2026年Q3量产CPO全光交换机,目标超一万台,推动代工厂向数据中心网络核心靠近。04:21 Samsung、SK hynix和Micron推进DDR6,目标2028-2029年商业化,规格8.4Gbps起步,最高17.6Gbps,内存短缺或延续至2027年。05:26 Replit CEO晒出运行状态:10个active、198个draft、超700个done,体现智能体平台以任务吞吐和状态队列证明价值。
-
76
2026年5月:AI主权分治,技术让位地缘信用
2026年,AI产业正经历一场深刻的估值与权力结构重塑。Anthropic虽被美国国防部排除在涉密网络之外,却以高达9000亿美元的估值目标吸引资本对冲地缘风险。与此同时,OpenAI正豪赌AI手机和“Agent替代App”模式,试图颠覆传统手机生态,而各国政府对AI供应链和数据安全的严格要求,预示着AI产业正从技术竞争转向地缘政治与主权分治的新时代。Anthropic估值暴涨与地缘风险对冲Anthropic寻求500亿美元融资,目标估值达9000亿美元,远超2月3800亿估值,年收入接近400亿美元。其被美国国防部因“供应链风险”(训练集群部分GPU在新加坡,模型备份在爱尔兰)排除在IL6/IL7级涉密网络之外。资本市场对Anthropic的高估值体现了对冲地缘风险的策略,将商业价值与国家安全准入区分开来。OpenAI布局AI手机与Agent OSOpenAI计划与高通、联发科合作,开发AI芯片并推出AI手机,目标2028年量产。核心理念是“Agent替代App”,通过AI代理直接完成任务,旨在终结App商店的抽成模式并改变手机底层逻辑。苹果已紧急在iOS 19中加入Agent框架,但A18芯片缺乏专用NPU,可能使iPhone 17成为“最后一代App手机”。地缘政治重塑AI产业合规标准美国国防部要求AI能力部署于IL6(机密)和IL7(绝密)级涉密网络,并排除了有供应链风险的公司。NVIDIA的Blackwell架构虽获IL7认证,但必须在2026年底前实现芯片制造全部本土化,否则后续订单可能被冻结。中国AI公司若想进入特定政府采购市场,需主动披露所有训练数据地理分布并接受第三方审计,要求比欧盟GDPR更严苛。AI权力结构解构与“主权分治元年”当前AI行业面临资本定价权、国家准入权、终端定义权的三重解构,这些权力正从OpenAI等少数公司手中加速剥离。未来AI公司市值不再仅取决于技术指标,更在于能否获得华盛顿、布鲁塞尔、北京等地的“可信背书”。2026年被定义为AI的“主权分治元年”,标志着技术让位于地缘信用,AI发展将变得更加复杂。
-
75
Google拿下五角大楼,Anthropic拒绝:大模型政府采购的边界战
🧠 本期要点1) Google在Anthropic拒绝后扩大五角大楼对其模型能力的访问,Anthropic强化“边界优先”品牌信号,Google推进政府云、合规审计和模型调用权限成为新竞争点。2) Applied Optoelectronics获得2090万美元Texas Semiconductor Innovation Fund拨款,计划建设2.8亿美元工厂。3) 2026年5月,Micron、Samsung和SK hynix面临HBM和服务器DRAM需求推高收入,内存短缺可能延续至2027年,Micron计划投入250亿美元扩充制造能力。4) Ambiq推出compressionKIT方案,面向边缘设备可将内存和功耗压力最高降低20倍,影响语音、传感器和低功耗视觉任务在设备本地的完成能力。5) JetBrains AI Assistant面向Visual Studio Code提供,将能处理复杂任务的coding agent放入VS Code。6) Hugging Face Spaces已支持超过50万个应用,覆盖Streamlit、Gradio、Docker和静态应用,形成模型演示、数据集验证和轻量产品原型的低门槛分发网络。⏱ 时间线00:31 Google在Anthropic拒绝后扩大五角大楼对其模型能力的访问,Anthropic强化“边界优先”品牌信号,Google推进政府云、合规审计和模型调用权限成为新竞争点。01:20 Applied Optoelectronics获得2090万美元Texas Semiconductor Innovation Fund拨款,计划建设2.8亿美元工厂。02:13 2026年5月,Micron、Samsung和SK hynix面临HBM和服务器DRAM需求推高收入,内存短缺可能延续至2027年,Micron计划投入250亿美元扩充制造能力。02:57 Ambiq推出compressionKIT方案,面向边缘设备可将内存和功耗压力最高降低20倍,影响语音、传感器和低功耗视觉任务在设备本地的完成能力。03:53 JetBrains AI Assistant面向Visual Studio Code提供,将能处理复杂任务的coding agent放入VS Code。04:34 Hugging Face Spaces已支持超过50万个应用,覆盖Streamlit、Gradio、Docker和静态应用,形成模型演示、数据集验证和轻量产品原型的低门槛分发网络。
-
74
模型进工作台、智能体算成本、开发者管调度:AI产业正撕掉“聪明”标签
本期要点1) Claude Security向Enterprise客户开放公开测试版,安全团队可直接用Opus 4.7进行代码审查和风险排查,零自建集成门槛。2) Sam Altman表示更希望模型更便宜、更快,提到“五点五 xhigh in fast mode”体验不错,头部实验室优先级转向速度和成本。3) Vibe-kanban维护者宣布关闭公司化运营,项目仍有3万月活但无商业闭环,团队复盘称未做企业销售或转售token。4) Peter Steinberger发布Crabbox 0.3.0版本,新增远程Linux运行、GitHub登录、AWS镜像创建等六项运行能力,修复npm安装问题。5) Replit CEO强调10个项目各配10个并行智能体的用法,开发平台竞争从单次生成质量转向任务编排和成本控制。6) Box CEO提出思想实验:生命科学公司10年前因缺工程师削减自动化项目,现在同一批工程师可用模型输出获得更高产出倍数。时间线00:32 Claude Security向Enterprise客户开放公开测试版,安全团队可直接用Opus 4.7进行代码审查和风险排查,零自建集成门槛。01:29 Sam Altman表示更希望模型更便宜、更快,提到”五点五 xhigh in fast mode”体验不错,头部实验室优先级转向速度和成本。02:22 Vibe-kanban维护者宣布关闭公司化运营,项目仍有3万月活但无商业闭环,团队复盘称未做企业销售或转售token。03:17 Peter Steinberger发布Crabbox 0.3.0版本,新增远程Linux运行、GitHub登录、AWS镜像创建等六项运行能力,修复npm安装问题。04:16 Replit CEO强调10个项目各配10个并行智能体的用法,开发平台竞争从单次生成质量转向任务编排和成本控制。05:07 Box CEO提出思想实验:生命科学公司10年前因缺工程师削减自动化项目,现在同一批工程师可用模型输出获得更高产出倍数。05:30 这里的时间锚点是10年,关键数字不是招聘人数,而是同一批工程师能获得的产出倍数变化。
-
73
2026年5月:AI提效背后,是裁员还是扩招?
该节目深入探讨了AI竞争逻辑的根本性转变,指出AI正从单纯的技术模型进步转向实际应用、商业化和资源分配。通过Box CEO关于AI促进就业的观点、OpenAI精细化的代币定价模式以及Meta为投入AI基础设施而进行的裁员案例,文章阐明了AI如何提升生产力、细化成本管理,并驱动企业进行战略性资源重构,最终强调AI竞争的胜负手在于结果交付、产业协同和真实场景落地。AI对就业与企业战略的影响生产力飞跃与扩招趋势: Box CEO亚伦·莱维认为,AI能使工程师效率提升2-5倍,这将促使公司因生产力提高而招聘更多员工,而非裁员,以满足经济中大量未被满足的需求。赋能传统行业: AI使生命科学等传统公司能够获得与顶尖科技企业“完全相同”的AI输出能力,有效拉平技术差距,解锁过去因人才和成本限制而无法实现的项目。Meta的战略性资源重构: Meta的裁员并非直接源于AI取代工作,而是公司为大规模投资AI计算基础设施(而非人力)所做的战略性选择,以构建“AI原生”结构和自主AI智能体。AI服务商业化与精细化定价模型基于Token的成本核算: OpenAI Codex采用基于“tokens”(AI处理和生成文本的最小单位)消耗的定价模式,将AI服务成本透明化和精细化,使用户需根据实际使用量付费。效率与成本效益: 更高效的AI模型(如GPT-5.5)能以更少的tokens实现相同甚至更好的结果,鼓励用户在相同成本下完成更多任务,促使企业精准评估并选择最适合的AI服务。推动大规模应用: 这种精细化定价反映了AI服务从实验室走向大规模商业化过程中对资源分配和成本效益的极致考量,通过促销活动鼓励用户深入探索和使用AI。AI竞争逻辑的根本性转变从模型到结果交付: AI竞争的核心不再是单一模型的强大程度,而是谁能更好地将AI能力整合进产品、基础设施和实际工作流,实现“结果交付”,而非单纯的“技术能力展示”。产业协同与场景落地: AI的热点已从模型升级转向产品、基础设施和真实使用场景的联动,成功的AI产品是那些能够“帮你完成任务”的产品。工作流与基础设施为胜负手: 模型是AI的引擎,但在当前阶段,工作流优化、基础设施建设和用户真实体验与应用才是决定AI竞争胜负的关键。
-
72
2026年5月:AI基础设施与智能体拐点
AI领域正经历一个关键转折点,焦点已从单一模型的性能竞赛转向构建一个全面的“AI全栈系统”。这一趋势体现在底层基础设施的升级、AI模型与开发工具的精细化、应用生态的爆发式增长,以及具备自主性和商业运作能力的AI代理的崛起,最终将推动AI在物理世界的落地。AI基础设施的战略转型三星网络业务营收下滑,将战略重心转向 AI和数据中心 市场。积极投入 硅光子 (Silicon Photonics) 和 共封装光学 (CPO) 领域,旨在大幅提升数据传输速度并降低能耗。目标是成为AI数据中心 高速互联 的关键供应商,实现从传统电信市场向AI驱动增长市场的转型。AI模型与开发工具的精细化OpenAI 推出 gpt-5.5、gpt-5.4 等更精细化模型,专为复杂编码、知识工作和代理工作流设计,兼顾性能与效率(如gpt-5.4-mini)。模型发展趋势是提供 专业化“工具箱”,而非“一招鲜”的通用模型。JetBrains AI Assistant 将AI能力深度集成到开发环境,支持代码补全、聊天编程、多文件编辑,并可选择不同 LLM。引入 智能编码代理 (Smart Coding Agent) 概念,协调多个AI模型完成复杂任务。AI应用生态与自主代理的兴起Hugging Face Spaces 展示了AI应用在游戏AI、模型基准测试、微调等多个垂直领域的广泛渗透和复杂化。应用正从单一功能向 多代理协作系统 发展。AI黑客松项目如 ShadowNPM 和 Sendero 强调 “结果导向”与“责任制”,展示了AI代理解决实际问题的能力。AI代理的价值交换与商业模式通过利用 微支付 (nanopayments) 和 链上结算,使AI代理能够自主进行价值交换。AI代理不再是免费工具,它们能创造、消耗价值,甚至为自身行为承担后果,预示着“自主经济体”的出现。这代表着一种深远的 商业模式创新,将AI代理融入经济活动。物理世界中AI的具身化Figure和1X 等公司正大规模生产 人形机器人 (每周55台),提前布局物理硬件。这些机器人将成为未来AI代理的 “身体”,用于执行需要物理交互的任务。预示着AI将从虚拟世界走向物理世界,实现真正的具身智能。
-
71
算力烧钱之后,供应链成赢家
🧠 本期要点1) OpenAI在5月2日更新开发者文档,明确模型使用边界:复杂编程优先用gpt-5.5,轻量任务用gpt-5.4-mini。2) Bank of America统计显示,四大超大规模云厂商今年资本开支预期合计7100亿美元,2027年可能超1万亿美元,其中Alphabet预期1850亿美元。3) News9live报道,Meta计划在5月20日裁减约10%员工,并警告后续裁员可能延续到2026年底;Mark Zuckerberg将压力指向基础设施支出上升。4) Tom’s Hardware汇总Samsung和SK hynix财报信号:Samsung半导体部门一季度营业利润53.7万亿韩元,约361亿美元。5) Fierce Network报道,Samsung网络业务转向数据中心客户,明确开发硅光子组件和CPO技术,目标降低高带宽集群内部功耗和延迟。6) Industrial Equipment News报道,Applied Optoelectronics获2100万美元补助,在德州Sugar Land投资2.8亿美元建新厂。⏱ 时间线00:00 OpenAI在5月2日更新开发者文档,明确模型使用边界:复杂编程优先用gpt-5.5,轻量任务用gpt-5.4-mini。00:32 Bank of America统计显示,四大超大规模云厂商今年资本开支预期合计7100亿美元,2027年可能超1万亿美元,其中Alphabet预期1850亿美元。01:33 News9live报道,Meta计划在5月20日裁减约10%员工,并警告后续裁员可能延续到2026年底;Mark Zuckerberg将压力指向基础设施支出上升。02:32 Tom’s Hardware汇总Samsung和SK hynix财报信号:Samsung半导体部门一季度营业利润53.7万亿韩元,约361亿美元。03:32 Fierce Network报道,Samsung网络业务转向数据中心客户,明确开发硅光子组件和CPO技术,目标降低高带宽集群内部功耗和延迟。04:37 Industrial Equipment News报道,Applied Optoelectronics获2100万美元补助,在德州Sugar Land投资2.8亿美元建新厂。05:31 同一条光链路上,美国本土光模块产能也在加码。
-
70
2026年5月:AI智能体走向产业深水区
AI行业正经历一场深层次的“工业化”转型,标志着其从单纯追求模型能力转向产品化、基础设施建设和真实应用场景的全面联动。这体现在OpenAI模型与定价策略的精细化,以及微软Agent Framework和Hugging Face Spaces等基础设施的演进,预示着AI竞争已进入产品化、生态化和工业化的全面较量阶段,促使行业关注如何将AI能力转化为实际解决方案。OpenAI模型与定价策略的深度演进模型细分与专业化: OpenAI的Codex系列模型(如GPT-5.5、5.4、5.4-mini、5.3-Codex-Spark)不再是单一通用模型,而是针对不同场景和性能需求进行分级优化。精细化定价模式: 引入基于“信用点”的计费方式,根据每百万token的输入/输出消耗(如GPT-5.5输入125、输出750信用点)以及订阅层级来计算费用。成本管理与效率优化: 提供优化使用指南,鼓励开发者通过控制提示词大小、限制服务器数量或切换更小模型等方式管理成本,强调投入产出比。AI智能体框架与应用基础设施的崛起微软Agent Framework: 开源的智能体框架,提供工具和组件以构建、部署和管理AI智能体,支持Azure AI内容理解、持久化工作流和动态工具扩展。Hugging Face Spaces: 提供AI应用部署、托管和分享平台,支持从免费CPU到TPU等多种硬件选项,并集成Git版本控制和秘密管理功能。生态系统协同: 这些平台共同降低了AI应用开发的门槛,鼓励社区协作和创新,使AI开发从调用API升级到构建智能体系统。AI产业化与商业化落地的趋势黑客马拉松焦点转变: “Catapult 2026”等活动强调“影响力”和“商业可行性”,引导AI技术转化为实际解决方案和创业项目。竞争重心转移: AI竞争焦点已从单一模型能力转向如何将模型封装成产品、构建基础设施并融入实际工作流。进入“深水区”: 行业不再单纯追逐模型参数,而是专注于通过创新的产品形态、高效的基础设施和优化的工作流,将AI能力转化为可交付、可规模化并解决实际问题的解决方案。
-
69
2026年5月:AI狂砸2000亿
🧠 本期要点1) OpenAI发布Codex产品分层,从Free到Enterprise全覆盖,按任务强度对应gpt-5.5、gpt-5.4、gpt-5.4-mini和gpt-5.3-codex-spark四档模型。2) Codex定价:ChatGPT Pro 100美元档在5月31日前享双倍用量;Pro 200美元档常态20倍Plus额度,同期可达25倍。3) 欧盟将云服务与AI基础设施纳入DMA监管视野,正调查亚马逊和微软是否应被认定为守门人。4) 欧盟AI Act将于2026年8月全面适用,透明度规则同步落地,合规压力开始向平台层传导。5) 四大科技巨头(Alphabet、微软、Meta、亚马逊)AI相关支出今年合计或达6000亿美元,本周财报是市场检验回报的集中窗口。6) 微软上调2026年资本开支至1900亿美元,亚马逊维持2000亿;两家同步宣布大规模裁员,资本开支扩张与组织降本并行。⏱ 时间线00:03 开场:AI竞争进入产品化、监管与资本回报同时上强度的阶段。00:40 OpenAI Codex产品分层:四档模型覆盖从Free到Enterprise。01:28 Codex定价细节:双倍用量促销与长期额度策略。02:02 欧洲监管:欧盟将云服务和AI基础设施纳入DMA视野。02:44 EU AI Act时间表:2026年8月全面适用,合规压力临近。03:12 资本市场:四大巨头6000亿AI支出,财报季检验回报。03:41 资本开支分化:微软1900亿、亚马逊2000亿,各家节奏不同。04:14 强烈反差:千亿资本开支与大规模裁员同步进行。04:44 结语:AI行业进入第二阶段,市场只相信能兑现的那一部分。
-
68
2026年4月:谷歌Meta财报分化,AI烧钱游戏谁在裸泳?
2026年,AI产业正从盲目“烧钱”转向追求投资回报率的“效率战争”。华尔街对AI投资的审视变得空前严格,要求企业展示清晰的变现路径;与此同时,中国AI生态在摆脱对美国芯片依赖方面取得关键进展,以DeepSeek V4与华为昇腾的合作为代表,正形成独立且成本效益更高的AI计算闭环;此外,AI技能已不再是高级岗位的专属,而是迅速渗透到初级岗位,成为劳动力市场的必备要求。AI投资转向效率竞赛财报分化揭示市场新风向:Alphabet因AI贡献收入股价大涨,而Meta虽投入巨大但因缺乏即时ROI导致股价下跌,表明市场对“AI投入”的耐心已耗尽。资本支出不再是免罪金牌:过去“投资AI”即可获市场认可的时代已过,现在投资者要求看到AI投资如何转化为实际增长和收入,而非仅关注投资规模。竞争核心从能力转向商业化:AI竞赛焦点已从“模型能力强弱”转向“商业化效率”,即谁能更快地将AI技术变现、降低成本并嵌入现有业务。中国AI生态独立化进程加速DeepSeek V4引爆华为芯片需求:DeepSeek发布针对华为昇腾950芯片优化的V4模型后,字节、腾讯、阿里等巨头争相订购昇腾芯片,推动中国AI供应链“去美国化”。华为昇腾性能赶超英伟达H20:华为昇腾950PR在某些性能上已优于英伟达此前对华出口的最强芯片H20,并计划2026年下半年实现全面量产。模型+芯片闭环降本增效:DeepSeek V4专为华为芯片优化,未来V4-Pro模型定价将大幅下降,预示中国AI生态形成独立、低成本的推理计算能力。AI技能成为职场新常态AI能力渗透初级和实习岗位:Handshake报告显示,2026年3月,10.3%的实习岗位和4.2%的全职初级岗位已明确要求AI相关技能,比例是去年的两倍。AI技能要求广泛且基础化:AI能力不再是高级工程师专属,而是覆盖工程(NLP、推理系统)到创意(数字设计)的广泛领域,成为初级职位的基本门槛。教育与招聘体系加速调整:普渡大学等教育机构已将“AI工作能力”设为毕业要求,表明教育和企业招聘标准正为适应AI时代进行结构性变革。创新产品与监管洞察Agentic劳动力管理兴起:Insygna公司以其Agentic Workforce Management™平台获胜,专注于管理AI Agent的“人力资源”问题,应对AI治理和合规需求(如欧盟AI法案)。国防AI应用升级为“指挥系统”:Scout AI获得1亿美元融资,开发国防无人车队操作系统“Fury”,显示AI在国防领域正从单兵武器向复杂指挥系统演进。AI基础设施投资热潮与泡沫警示:Parallel Web Systems在短时间内估值飙升至20亿美元,显示AI基础设施赛道持续火热,但也伴随着市场对潜在泡沫的警惕。
-
67
扎克伯格烧炉被打脸,奥特曼出云投亚马
🧠 本期要点1) AI观测站 · 周长文 vol.22) 本周主线:AI 江湖第一次见红——钱见红、联盟见红、地缘见红、岗位见红,四桌一起翻。3) 【本周江湖四件大事】4) 4/29 财报夜:Meta 把 2026 capex 区间从 1150–1350 亿美元上调到 1250–1450 亿美元,盘后跌约 7%;Alphabet 营收 1099 亿、谷歌云 200 亿(+63%)、积压订单 4620 亿,皮查伊一句"我们 compute constrained",盘后涨。市场不再为"AI 投资"自动付费,开始挑食。5) 4/27–4/28:微软-OpenAI 修改协议,原"独占至 AGI"改成"非独占许可至 2032 年";OpenAI 上 AWS Bedrock,GPT-5.4 立用、GPT-5.5 即将上、Codex 与 Managed Agents 同步落地。云这一档差异化武器从"模型独家"翻面。6) 4/28–4/29:DeepSeek V4 + 华为 Ascend 950PR(今年量产 75 万颗)+ 小米 MiMo-V2.5 开源 + Orbit 百万亿 Token 30 天补贴——东边"模型 + 国产芯 + Token 补贴"第一次合龙。7) 4 月底就业极化:Handshake 报告 10.3% 实习岗位 JD 提 AI(同比近翻倍);Meta 裁约 8000 人腾 AI 资金;Accenture 给 74.3 万员工全员 Copilot;独立开发者 Tibo 的 Revid MRR 突破 60 万美元。8) 【时间戳】9) 00:00 开场 · 本周不发模型,发账单10) 03:30 第一回 · 扎克伯格烧炉被打脸,皮查伊数算赚得满堂红11) 12:00 第二回 · 奥特曼出云投亚马,纳德拉手里少一票12) 20:30 第三回 · 梁文锋接棒华为甲,雷军开炉撒百亿
-
66
小米MiMo开源:百万亿Token激励,抢占Agent开发者
小米近期发布并开源了其MiMo-V2.5系列大模型,同时启动“MiMo Orbit 百万亿 Token 创造者激励计划”。此举旨在通过技术开放和生态激励,积极抢占AI Agent时代的开发者入口,明确展示了小米在AI领域的最新技术进展及其构建开放AI生态的战略意图。MiMo-V2.5 模型系列能力核心模型:包含旗舰推理模型MiMo-V2.5-Pro(擅长Agent/Coding复杂任务)和原生全模态模型MiMo-V2.5(理解文本、图像、视频、音频,具Agent能力)。长上下文窗口:两款模型均支持100万(1M)Token上下文,可处理相当于整本厚书或几十轮对话的超长信息,如自主编写编译器。语音能力:V2.5系列包含支持文本描述造音色、零样本克隆及多语种识别的TTS/ASR模型,达到中英SOTA水平。卓越性能与Token效率国际基准表现:MiMo-V2.5-Pro在Coding Agent、SWE-Bench Pro等多项权威测试中逼近Claude Opus 4.6、GPT-5.4,并大幅超越Gemini 3.1 Pro。高Token效率:在ClawEval标准Agent任务中,MiMo仅用约7万Token即达64%通过率,比其他顶尖模型节省40%-60%的推理成本。开放策略与生态构建全面开源:MiMo-V2.5系列模型(含Base模型权重)在MIT协议下全量开源,允许自由商用、二次训练和微调。MiMo Orbit激励计划:百万亿Token激励:30天内向全球开发者免费发放100万亿Token权益,最高可获价值约659元人民币的16亿Credits。Agent生态共建:为全球新兴Agent框架团队提供MiMo Token限免及底层适配技术支持,降低用户体验门槛。广泛的生态集成芯片厂商适配:开源首日即完成阿里平头哥、亚马逊云科技、AMD、百度昆仑芯等多个主流芯片厂商的接入适配。推理框架支持:同步完成SGLang和vLLM等主流推理框架的Day-0适配,确保模型广泛可用性和易用性。
-
65
开源热度撞上使用门槛:点赞算使用吗?
🧠 本期要点1) 00:44 微软 Azure 云计算业务本季度收入增长 40%,企业级算力和云服务需求仍在支撑云平台增长。2) 01:38 Meta 上调 2026 年资本支出预期,AI 基础设施投入继续加码,GPU、电力和数据中心需求被再次抬高。3) 02:43 国内大厂抢订华为 Ascend 950,DeepSeek V4 带动国产算力从适配叙事进入订单和量产验证期。4) 03:49 Anthropic 发布 Claude 连接器,把 Adobe、Blender、Fusion 等专业软件入口接入 AI 助手工作流。5) 04:51 Scout AI 完成 1 亿美元 Series A 融资,无人驾驶防务车辆编队和操作系统成为资本关注点。6) 05:53 Apple 计划在 iOS 27 加入 Siri 相机模式,视觉智能将从快捷入口进入系统相机。7) 06:53 真正跑赢这一轮的,不是单点模型或单次预算上调,而是算力、工具链和终端入口的组合能力。
-
64
2026年4月:AI“联姻”生变,创业范式颠覆
2026年4月,AI行业正经历一场深层权力结构调整:OpenAI不再独家绑定微软Azure,转向多云策略,为企业客户带来更多选择,也促使微软加速自研和投资步伐。同时,企业AI的价值正被量化,麦格理银行通过使用Google Gemini Enterprise证明了显著的投资回报率。此外,AI工具赋能独立开发者崛起为“超轻量级企业”,如一人团队月入百万美元,挑战了传统的创业和VC投资模式。OpenAI云策略的转变OpenAI正式入驻亚马逊AWS,提供GPT-5.5、Codex和Bedrock Managed Agents等服务。Sam Altman确认OpenAI与微软更新合作协议,允许OpenAI在“所有云端”提供服务,微软不再享有独家优先权。此举让企业客户在调用OpenAI模型时有更多云服务选择,但对微软的“AI优先”战略叙事构成冲击。微软或将加速自研模型(如MAI-1)部署,或加大对Anthropic、Mistral等其他AI公司的投资以对冲风险。企业AI价值的量化与落地澳大利亚麦格理银行使用Google Gemini Enterprise七个月后,累计节省了13万工时。该行近80%的5000名员工日常使用Gemini Enterprise,验证了企业AI能带来真实、可量化的投资回报率(ROI)。麦格理银行通过让风控团队参与AI安全边界制定,成功推动AI在保守金融机构内部的应用。Google Gemini Enterprise因此获得强有力的顶级客户背书,为企业AI采购提供“硬通货”案例。独立开发者与“超轻量级企业”的崛起独立AI开发者Tibo凭借产品Revid实现月收入超100万美元,月经常性收入(MRR)超过60万美元。AI工具赋能单人完成产品开发、营销及部分客服,颠覆SaaS(软件即服务)行业对规模化团队的传统认知。AI编码代理(如Andrej Karpathy提及的工具)显著改变编程工作流,使得一个开发者配AI工具即可完成复杂任务。这挑战传统VC(风险投资)的投资逻辑,SaaS估值模式可能从看重收入倍数转向更看重利润倍数。AI产品与安全新动态Anthropic推出Claude Design,将多模态AI能力扩展到视觉设计领域,并强调无广告模式。GitHub发布开源Security Lab Taskflow Agent,利用AI代理自动化发现代码中的高风险漏洞,实现主动AI安全防御。JetBrains将其AI助手扩展到VS Code平台,旨在激烈的AI编码工具竞争中保住市场份额。
-
63
2026 年 4 月:AI军备烧钱换人,谁为1150亿买单?
本期要点1) OpenAI在AWS Bedrock上线最新模型和Codex编码智能体,Codex周活跃用户超400万,Bedrock侧打包IAM、PrivateLink等企业控制功能。2) Google允许美国国防部在机密网络中使用其模型服务,成为继OpenAI和xAI后第三家满足五角大楼需求的头部公司,相关条款法律约束力不明。3) 美国国家地理空间情报局在Workday Federal Forum上披露,将智能体系统引入业务运营,计划3到5年完成劳动力与IT基础设施转型。4) 麦格理银行使用Gemini Enterprise七个月后,近80%的5000名员工每天使用,累计节省13万小时生产力,通过风险团队先行试点实现落地。5) Meta将在美东周三盘后发布一季度业绩,市场关注Muse Spark、广告效率和1150亿美元基础设施资本开支的回报。6) 马斯克与Sam Altman的诉讼进入陪审团遴选阶段,马斯克寻求1500亿美元赔偿,证人包括Altman、Nadella、Sutskever等。7) 马斯克与OpenAI的诉讼核心争议为2015年非营利组织转向营利化结构是否背离早期使命,预计打到5月下旬。
-
62
2026年4月:AI巨头裁员上天,操作系统也要重写?
AI的爆发式发展正以前所未有的速度重塑世界,驱动着劳动力市场、数字基础设施和能源供给的全面重构。这表现为企业在裁员或赋能之间权衡人力与AI投资,OpenAI呼吁重构为AI代理设计的操作系统与互联网,以及Meta探索太空太阳能以满足AI数据中心的巨大能耗。然而,在这一系列变革中,构建人与AI之间的信任成为关键挑战。劳动力市场重塑与企业策略• Meta裁员与投资AI: 裁员约8000人并关闭6000空缺职位,旨在为高达1150-1350亿美元的AI基础设施和研发资本支出腾出资金,并将工程人才重分配至AI工程团队。• Accenture全员赋能: 向全球74.3万名员工全面推广微软Copilot AI助手,通过AI工具提升现有员工效率和能力。• 人与AI的信任危机: Meta的裁员模式可能导致员工对AI的不信任;AI落地瓶颈在于如何处理人与AI关系及组织内部的信任机制。AI代理驱动的数字基础设施变革• 奥特曼呼吁重构: OpenAI CEO萨姆·奥特曼呼吁“重新设计操作系统和用户界面”,提出互联网应有“同时适用于人类和Agent的协议”。• GPT-5.5能力升级: OpenAI发布的GPT-5.5在Agentic coding、Computer use、知识任务和科研能力上显著提升,上下文窗口达到100万token。• Web架构冲击: 未来的互联网可能需要Agent友好型API和结构化数据,而非传统的人类图形用户界面,将根本性冲击依赖“人类浏览”的商业模式。AI发展带来的能源危机与解决方案• Meta投资太空太阳能: Meta与一家太空太阳能公司签署容量预留协议,计划通过卫星将太空太阳能波束传回地面,为AI数据中心供电。• 大规模商业部署: 该项目计划2028年进行演示,预计2030年实现商业部署,协议容量高达1吉瓦。• 能源供给瓶颈: AI数据中心巨大的能耗已超出现有地面能源供给能力,促使企业寻求激进的能源解决方案,推动核能、地热及太空太阳能产业链发展。构建可信赖AI的挑战与实践• 透明度与信任度: 零售业调查显示37%的年轻消费者认为品牌在使用AI时更透明则更值得信任。• 用户信任建立尝试: Anthropic的Claude Code Auto Mode通过“跳过权限”尝试解决用户对AI代理的“批准疲劳”;Garry Tan提出“三文件Agent人格法”来构建AI代理的可预测性和可信度。• 潜在风险与身份危机: AI可能“降低犯罪的道德门槛”,扩大欺诈者群体,如通过“提示注入”劫持AI代理,对社会信任造成系统性侵蚀。
-
61
2026年4月:咨询业巨变!74万Copilot,谁饭碗不保?
本期要点1) 00:37 微软与OpenAI正在修改协议,放松双方独家绑定关系;Yahoo Finance、iTnews和FT均于4月27日报道此事,正值财报周前夕。2) 01:42 Accenture将于近期向全部743,000名员工推广Microsoft Copilot,覆盖全球咨询业务全流程,非部门级试点。3) 02:38 9to5Google于4月27日APK拆解发现,Gemini应用正准备Proactive Assistance功能,支持读取Gmail、Calendar等应用、屏幕内容及通知。4) 03:41 Meta于4月27日宣布预订最多1吉瓦天基太阳能电力容量,计划2028年1月完成卫星太阳能传输演示,2030年商业化部署。5) 04:36 Anthropic于4月27日招聘最高年薪40万美元的企业活动岗位,职责含小型邀请制活动、大型会议、技术深潜及政策制定者沟通,需30%-40%出差。6) 05:38 Finextra于4月27日报道生成式AI工具降低犯罪心理门槛。7) 06:38 Morgan Stanley预计Magnificent Seven公司2026年净利润增长25%,标普其余493家公司仅11%,MAGS指数过去一个月涨13%,标普500同期涨9%。
-
60
2026年4月:Uber预算烧光,AI进入成本时代
当前AI行业正面临严峻的成本挑战,以Uber预算耗尽为代表的“烧钱”模式暴露出其不可持续性。为应对此困境,产业正经历一场深刻变革:一方面,AWS AgentCore等服务大幅简化了AI应用部署,降低了企业落地门槛;另一方面,以DeepSeek V4适配华为昇腾为标志,中国AI生态正加速走向自主化,并可能形成全球AI市场的“双轨制”。这些趋势共同指向AI价值创造将从模型性能转向更低的部署成本和更高的投资回报率。AI高成本陷阱与产业转型• Uber预算危机: 2026年AI预算仅用四个月即耗尽,暴露出“买GPU、跑推理”模式的缺陷。• “成本悬崖”挑战: 硬件成本线性增长,但AI收入增长滞后,导致企业面临巨大成本压力。• 行业洗牌加速: 无法证明AI投入投资回报率的企业将被迫收缩预算,推动市场转向更注重成本效益的解决方案。企业AI部署的商品化趋势• AWS AgentCore: 通过三个API调用将AI Agent部署流程标准化,极大简化了企业AI应用的集成和上线。• 降低落地门槛: 使缺乏AI基础设施的中型企业也能快速部署AI Agent,将工程时间从数周缩短至几小时。• 竞争焦点转移: 随着Agent部署的商品化,竞争将从“能否部署Agent”转向“谁拥有更好的Agent”和垂直场景的深度理解。中国AI生态的自主化与全球双轨制• DeepSeek V4适配华为昇腾: 顶尖国产模型在国产芯片上运行,形成“国产芯片-国产模型-国产应用”的完整闭环。• 技术突破与国际关注: DeepSeek V4编码能力对标美国头部模型,并引发美国对其知识产权的关注。• AI市场“双轨制”: 美国对华技术封锁效果递减,可能加速形成以Nvidia生态和华为/国产方案为主导的两大AI市场。AI价值创造的未来范式• 从“算力竞赛”到“价值产出”: AI行业重心从追求模型强大转向如何以更低成本、更快速度实现AI价值落地。• 三大层面变革: 需要硬件(如光互联、CPO)、模型效率(DeepSeek V4)和商业模式(按效果付费)的全面创新。• 垂直应用公司崛起: 当AI部署变得简单,拥有深刻业务理解并能用最少算力创造最大商业价值的垂直行业AI公司将受益。
-
59
奥特曼亮刀闯任务,梁文锋开卷会昇腾
【时间戳】00:00 开场 · 本周江湖三件大事03:05 第一回 · 奥特曼亮刀闯任务,五点五卡顿不上 API09:53 第二回 · 梁文锋开卷会昇腾,长卷低价压群雄18:05 第三回 · Codex 挂帅吞码头,键盘换成验收章25:10 第四回 · 图门重启印钞机,海报画师卷自家30:35 收 · 江湖换了三件事,你我各守一关口
-
58
2026年4月:DeepSeek刚硬刚,美国就反咬?!
🧠 本期要点1) 00:39 DeepSeek发布V4预览版,开源并主打代码能力,专门适配华为昇腾芯片,将国产算力纳入第一档底座。2) 01:31 美国国务院向全球合作伙伴发出警告,指控包括DeepSeek在内的中国公司涉嫌从美实验室窃取知识产权,重点指向模型蒸馏。3) 02:22 Snap与Qualcomm签署多年合作协议,旗下Spectacles眼镜将采用Snapdragon XR平台,计划2026年内出货。4) 03:11 AWS更新AgentCore,将企业设置智能体基础设施压缩到3个API调用,覆盖计算配置、认证、代码执行沙箱和持久化存储。5) 04:04 Humble Robotics完成2400万美元种子轮融资,由Eclipse领投,用于将模型能力落地仓储、制造或服务现场。6) 04:53 Tim Cook将10条主要新产品线交给继任者John Ternus,包括9月上市的折叠iPhone和定价599美元的MacBook Neo。7) 05:40 DeepSeek在4月24日发布V4预览版,路透社和CXO Digitalpulse同步报道,这一版本开源、主打代码能力,并专门针对华为昇腾芯片做了适配。
-
57
2026年4月:苹果不烧钱,AI巨头们的“豪赌”还剩多久?
AI行业正经历一场深刻的“烧钱悖论”,科技巨头在AI基础设施上投入巨资,商业回报却充满不确定性,苹果公司独特的谨慎策略成为其反面。文章深入剖析了AI对职场“职业阶梯”的隐性侵蚀,以及AI数据中心互联技术的革新,并预言2026年下半年将成为关键分水岭,届时商业化数据将揭示市场走向,决定各巨头策略的成败。AI投资策略分歧与“烧钱悖论”• 苹果的“另类”策略: 苹果预计将通过大规模股票回购和分红回馈股东,其AI战略偏向终端设备(如Apple Intelligence),未大规模自建算力或加入AI数据中心“军备竞赛”,与Alphabet、Amazon、Meta、Microsoft的巨额投资形成鲜明对比。• 市场反应与质疑: 市场未惩罚苹果的“保守”策略,暗示部分投资者认同其对AI商业回报不确定性的判断。这引发了对其他巨头烧钱投资何时能产生回报的疑问。• 2026年H2分水岭: 预测2026年下半年,若微软、谷歌、Meta的AI收入增长无法匹配其资本支出增速,苹果的“保守”将被重新定义为“明智”,其他巨头的“豪赌”将面临投资者拷问。AI对职场“职业阶梯”的隐性侵蚀• AI替代“任务”而非“工作”: Anthropic研究指出,AI正在包揽研究摘要、PPT制作、初稿撰写等入门级任务,而非直接取代整个工作。• “职业阶梯”消失: 这些入门级工作曾是职场新人积累经验、建立人脉、展示能力的必经之路,AI的介入导致其“打杂期”被压缩为零,企业不再需要“培养人”。• 长期结构性问题: 尽管宏观就业数据可能正常,但年轻人的长期职业发展路径被截断,可能导致未来缺乏经历过基层磨练的中层管理者。AI数据中心互联技术革新• CPO全光交换机: 富士康工业互联网计划在2026年Q3量产CPO(Co-packaged Optics)全光交换机,目标出货量超过10,000台。• 解决带宽瓶颈: CPO技术通过将光学引擎直接封装在芯片旁,大幅降低功耗和延迟,是解决AI数据中心内部带宽瓶颈的关键技术。• 改变行业格局: CPO的量产将直接改变AI芯片集群架构,挑战Nvidia NVLink等专有互联技术,加速AI硬件从“封闭生态”向“开放光互联”演进,提升光通信产业链(如Lumentum、Coherent、Marvell)的确定性。AI商业化前景与市场分水岭• 供应链繁荣与终端迷茫: 供应链环节(如SK海力士的HBM、富士康的CPO)因AI需求而获利,但这种繁荣能否持续取决于最终用户对AI产品的付费意愿,警示可能出现“军火商战争”效应。• 对投资者和创业者的建议: 投资者应关注光互联和存储芯片等确定性高的供应链环节,对纯模型公司和基础设施公司保持警惕;创业者应聚焦年度经常性收入和毛利率而非宏大叙事。• 从业者应对: 面对“职业阶梯”的消失,个人需主动学习AI工具,培养不可替代的人类技能以应对挑战。
-
56
2026年4月:AI杀进课堂,老师们都懵了?!
🧠 本期要点1) 00:46 OpenAI发布GPT-5.5,支持百万token上下文窗口,面向Plus、Pro、Business、Enterprise用户开放,重点提升智能体编程、电脑操作和知识任务。2) 01:51 Foxconn工业富联计划2026年第三季度量产CPO全光交换机超一万台,Omdia上调2026年半导体预测至62.7%。3) 02:55 Omdia判断全球存储紧张加剧,DRAM市场规模预计接近翻倍,NAND增长至四倍;SK海力士创纪录季度业绩,净利润跳升五倍。4) 04:04 Anthropic Engineering公开复盘Claude Code质量下降,定位三处变更,包括默认推理强度从high调至medium,已修复至v2.1。5) 05:12 NousResearch发布Hermes Agent v0.11,累计1556个commit、761个PR,新增AWS Bedrock支持、五条推理路径和QQBot平台。6) 06:25 斯坦福2026年指数报告显示,仅6%教师认为所在学校AI相关政策清晰,K-12教育系统制度落后于课堂现实。7) 07:28 4月24日,OpenAI发布GPT-5.5,搜索结果里的官方条目、Aaron Levie和Dan Shipper的开发者反馈同时出现。
-
55
2026年4月:国产AI闭环,世界正滑向两个平行宇宙
全球AI产业正经历一场由地缘政治而非纯技术驱动的“大分流”,形成两个平行的技术生态系统。这一趋势体现在中国AI实现国产化闭环、AI Agent获得记忆能力并大规模应用于企业,以及“主权AI”联盟的崛起。投资者需要重新调整策略,而芯片产能,尤其是华为昇腾的量产能力,将成为决定未来AI格局的关键变量。中国AI的自主闭环• DeepSeek V4与华为昇腾的适配: DeepSeek于4月24日发布V4模型,并宣布已深度优化并适配华为昇腾芯片,被路透社评价为“中国AI行业的大事件”。• 国产算力突破: 首次证明中国自研模型能在国产硬件上达到可用甚至领先水平,削弱美国芯片出口管制的影响。• 形成完整产业链: 中国AI产业链正在形成“模型-芯片-应用”的完全自主闭环,预示着全球可能出现基于英伟达CUDA和华为昇腾的两套技术栈。AI Agent的进化与企业部署• Anthropic Claude Agent的记忆功能: Anthropic于4月23日为Claude Managed Agents推出内置记忆功能,使其能跨会话学习并共享知识。• 从工具到“数字员工”: Agent从一次性工具进化为能持续学习和进化的“数字员工”,能够记住任务和用户偏好。• 大规模企业应用: PitchBook 2026年Q2报告指出企业AI部署已全面转向大规模Agent部署,未来可能出现“全Agent部门”。“主权AI”联盟的兴起• Cohere与Aleph Alpha合并: 加拿大AI公司Cohere与德国AI初创公司Aleph Alpha于4月24日合并,旨在打造“跨大西洋AI巨头”。• 独立于美国巨头: 该合并旨在为企业和政府提供美国科技巨头之外的独立选择,尤其强调数据主权和控制权。• 全球AI生态竞争: 这笔交易揭示AI行业正从技术竞赛转向“生态竞赛”和“地缘竞赛”,形成以DeepSeek、Cohere/Aleph Alpha等为代表的“主权AI”阵营。地缘政治驱动的AI生态分化• 投资逻辑重构: 过去寻找“下一个OpenAI”的模式将被“判断哪个生态会赢”所取代,需要根据生态系统选择投资策略。• 开源模型的战略价值: 开源模型(如DeepSeek V4开源、Meta的Llama系列)成为“生态战争”中的战略核武器,用于吸引开发者和对抗闭源霸权。• 竞争焦点转向效率: 当模型能力趋于同质化时,竞争焦点将从“谁的模型更强”转向“谁的模型更便宜、更可控、更适配本地需求”,AI效率取代AI能力成为核心叙事。关键变量:华为昇腾产能• 算力优化而非抢算力: 市场对AI芯片的需求依然旺盛,但焦点从“抢算力”转向“优化算力成本”。• 华为产能决定中国AI未来: 未来12个月最大的变量是华为昇腾生态能否在2027年之前实现规模化量产。• 全球AI权力格局: 华为解决产能问题将使中国AI真正摆脱对英伟达的依赖,若产能跟不上,“国产闭环”将难成产业冲击,芯片产能竞赛的胜负将决定未来五年全球AI产业的权力格局。
-
54
2026年4月:App已死?大学生iMessage里狂揽510万!
🧠 本期要点1) 00:45 DeepSeek推出面向华为Ascend芯片优化的新模型DeepSeek V4,Hugging Face上DeepSeek-V4-Pro获2395次点赞,许可协议为MIT。2) 01:48 Cohere收购并合并德国初创公司Aleph Alpha,打造跨大西洋服务商,旨在为企业和政府客户提供不依赖少数科技巨头的选择,强化数据独立性与控制权。3) 02:48 Casey’s扩大与SoundHound AI的合作,将点单智能体铺到超过2600家门店,智能语音从客服入口转向直接接入菜单、门店履约和收银流程。4) 03:48 ComfyUI估值达到5亿美元,为创作者提供节点式工作流工具管理模型、提示词和生成过程,资本开始为“控制层”定价。5) 04:48 PitchBook数据显示,2026年一季度后期风险债务交易达十年来高位,单笔交易中位数1080万美元,平均值6820万美元,资本密集型公司倾向用债务替代股权融资。6) 05:53 MrBeast计划进入原生生成式娱乐,Vigloo称生成式剧集占其片库10%,北京公司StoReel获3400万美元融资用于制作生成式微短剧。7) 07:08 内容公司趋向软件化,用数据和工具压缩试错周期,生成式娱乐竞争焦点转向产能、成本和版权边界。
-
53
2026年4月24日:AI效率明牌:裁员汹涌,科研也靠AI
原文探讨了2026年AI发展带来的“效率悖论”:一方面,AI技术正驱动Meta等科技巨头进行大规模裁员,并突破性地在研究领域超越人类;另一方面,AI对芯片等基础设施的巨大需求导致SK海力士等上游供应商利润暴增,形成财富高度集中的“赢家通吃”局面。这种趋势预示着AI正加速重塑就业市场和全球供应链,对人类工作价值构成严峻挑战。AI驱动的科技公司裁员潮• Meta宣布裁员约8000人并关闭6000个职位,其2026年资本支出(主要投向AI)预计飙升60%至1150亿美元。• Meta首席人事官明确指出裁员是为了“抵消AI基础设施投资”,公开承认AI替代人力。• 亚马逊(裁员1.6万人)、Block(裁员40%)、Salesforce和Snap等公司也同期进行大规模裁员,将AI替代作为公开策略。AI自主研究能力突破• Anthropic构建的自主AI代理在解决开放式研究问题时,表现超越人类研究人员。• 这些AI代理能够自主提出想法、运行实验并迭代,使AI从“研究工具”转变为“研究者本身”。• 此项突破意味着“AI研究AI”已可行,对知识生产模式构成根本性冲击。HBM芯片供不应求与供应链集中• SK海力士Q1利润同比增长超五倍,占据HBM市场57%的绝对主导地位,受AI需求驱动。• Omdia预测AI驱动的内存市场存在高达40%的供需缺口,HBM产能成为AI算力的瓶颈。• HBM已成为比GPU更稀缺的战略资源,导致财富高度集中流向少数芯片制造商,形成“赢家通吃”局面。
-
52
2026年4月24日:AI烧钱裁人,Meat的“效率悖论”
2026年4月,AI技术正以前所未有的速度重塑企业结构和工作范式,引发了一场“效率悖论”:企业为巨额AI投资而裁减员工,甚至波及未被AI直接替代的岗位。与此同时,OpenAI等科技巨头正通过高速迭代构建“AI超级应用”,而Anthropic和Karpathy等在AI Agent领域取得突破,预示着AI将从工具转变为自主研究员,彻底改变未来的研发与生产模式。AI浪潮下的企业裁员潮与成本结构剧变• Meta大规模裁员与AI投资并举: Meta宣布裁员8000人(占总员工10%),同时计划将资本支出提升60%以上用于AI基础设施,其首席人力官明确表示此举旨在提升效率并抵消AI投资。• 普遍的企业应对策略: 微软、亚马逊、Block、Salesforce、Snap等公司也相继进行大规模裁员,表明“为AI投资而裁员”已成为行业趋势。• 人力资本结构性转移: 被裁员工多集中于市场、销售、HR、行政等通用岗位,而AI相关岗位的招聘却未停止,人力成本逐渐成为可压缩变量。OpenAI的高频迭代与“AI超级应用”野心• GPT-5.5的快速发布与能力提升: OpenAI在距离上一个版本仅7周后发布GPT-5.5,显著提升了编程、计算机操作和深度研究能力,并已向Plus、Pro、Business和Enterprise用户开放。• 构建“AI超级应用”的战略: OpenAI利用高频迭代保持技术领先,以Codex作为分发渠道,并通过“AI超级应用”概念构建竞争壁垒,总裁Greg Brockman透露公司内部也大量使用GPT-5.5进行开发。• 产品化挑战: 尽管技术领先,OpenAI也面临现实世界的法律风险,例如“io”商标使用被法院禁止。AI Agent的崛起:从工具到自主研究员• AI在研究领域的突破性进展: Anthropic构建的AI Agent在“用弱模型监督训练强模型”这一开放研究问题上已超越人类研究员,展示了AI研究能力的“自我闭环”。• “代理工程”重塑研发范式: Karpathy的“autoresearch”项目让AI Agent自主优化语言模型,两天内发现约20个提升验证损失的方法,预示着未来的AI研究将由人类设计代理架构,AI Agent自主执行实验和迭代优化。• AI编码代理的应用: JetBrains推出AI Assistant和独立AI编码代理产品Junie,旨在通过“编码代理驱动的复杂任务处理能力”,让用户通过自然语言描述任务,由代理执行,大幅提升开发效率。
-
51
2026年4月:Meta为AI裁8000人,谁是下一个?
🧠 本期要点1) 00:57 Meta计划裁员约10%(约8000人),并停招6000个空缺岗位,以抵消AI基础设施投资导致的资本开支同比增60%、自由现金流或暴跌83%的影响。2) 02:15 大众汽车宣布从下半年起在中国专属电子架构车型上部署车载AI Agent,可自主搜索餐厅并完成预约,聚焦可执行任务的代理式交互。3) 03:35 Anthropic构建的自主AI Agent在弱模型监督训练强模型任务上超越人类研究员,能独立提出假设、设计实验并迭代优化,具备实用性。4) 04:54 普渡机器人完成近1.5亿美元融资,用于具身AI开发、产品组合扩充及全球扩张,此前D-Robotics也获2.7亿美元B轮融资。5) 06:10 特斯拉在10-Q文件中披露,已签署协议收购一家AI硬件公司,交易总价最高20亿美元,其中18亿美元以股票和股权激励支付,绑定服务条件和业绩里程碑。6) 07:36 美国加州北区法院批准初步禁令,禁止OpenAI在案件审理期间使用“io”设备品牌标识,因其与IYO公司混淆,影响其硬件商业化进程。7) 08:55 第一条,Meta在4月23日被多家媒体披露将裁掉约10%的员工,也就是大约8000人,同时还有约6000个空缺岗位将不再补招。
-
50
2026年4月:当AI开始“造”AI,人类程序员还剩什么?
今日AI产业正经历深刻转型,核心矛盾已从“人类如何利用AI”转向“AI如何自我演进”。SpaceX以600亿美元期权押注AI编程,大众汽车为中国市场特供车载AI代理,以及苹果CEO换帅预示AI与硬件深度融合,都表明AI正从单纯工具演变为驱动代码、汽车乃至整个物理世界的基础设施。尤其值得关注的是,AI已开始自动化自身的研发过程,这将重塑产业格局并重新定义人类的角色。AI编程的军备竞赛与算力主导• SpaceX与AI编程公司Cursor建立合作,包含以600亿美元收购Cursor的期权,或100亿美元联合开发,旨在结合Cursor工具与SpaceX的Colossus超级计算机(100万颗Nvidia H100)。• 这项合作是迄今对AI编程工具的最大胆押注,标志着算力巨头(SpaceX)与算法层(Cursor)深度捆绑,重塑AI编程竞争格局。• AI编程已进入“算力+算法+场景”三位一体的新阶段,未来顶尖AI编程能力可能被少数拥有顶级算力的公司垄断。传统车企的AI本土化与市场求生• 大众汽车集团宣布,从2026年下半年开始,为中国市场专属电子架构车辆配备“车载AI代理”,可自主搜索餐厅并完成预订。• 这是全球主流汽车制造商首次为单一市场(中国)推出深度本地化的AI功能,放弃“全球统一方案”,采取更激进的本土化AI策略。• 中国市场对AI的高度接受度和丰富应用场景,正成为全球汽车智能化的“试验田”和“催化剂”,决定车企“软件定义汽车”能力。消费电子巨头AI战略的硬件转向• 苹果公司宣布,硬件工程高级副总裁John Ternus将于2026年9月1日接替Tim Cook出任CEO,芯片负责人Johny Srouji成为首席硬件官。• 此次高层变动明确了苹果AI战略的核心将是“软硬一体”的深度整合,强调AI功能与自研芯片、传感器、新型显示等硬件的协同创新。• 消费电子AI战争的下半场将是“硬件定义AI体验”,真正的差异化将来自AI能力与定制化芯片、新型人机交互硬件的无缝集成。AI自主研究与自我进化• Andrej Karpathy的“自主研究”实验和Anthropic的最新研究表明,AI代理已能自主进行神经网络架构、优化器等研究,甚至超越人类研究员。• AI进化进入“自我指涉”的新阶段,能够处理开放性、探索性的科研问题,形成一个以算力和评价指标为燃料的“自我进化”飞轮。• 当AI开始自动化AI研发,人类角色将从“执行者”转变为“问题定义者与方向制定者”、“元工具与流程构建者”以及“结果解释与整合者”。• 这一趋势将加剧AI领域“马太效应”,拥有顶级算力集群、最强模型访问权、高质量数据和顶尖“元工程师”团队的玩家将获得巨大优势。
-
49
2026年4月:AI自己研究AI,人类饭碗不保?!
🧠 本期要点1) 00:56 谷歌在Cloud Next 2026上公开宣布,正作为首选云服务商与苹果合作开发基于Gemini的下一代Apple Foundation Models。2) 02:13 苹果宣布高层重组,硬件工程高级副总裁John Ternus将于9月1日出任CEO,Johny Srouji接任首席硬件负责人,正值公司推进AI产品路线与硬件革新之际。3) 03:30 大众汽车宣布,将从2026年下半年起,在采用中国专属电子电气架构的车型上部署车载AI智能体,以应对中国市场的智能体验竞争。4) 04:47 SpaceX宣布与AI编程公司Cursor合作,合作框架包含以600亿美元收购或支付100亿美元联合开发的选项,旨在结合Cursor工具与SpaceX的Colossus超级计算系统。5) 06:08 Meta在收购Thinking Machines Lab被拒后,从其创始团队挖走5人,包括一名关键工程师;该团队其余成员分别流向OpenAI和xAI。6) 07:24 Anthropic发布研究,其构建的AI智能体在“如何用较弱模型监督训练更强模型”的研究任务上表现已超越人类研究者,触及AI研发流程自动化。7) 08:38 澳大利亚半导体创业公司Syenta完成2600万美元融资,旨在通过新制造技术缓解AI芯片供应链瓶颈,资本正流向更底层的制造环节。
-
48
2026年4月:苹果AI换帅,硬件老兵能打赢软件战?
<原文>揭示了AI竞争维度正在从纯粹的算法竞赛转向更广泛的系统性较量。文章通过苹果领导层调整、中国芯片封装公司估值暴涨以及加州政府AI采购新规这三个案例,阐述了硬件整合、供应链深耕和政策合规成为AI新决胜维度的趋势,预示着未来AI的竞争将是综合体系能力的较量。苹果的硬件整合策略• 人事变动: 硬件老兵约翰·特努斯将接替蒂姆·库克任CEO,芯片负责人约翰尼·斯鲁吉晋升首席硬件官。• 核心理念: 苹果押注“软硬件一体化”的“苹果化”策略,通过神经引擎NPU、传感器等硬件深度绑定AI功能。• 成功案例: 特努斯主导Mac向苹果芯片过渡,并参与iPhone和Vision Pro开发;斯鲁吉是自研芯片灵魂人物。• 竞争差异: 不与通用大模型“军备竞赛”,而是通过极致整合定义体验,为消费电子厂商树立差异化样板。AI芯片供应链的深化与重塑• 资本热捧: 中国芯片封装测试公司SJ Semiconductor上市首日股价暴涨近四倍,市值突破200亿美元。• 技术关键: 先进封装(如2.5D、3D封装)在AI芯片(GPU、HBM)制造中至关重要,是提升算力密度和能效的关键路径。• 产业认知: 资本市场认可封装测试等“后端”环节与芯片设计、制造同等重要,AI算力竞赛已深入产业链“毛细血管”。• 地缘影响: 中国封装公司的高估值将加速其AI芯片全产业链自主化进程,可能改变英伟达、AMD等公司的供应链格局。AI监管与市场规则的新范式• 加州新规: 加州州长纽瑟姆签署行政命令N-5-26,利用政府采购力量为AI系统设定安全、偏见、透明度标准。• 监管创新: 绕过联邦立法,通过政府采购合同的市场手段施加影响,设立“加州标准”。• 合规成本: 对AI公司,尤其是To B和To G业务的公司而言,合规成本将成为新的竞争维度。• 市场机遇: 催生帮助AI公司通过政府采购合规审核的咨询与认证服务,采购规则可能比法律条文更快塑造AI产品。
-
47
2026年4月:Siri难产,库克卸任,苹果AI还有戏吗?
🧠 本期要点1) 00:47 苹果确定硬件负责人John Ternus将于2026年9月1日接任CEO。2) 02:21 澳大利亚寿险公司TAL与微软签署为期五年的合作协议,将数据集中至Azure并共同建设AI工具。这是TAL史上最大的技术交易。3) 03:37 富士康工业互联网计划在2026年第三季度量产CPO全光交换机,目标出货超1万台。此举旨在解决AI集群数据传输瓶颈,推动光互连方案进入规模化供货阶段。4) 04:52 澳大利亚初创公司Syenta完成2600万美元融资,专注于开发新的AI芯片制造工艺。其目标是缓解整个AI芯片供应链的制造瓶颈,而非直接竞争终端产品。5) 05:57 中国芯片封测企业SJ Semiconductor在上海上市首日股价一度飙升近四倍,市值突破200亿美元。这反映了投资者对支撑AI产业链的制造环节公司的强烈需求。6) 07:07 百度支持的智能电动重卡公司DeepWay完成pre-IPO融资第二阶段,本轮总额达3.1亿美元。公司已交付6400辆重卡并推进香港上市,新投资人包括澳大利亚养老基金。7) 08:25 AI产业竞争正从模型层面转向全产业链,同时推动组织重组、企业IT合同、光互连量产、芯片制造融资、封测估值和智能运输资本开支等多个领域。
-
46
2026年4月:模型不稀缺了,AI抢什么?
AI领域的竞争焦点正在迅速转移,不再仅仅局限于模型的性能比拼。当前,核心控制权正从模型本身扩散到三大新维度:人才与高密度团队的争夺、AI监管与市场规则的定义权,以及AI团队内部从“如何实现”转向“定义用户问题”的工作重心转变。未来的赢家将是那些能牢牢掌握人才、规则制定权和用户入口的企业,这预示着一场生态位与话语权的综合性竞争。AI竞争重心转向“高密度团队”• Meta和OpenAI等巨头正从高估值AI初创公司(如估值120亿美元的Thinking Machines Lab)大量挖走核心团队成员,包括产品负责人。• 初创公司正在成为巨头的人才“前站”或“孵化器”,其搭建的成熟团队和产品形态可能被直接“整包”吸走。• AI行业的竞争已演变为对“能定义框架、团队和产品方向”的人才的争夺,高密度团队本身成为核心竞争力。监管成为市场准入门槛与规则制定权• 《爱尔兰时报》社论指出“AI自我监管”是“危险神话”,以Anthropic的Claude Mythos为例,其与监管机构的互动有限引发不安。• 美国和欧盟在AI监管态度上存在分歧,欧盟《AI法案》寻求全面监管,而美国副总统JD Vance批评过度干预会阻碍创新。• 监管不再是技术发展后的“补丁”或外部约束,而是决定市场准入、产品上线速度和定义行业游戏规则的关键因素。从“如何实现”到“定义问题”的重心转变• 一线从业者如Zara Zhang和Aaron Levie指出,AI团队应将更多时间投入用户沟通和问题定义,因为AI已擅长实现解决方案,“做什么”比“怎么做”更重要。• Garry Tan的OpenClaw工作流示例表明,AI能快速创建新工具,代码本身不再是瓶颈,真正的瓶颈在于“用户真正卡在哪一步”和“如何将AI执行转化为稳定工作流”。• 当技术实现成本大幅下降时,问题定义的成本相应上升,下一轮产品竞争将奖励那些最能将用户问题、组织流程和AI执行链路无缝连接起来的人。
-
45
2026年4月21日:AI编程的“人机反转”正在发生
这篇播客讨论了AI技术对整个产业生态的颠覆性影响。首先,编程模式正经历“人机反转”,开发者从手写代码转向管理AI代理。其次,AI算力需求的激增催生了SK海力士SOCAMM2等新型高容量、低功耗内存技术。然而,AI工具的深度集成也带来了新的安全挑战,如Vercel事件所示,AI工具本身成为新的攻击面。编程模式的“人机反转”• Andrej Karpathy的转变: 前特斯拉AI总监称,自2025年12月起,其80%的编程时间用于“代理工程”,即用自然语言指令AI代理完成复杂任务,而非手写代码。• 开发者角色演变: 编程核心技能从“写代码”转变为“定义问题”、“设计流程”和“管理智能体”,开发者更像“AI指挥家”。• 行业趋势印证: JetBrains研究显示,深度AI助手用户代码编辑模式发生显著变化,初级编码任务将很快被AI自动化。AI算力需求与新型内存• SK海力士SOCAMM2发布: 2026年4月,SK海力士开始大规模生产192GB SOCAMM2内存模块,基于1cnm工艺和LPDDR5X技术,专为AI服务器设计。• SOCAMM2关键特性: 相比传统RDIMM,带宽提升一倍以上,能效提高75%以上,兼顾高性能与低功耗,并优化英伟达Vera Rubin平台。• 市场竞争加剧: 为解决大语言模型训练和推理的内存瓶颈,美光、三星等也推出类似产品,预示AI数据中心基础设施走向专业化和多元化。AI工具引入的安全新风险• Vercel安全事件: 云平台Vercel因员工使用的第三方AI平台Context.ai账户被入侵,导致攻击者渗透到Vercel内部环境。• AI供应链安全挑战: AI生产力工具成为新的攻击面,企业面临“AI供应链安全”和“身份与访问管理”的严峻考验。• 应对策略: 需加强员工AI工具审计、实施最小权限原则,并对AI工具可接触的数据和操作进行更细粒度的管控。
-
44
2026年4月:英伟达不卖芯片了?要抢云厂商饭碗!
本期要点1) 00:14 SK海力士于2026年4月20日宣布量产192GB SOCAMM2内存模块,专为AI服务器设计。该产品采用新型片上内存架构,面向数据中心AI推理集群。2) 01:04 Meta从估值120亿美元的初创公司Thinking Machines Lab招募了7名创始成员。这批成员将并入其“AI Engineering Infrastructure”团队。3) 01:56 OpenAI正式推出Codex桌面应用,面向其全部订阅用户开放。该应用是具备离线能力的原生桌面环境,支持工作树管理、自动化任务编排与Git集成。4) 02:47 英伟达已接近完成对云原生AI平台公司Lepton AI的收购谈判。此次收购旨在扩展其AI云服务交付能力。5) 03:40 英特尔下一代Core Ultra 400D/400DX “Nova Lake-S”系列处理器规格曝光,顶配SKU将配备高达288MB总缓存。该系列预计在2026年内发布。6) 04:34 谷歌正与芯片设计公司Marvell洽谈,计划合作开发用于AI推理任务的新型定制芯片。
-
43
2026年4月:用户为什么愿为结果买单?
AI领域正经历一场深刻的重心转移,不再仅仅追逐模型能力的突破,而是更加聚焦于产品落地、基础设施建设和政策法规博弈。Anthropic的一份报告指出,在AI模型评估中,基础设施配置对模型表现的影响可能远大于模型自身能力差异,凸显了运行时环境的重要性;与此同时,美国围绕AI监管权的联邦与州之争日益激烈,以及AI模型发布速度和多样性的加速,共同预示着基础设施、监管框架和产品转化将成为AI时代竞争的胜负手。AI模型评估与基础设施的决定性作用• Anthropic报告揭示,在代理式编程评估中,CPU、RAM和时间限制等基础设施配置对模型得分的影响,可能比模型能力差异更大。• 运行时环境在代理式评估中是解决问题的不可或缺部分,最宽松与最严格资源配置之间可导致6个百分点的模型成功率差距,并引发“内存溢出终止”(OOM-kill)等问题。• 报告建议评估者明确指定“保证分配”和“硬限制”参数,并对评估中低于3个百分点的小分数差异保持怀疑,因其可能仅反映硬件或运行时的差异。美国AI监管权的联邦-州博弈• 特朗普政府通过行政命令、商务部评估和国家AI政策框架,试图推行联邦“最低限度负担的国家标准”,以取代各州的AI法规。• 各州(如加利福尼亚州、科罗拉多州)积极立法以保留AI监管权,全美2025年有145项AI相关法案成为法律,国会也对联邦优先权持保留态度。• 科技行业投入超过10亿美元进行游说,安德森·霍洛维茨和OpenAI支持统一联邦监管,而Anthropic等则支持AI安全和监管。AI模型发布的加速与生态多样化• Hugging Face的“2024 AI Timeline”应用直观展示了AI模型的快速涌现,并区分了开源模型和API模型。• 这种多样化反映了AI能力部署和获取方式的丰富性,有助于推动研究普及(开源模型)和商业化规模化(API模型)。• 模型发布速度和多样性促使整个行业从单一的模型能力突破,转向更全面的产品化、基础设施建设和产业协同。
-
42
2026年4月:中国AI再入百亿,OpenAI痛失爱将
🧠 本期要点1) 00:23 中国AI公司深度求索DeepSeek正在进行新一轮融资,估值达到100亿美元,跻身全球估值最高的AI初创公司行列。2) 00:43 OpenAI负责"OpenAI for Science"项目的Kevin Weil于4月17日离职,原项目已被拆分整合到其他研究团队。3) 01:02 欧盟《人工智能法案》已于今年1月全面生效,而美国仍在推行宽松的产业优先策略,双方在AI治理路径上出现明显分歧。4) 01:23 Anthropic的Claude Design展示了五个具体应用场景,并能直接读取现有代码库,自动从中提取并构建一致的设计系统。
-
41
2026年4月:AI烧百亿
🧠 本期要点1) 00:29 ASML和台积电发布强劲业绩预测,共同指向AI相关的资本支出热潮依然稳固,为AI硬件基础设施的持续投入提供了明确背书。2) 01:05 Pitchbook数据显示,2026年第一季度创下风险投资大额记录,其中排名前五的AI领域大额交易占据了融资总额的绝大部分。3) 01:31 AI初创企业Upscale AI正在洽谈新一轮融资,其估值可能达到20亿美元,反映了市场对AI初创企业的高估值趋势。4) 01:52 红杉资本成功募集了一支规模高达70亿美元的基金,将专注于人工智能领域以及后期项目的投资。5) 02:19 新工具Workflow SDK旨在解决AI代理与后端系统的持久性交互难题,以提升AI应用在服务中断、请求限流等场景下的可靠性。6) 02:50 Y Combinator CEO Garry Tan宣布将开源一个为Gemini Live模型设计的端到端测试工具,以帮助开发者更有效地评估和验证模型表现。
-
40
加更|AI 不写代码了,它进实验室和你抢饭碗
🧠 本期要点1) 00:41 OpenAI于4月16日发布面向生命科学领域的专用AI模型,支持药物发现、蛋白质结构预测等核心科研环节,并已在多家生物技术公司和学术实验室启动早期合作测试。2) 01:30 阿里巴巴集团于4月17日推出Qwen3.6-Plus版本,专为加速企业级AI代理的生产环境部署而优化,该版本已上线阿里云百炼平台,支持客户一键接入内部系统。3) 02:20 Applied Optoelectronics于4月17日宣布扩建其休斯顿制造基地,新增38.8万平方英尺产线空间,全部用于AI高速光网络模块生产。4) 03:11 ASML上调2026年EUV光刻机出货预期至68台,其中约57台为AI训练芯片客户专用,台积电确认2026年第一季度先进制程产能利用率达99.2%。5) 04:08 OpenAI研究员Bill Peebles已于近期离职,其身份为基础模型科学组核心成员,曾主导多个关键生物学对齐实验,离职时间点恰与公司生命科学模型发布前夜重合。6) 04:52 Anthropic公司于4月17日发布Claude Opus 4.7版本,聚焦长上下文稳定性与多模态指令一致性,在1M tokens输入下保持98.3%的指令遵循率。🔗 参考资料与延伸阅读• OpenAI launches biopharma-focused AI model to compete with Anthropic• Alibaba unveils Qwen3.6-Plus to accelerate Agentic AI deployment• Introducing Claude Opus 4.7• Strong ASML, TSMC forecasts signal AI spending boom is intact
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
ABOUT THIS SHOW
聚焦AI圈与科技行业的最新新闻、产品动态和趋势变化。我们不只聊发生了什么,更关注这些事件背后的竞争逻辑、商业机会和行业走向。希望用轻松但有信息量的方式,陪你快速看懂AI世界正在发生的变化。
HOSTED BY
xiaoyaole
CATEGORIES
Loading similar podcasts...