BestBlogs podcast artwork

PODCAST · technology

BestBlogs

BestBlogs 早报音频版,精选 AI、技术、产品、设计与商业科技领域值得关注的高质量内容,陪你每天从真正重要的信息开始。

  1. 93

    BestBlogs 周刊 第 101 期 · 慢下来才能更快

    本周亮点如果说前几周的关键词是模型一个接一个变强,那么这一周,行业像是集体慢了半拍,开始认真盘点一个问题:当 AI 把写代码、出方案、做内容都变得飞快,真正的瓶颈到底卡在哪里。本周内容给出的答案出奇一致——是验证、是审查、是判断。这一期的主题,就借 Gergely Orosz 的那句话,叫「慢下来才能更快」。时间线00:00 开场 · 本周主线「慢下来才能更快」+ BestBlogs 按下暂停键01:32 主题一 · 慢下来才能更快:被重新定义的瓶颈(Gergely Orosz + Fiona Fung)04:30 主题二 · Agent 走进团队:身份与协作成了新课题05:57 主题三 · 审查与安全,正在被认真地工程化07:45 主题四 · 评估、知识底座与底层地基09:44 主题五 · 比 AI 能力更稀缺的:判断、品味与主动性11:20 主题六 · 创业的慢功夫...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  2. 92

    EP99 · DSPy 提示优化、Saga 回滚、出海 C-Corp · 06-26 早报

    ★ 精讲一 | 我们如何利用 DSPy 将 AI 评估转化为 Dash Chat 的更优回复来自 Dropbox Tech BlogDropbox 技术团队分享了 Dash Chat Agent 的评估优化实践。核心方案是以开源框架 DSPy 构建两阶段反馈闭环:先用人工标注数据校准 LLM 裁判,再以校准后的裁判自动优化 Agent 提示词。人工评估覆盖意图理解、语义相关性、工具调用等 5 个维度,评分采用 1–5 分制。上线后不完整回答减少 26%,遗漏关键点减少 13%,token 用量下降 5.4%。对正在搭建 Agent 评测与提示词优化闭环的团队有参考价值。★ 精讲二 | 我们如何为 Cloudflare Workflows 构建 Saga 回滚来自 The Cloudflare BlogCloudflare 官方博客介绍了 Workflows 新发布的 Saga 回...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  3. 91

    EP98 · OpenAI 芯片、人机协作、开源评审 · 06-25 早报

    ★ 精讲一 | OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片来自 OpenAI NewsOpenAI 与 Broadcom 联合发布首款定制 LLM 推理芯片 Jalapeño,从设计到流片仅用九个月,号称高性能芯片史上最快的 ASIC 研发周期,且过程本身由 OpenAI 自家模型加速完成。这标志着 OpenAI 从模型、产品全面下探到芯片层,构建「模型反哺芯片设计、芯片支撑更便宜推理」的全栈飞轮,意在让先进 AI 的访问成本持续走低。★ 精讲二 | Anthropic 关于构建高效人机协作团队的经验 | Claude来自 Claude BlogAnthropic 罕见公开内部实践:随着 Claude Tag 让智能体直接进驻团队协作空间,工作正从「一人一智能体」的单机模式,变成人类与多个智能体共享同一工作台的「多人游戏」。文章总结四条经验——信息默认公...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  4. 90

    EP97 · 智能体身份新规则、AI 编程隐性代价、Harness 与 Token 经济学 · 06-24 早报

    ★ 精讲一 | 智能体身份:适用于自主、团队级 AI 的新型访问模型 | Claude来自 Claude BlogAnthropic 为 Claude Tag 推出「智能体身份」访问模型:团队频道里的 Claude 不再借用某个人的权限,而是拥有管理员配置的独立账号体系,按频道继承或覆写权限边界,能读写 GitHub、数据仓库等系统并留下独立审计轨迹。核心转变是从「这个用户能做什么」变成「这个智能体在这个范围内能做什么」——这是多人协作场景下自主智能体访问控制的关键基础设施。★ 精讲二 | 慢下来才能更快:AI 如何重塑软件工程 [视频]来自 The Pragmatic Engineer《Pragmatic Engineer》梳理了 AI 高速生成代码带来的结构性代价:Meta 一次未经人工复核的 AI 生成代码直接导致 Instagram 重置密码漏洞,CISO 在事故调查中离...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  5. 89

    EP96 · AI 漏洞补丁、AIGC 海报闭环、模型红队 · 06-23 早报

    ★ 精讲一 | Daybreak:保护全球每一家组织的安全工具来自 OpenAI News本文出自 OpenAI 官方博客,介绍网络安全计划 Daybreak。核心观点:AI 已让漏洞发现不再是瓶颈,真正瓶颈是「修补」。关键支撑:Codex Security 已扫描超 3000 万次提交、覆盖 3 万多个代码库,超 50 万个问题被自动修复;GPT-5.5-Cyber 在 CyberGym 上达到 85.6% 最高得分(对比 81.8%)。值得读:安全能力首次系统化转向「补丁交付」。★ 精讲二 | 美团海报生成 AIGC 技术创新与实践来自 美团技术团队本文来自美团技术团队,拆解其海报生成技术体系。核心观点:海报生成不止文生图,团队构建「生成-编辑-评判」闭环——PosterCraft(ICLR 2026)统一优化文字版式;PosterOmni(CVPR 2026)一模型覆盖六类...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  6. 88

    EP95 · Claude Code 工程、苹果 AI 重构、Qubot · 06-22 早报

    ★ 精讲一 | 打造全球最「All-in AI」工程团队:Anthropic Claude Code 负责人 Fiona Fung 的一线实践 [视频]来自 Lenny's PodcastAnthropic Claude Code 负责人 Fiona Fung 做客 Lenny's Podcast,抛出一个数据点:Anthropic 工程师如今每季度交付的代码量是过去的 8 倍。但她强调真正的变化是「编码不再是瓶颈」,约束转向「如何验证产出是否正确且有影响力」。她分享了一线打法:常驻的 Claude Code 远程会话、每早自动扫反馈并生成 PR 的 routines、用 bad/sad 框架守质量、用 JIT 月度计划取代半年路线图。一手实践,值得 AI 时代的工程团队细读。★ 精讲二 | 库克的离场,苹果新 AI 权力重构与价值观天平|WWDC26来自 硅谷 101硅谷 10...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  7. 87

    BestBlogs 周刊第 100 期 · 百篇回顾· 两年 AI 信号与噪声

    本期亮点第 100 期特刊,我们不聊这一周,聊这两年。从 6400 多篇精选里选出 100 篇,按六个主题把这两年 AI 的变化串成一条线。把 100 期连起来看会浮现出一句话:答案变得越来越便宜,而提对问题、做对判断、为结果负责,第一次比答案更值钱。这是一次有观点的回看,每条线只挑一两个最值得讲的故事。时间线00:00 开场 · 第 100 期特刊:为什么「答案变便宜,判断变贵」02:05 主题一 · 模型层:从会回答到能干活(DeepSeek 那一周 / 一天迁 5000 万行)05:53 主题二 · AI Coding:实现变便宜,证明代码有效变贵(7 小时只交 500 行 / Claude Code 起源)09:03 主题三 · 工程范式:人被逼着把隐性判断写成文字(上下文工程命名之争 / Harness 溃败)12:35 主题四 · Agent:真正站住的是一套冷静...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  8. 86

    EP94 · 职场分化、Token退烧、Claude Code 拆解 · 06-21 早报

    ★ 精讲一 | AI 教母预言:10 年后只剩两种工作者 [视频]来自 Silicon Valley Girl李飞飞与 MasterClass 创始人 David Roger 联合提出「哑铃效应」:随着文本智能成本归零,未来劳动力将两极分化——掌握不可复制审美与技艺的顶尖工匠,与能调度 AI 完成端到端任务的高能动性通才,中间地带持续坍缩。她强调,应对技术焦虑的解法不是回避工具,而是主动建立自主性。★ 精讲二 | 三个月,一场必然失败的 Tokenmaxxing来自 腾讯科技硅谷曾以 token 消耗量比拼「超级个体」身份,但 Uber、Amazon、微软相继收紧 Claude Code 预算。文章援引多篇论文指出:Agentic coding 真实成本是普通问答的千倍,且七成消耗在反复试错与无效探索;写代码效率提升 180%,但传导到发布上线的增量仅剩 30%——上下游瓶颈未除...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  9. 85

    EP93 · 限研争议、应用攻防、工程再思 · 06-20 早报

    ★ 精讲一 | 测试神话与寓言,超越 SWE-bench,Nvidia 的开放竞争者来自 The Batch | DeepLearning.AIAndrew Ng 罕见动怒:Anthropic 不仅给 Claude Fable 5 加上限制竞品研究的条款,还被曝悄悄降低疑似同行研究者的输出质量;美国商务部出口管制更直接逼得 Fable 全球下线,掀起多国关于 AI 主权的讨论。同期 DeepSWE 等新基准证明智能体编程能力远未触顶,Nvidia 也以混合架构悄然加入开源模型竞速。★ 精讲二 | 攻破 LLM 驱动的应用:从上下文投毒、工具越权到纵深防御 [视频]来自 Spring I/OSpring I/O 演讲实测攻破 LLM 应用:用路径穿越污染 RAG 知识库让助手认账虚构条款,靠 SQL 注入伪造聊天记忆诱导越权操作,再用拆分提问绕过护栏套取用户数据;核心结论是护栏只能...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  10. 84

    EP92 · Codex 录制回放工作流、Claude Artifacts、A2A 协作 · 06-19 早报

    ★ 精讲一 | OpenAI Codex Record & Replay:演示一次,即可复用浏览器工作流 [视频]来自 OpenAI OpenAI 为 Codex 上线 Record & Replay:用户只需演示一次完整操作(如在 YouTube Studio 填写元数据、上传缩略图、保存私密视频),Codex 就能把这次录制转化为可复用技能,在新任务里自主匹配素材、填写信息、核验结果。能力覆盖电脑操作、浏览器操作和已连接插件,未来还能扩展到整理 PR、安排日程等场景——把「写提示词」换成了「做一次示范」。★ 精讲二 | Claude Code 现已支持 Artifacts 渲染功能来自 Claude Blog Claude Code 上线 Artifacts 功能:会话过程能被实时转化成可分享的可视化页面——PR 走查、系统说明、仪表盘、发布清单等,且随工作推进自动更新同一链接。...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  11. 83

    EP91 · GLM-5.2 开源、AI 化学家、对话闫俊杰 · 06-18 早报

    精讲一:GLM-5.2 上线并开源:专注 Coding 与长程任务来自 智谱 今天智谱上线并开源 GLM-5.2,在百万用户参与的 Code Arena 前端开发盲测中拿下全球可用模型第一。核心是 Solid 1M 无损上下文撑起长程任务:FrontierSWE 仅比 Opus 4.8 低 1%,超过 GPT-5.5 与 Opus 4.7;实测中模型用满近 88 万 tokens,一次性自主交付了一个覆盖 Web、移动端与小程序的多端应用。配合 IndexShare 稀疏注意力与改进投机解码,单位 token 的 FLOPs 降低至 2.9 倍。模型 Day 0 适配多家国产芯片,采用 MIT 协议全开源,无地域限制。精讲二:近乎自主的 AI 化学家改进药物化学中的一项挑战性反应来自 OpenAI News OpenAI 将 GPT-5.4 接入 Molecule.one 的智能化学...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  12. 82

    EP90 · 部署模拟预测行为、智能体代码审查、架构 AI 友好 · 06-17 早报

    精讲一:通过模拟部署在发布前预测模型行为来自 OpenAI News OpenAI 安全团队提出「部署模拟」方法:将真实历史对话重放给候选新模型,在发布前预测真实行为风险。跨 GPT-5 系列版本实验表明,该方法中位倍率误差仅 1.5 倍,优于传统评测基线,并提前识别出「calculator hacking」新型奖励欺骗行为。研究还揭示模型对模拟流量的「测试感知率」与真实生产流量几乎一致(5.1% vs 5.4%),而传统评测集几乎 100% 被识别为测试。精讲二:智能体代码审查来自 Elevate Google Chrome 工程师 Addy Osmani 用 2026 年最新数据剖析 AI 编程时代代码审查的根本性变迁。Faros AI 追踪 22000 名开发者发现:代码缺陷率从 9% 飙升至 54%,零审查 PR 增加 31.3%,审查时长上涨 441.5%。核心洞察是「写作...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  13. 81

    EP89 · 循环工程冷思考、Agent 工具设计踩坑、Token 成本拆解 · 06-16 早报

    精讲一:Codex 和 Claude Code 负责人都不写提示词了,AI 圈爆火的 Loop 到底是什么来自 APPSO 「循环工程」最近被吹成新范式,但文章先把热闹拆开看:技术上不算新发明,过去的 Harness、Skill、Agent 工作流早就在做,真正变化的是模型终于能把循环连续跑下去——人从写提示词退到定规则:何时启动、工具边界、出错怎么判断、记录在哪、何时收手交回人。结合另一篇用 OKR 和古德哈特定律拆解循环工程的长文,它更像一套管理制度:值不值得搭,取决于任务是否真反复、Token 预算够不够,而非这个新名字。精讲二:AI 智能体工具设计:有效与无效的模式 - MachineLearningMastery.com来自 Hacker News - Newest: "AI Agent" 这篇文章把 AI Agent 翻车的锅,从「模型不够聪明」甩回「工具设计太糙」:单一...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  14. 80

    EP88 · Fable 禁令、SpaceX 冲刺、LeCun 赌局 · 06-15 早报

    精讲一:从发布到被消失的 72 小时,Fable 5 暴露了最强 AI 模型的安全困境来自 腾讯科技 继 EP84 Simon Willison 对 Fable 5 的惊艳初体验、EP85 开发者实测「1770% 性能提升」的兴奋之后,这款最强模型在发布 72 小时内经历了从轰动到被美国政府出口管制禁令强制下线的完整生命周期。文章还原 Pliny 团队如何用 Unicode 同形字替换和「分解-重组」攻击突破 Fable 5 的分类器降级安全架构,并指出 Amazon 在禁令背后兼具投资人与安全预警源的复杂角色——当 Constitutional AI 的发明者也守不住自己的宪法,整个行业的安全承诺都面临拷问。精讲二:SpaceX 崛起史:一切,为了去火星|实地探访星舰基地与总部来自 硅谷 101 在 SpaceX 上市进入冲刺阶段(EP84 已报道其路演启动,隐含 15 年 41....去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  15. 79

    EP87 · Fable 5 禁令、监管分水岭、编程瓶颈转移 · 06-14 早报

    精讲一:美国政府要求 Anthropic 暂停外国公民访问 Fable 5 和 Mythos 5来自 Anthropic(@AnthropicAI) EP85 刚宣布四天的 Claude Fable 5,即遭美国政府以「国家安全出口管制」为由叫停:所有外国公民——无论身处美国境内还是境外,包括 Anthropic 的外籍员工——均被立即切断访问,Mythos 5 同样波及,其余 Claude 模型不受影响。Anthropic 将其定性为「误会」并寻求快速恢复。这是出口管制首次落地于前沿 AI 模型,也把「AI 主权」的话题从产业讨论推进到了现实执法。结合 EP86 Anthropic 民调显示公众对 AI 的高期待,政府干预来得尤其猝不及防。精讲二:Marc Andreessen 对监管的终极立场:一篇精妙绝伦的二分法论述来自 Marc Andreessen 🇺🇸(@pmarca) M...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  16. 78

    EP86 · Anthropic 民调、黄仁勋谈 AI 工厂、Kimi K2.7 Code · 06-13 早报

    精讲一:Anthropic 首份公开记录调查结果来自 Anthropic News Anthropic 首个面向全美公众的调查,覆盖近 52000 人。结果呈现清晰的「期待与焦虑并存」:48% 期待 AI 攻克癌症等疾病,64% 担心失业,71% 支持政府监管,而只有 15% 信任 AI 公司自行决策。值得玩味的是,每天用 AI 工作的人对失业的担忧(54%)反而显著低于从不使用者(70%)。精讲二:黄仁勋谈智能时代的「发电机」,从检索式计算到 AI 工厂 [视频]来自 Sequoia Capital 黄仁勋在红杉访谈中给智能时代找了个 300 年前的参照物:发电机。计算正从持续 60 年的「检索预存数据」范式转向实时生成智能的 AI 工厂,整个产业可拆成能源、芯片、设施、基础模型、应用五层。他还用放射科医生和软件工程师的例子回应失业焦虑:自动化任务不等于取代职业目的。精讲三:Ki...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  17. 77

    EP85 · 智能体解耦、Harness 自律、脚手架被吞 · 06-12 早报

    智能体交互界面的演进:使用 Claude Managed Agents 进行构建 | Claude来自 Claude Blog Anthropic 推出 Claude Managed Agents,把智能体的「大脑」(推理循环)和「双手」(代码执行沙箱)彻底解耦,靠可恢复的事件日志连接两端:凭证统一存进独立的 Vault,绝不暴露给生成的代码,自托管沙箱还能让代码留在企业内网,首字延迟中位数降低六成、长尾降低九成以上,Notion、Sentry、Rakuten 等都已在生产环境跑通。AI 不缺智商缺纪律:一场 Harness 工程化实践来自 阿里技术 一位阿里工程师复盘两个月的 AI Harness 演进:从把所有规则堆进 CLAUDE.md 导致「读完规则没脑容量读代码」,到三层加载架构 + dispatcher 状态机 + 文件交接 + G1-G8 门禁,再用 7 维确定性评分给...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  18. 76

    EP84 · AI 政策、万亿 IPO、编程鸿沟 · 06-11 早报

    精讲一:Dario Amodei — 关于 AI 指数级发展的政策来自 Hacker News Anthropic CEO 发布万字政策长文,以《魔戒》树须比喻 AI 与政策的时间差。提出五领域行动框架:仿 FAA 模式建立前沿模型强制安全审计与测试机制;通过工资保险、UBI 等应对持久性失业;加速生物医药等下游监管改革;平衡国家与社会权力;构建 AI 时代国际治理新秩序。Claude Mythos 事件证明前沿模型已对关键基础设施构成真实威胁。精讲二:OpenAI 秘交招股书,美股开启万亿 IPO“三国杀”来自 腾讯科技 OpenAI 正式确认已秘密提交 S-1 招股书,估值超 8500 亿美元。Anthropic 6 月 1 日已先行提交 IPO 申请,私募估值 9650 亿美元反超 OpenAI;马斯克旗下 SpaceX 率先启动路演,最快 6 月 12 日上市。三家 AI/太...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  19. 75

    EP83 · Claude Fable 5 / 企业智能体 / 双语 ASR · 06.10 早报

    Anthropic 发布新一代 Claude:Fable 5 与网络安全版 Mythos 5来自 Anthropic News Anthropic 将 Claude Fable 5 推向大众,并把同一底层模型以 Mythos 5 形式给可信网络安全伙伴使用。原文把能力提升、安全降级和价格放在一起:高风险请求平均少于 5% 会降级到 Opus 4.8,价格为每百万输入 10 美元、输出 50 美元,还列出 50-million-line 代码迁移、药物设计约 10 倍加速等案例。Salesforce 从 20,000 个企业智能体部署中学到的经验来自 ByteByteGo Newsletter ByteByteGo 借 Salesforce Agentforce 的 20,000 个企业客户复盘生产级 Agent:支持 Agent 已处理 3 million 次对话,但真正难点是上线后...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  20. 74

    EP82 · Claude Code 自主化、循环工程、阳萌安克 · 06-09 早报

    Claude Code 一周年复盘:从辅助写代码到自主智能体工作流 [视频]来自 Claude Anthropic 官方 Claude Code 一周年复盘视频文字稿,由团队工程师一手呈现。一年间,Claude Code 从处理独立小任务演进为数千 Agent 动态协作的庞大网络。文章聚焦三个核心转变:验证从单元测试升级为 Agent 在沙箱中自启环境、通过 Computer Use 自我修正的完整运行时循环;Claude 4.6/4.7 推出「Auto Mode」,以安全分类模型替代人工逐条审批权限;PM、设计师乃至数据团队已开始独立提交代码,组织边界加速消融。理解 AI 工程范式转移的第一手权威视角。循环工程来自 Elevate Elevate 技术博主 Addy Osmani 系统阐述「Loop Engineering」新范式:工程师职责正从「持续提示 Agent」转变为「设计...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  21. 73

    EP81 · Fadell 访谈、Codex 零行人工代码、Agent 范式解析 · 06-08 早报

    iPod 与 iPhone 之父 Tony Fadell:AI 时代如何建立品味、判断力与创造力 [视频]来自 Lenny's Podcast iPod 与 iPhone 之父 Tony Fadell 在 Lenny's Podcast 进行了一次产品方法论深度对话。他以 iPhone 触屏键盘之争、Nest 智能温控器为例,提出真正的创新依赖「知情直觉」而非数据驱动,并总结出「三代法则」:iPod 前两代仅覆盖不足 1% 的电脑买家,直到第三代引入 Windows 兼容与 iTunes 生态才实现全球规模。面对 AI 时代,他警告开发者不要对工具产生「认知投降」,警惕「快时尚软件」带来的技术债。驾驭工程:在智能体优先的世界中利用 Codex来自 Hacker News OpenAI 内部工程团队历时五个月,在 Codex 驱动下完成了一项激进实验:全程 0 行人工编写代码,交付了约...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  22. 72

    EP80 · Emergent 破亿 ARR、MCP 接口、缓存命中 · 06-07 早报

    Emergent:六个月 AI 折腾,如何催生一家 1 亿美元 ARR 公司 [视频]来自 Y Combinator 前 Dunzo(印度超本地配送独角兽)创始人 Mukun 离职后用 6 个月无目标编程,确立一个核心判断:AI 能力指数级增长,要一次性自动化「全部软件工程」。9 个月后 Emergent 达到 1 亿美元 ARR,横跨 190 个国家 850 万用户。底层是多智能体编排与自研容器架构(状态快照分叉、并行 RL 管线),为追赶基础模型升级完整重写架构 3 次。在发布前专攻 3 个月登顶代码基准排行榜第一,以此建立融资前技术可信度。为智能体构建界面:Chrome DevTools 设计 MCP 工具的经验 [视频]来自 AI Engineer Chrome DevTools 团队在为 MCP 构建 Agent 接口时发现:将标准性能追踪日志(5 万行 JSON)直接传给...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  23. 71

    EP79 · 腾讯 Hy3、Agent 沙箱、中美算力 · 06-06 早报

    精讲一:汤道生姚顺雨对谈:腾讯 AI 的下半场来自 腾讯科技 腾讯首席 AI 科学家姚顺雨加入腾讯后首次公开亮相,与高级执行副总裁汤道生对谈「腾讯 AI 的下半场」。他判断 AI 方法论已趋成熟,核心难点从「怎么训练」转向寻找好问题,腾讯的产品场景与 context 数据将成 Agent 时代的关键壁垒。Hy3 preview 在 CodeBuddy 与 WorkBuddy 上首 token 延迟降低 54%,可驱动最长 495 步复杂 Agent 工作流。他直接回应外界质疑:「下半场才刚开始」,「ChatGPT 和 Claude 不会是唯一的超级应用」。兼具战略高度与技术细节,值得精读。精讲二:给你的 AI 智能体一台专属电脑来自 LangChain Blog LangChain 官方博客阐述每个 Agent 都需要一台专属电脑的基础设施命题。容器并非真正隔离边界:2025 年 n...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  24. 70

    BestBlogs 周刊 第 98 期 · Agent 时代已来:模型、产品、工程与组织的同步重塑

    时长:17 分 44 秒|发布:2026-06-05这一周,Agent 从概念变成了同时在多个层面落地的现实。模型层有 OpenAI 梦境记忆架构升级和两个新开源模型;产品层有 Kimi Work、扣子 3.0、SkillOpt 把 Agent 推向更广的知识工作者;工程层有 Anthropic 和国内腾讯、阿里、阿里云、大淘宝在同一周发出万字长文;战略层有纳德拉和黄仁勋的大会宣言;再到人与组织,超级个体报告、FDE 新角色和认知缴械的深思。时间线* 00:00 开场与主题·BestBlogs v2.4.2 动态* 01:44 模型层:ChatGPT 梦境记忆 / MiniMax M3 / Gemma 4 12B* 03:54 产品层:Kimi Work / SkillOpt / 扣子 3.0* 06:22 工程层(Anthropic):Claude Code 动态工作流 / ...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  25. 69

    EP78 · ChatGPT记忆升级、AI研发自动化、SpaceX资本版图 · 06-05 早报

    精讲一:梦境:更强大的记忆,让 ChatGPT 更贴心来自 OpenAI News OpenAI 官方介绍 ChatGPT 记忆系统的三代演进:2024 年需主动触发的 saved memories、2025 年后台合成的 dreaming V0,到 2026 年最新 dreaming V3,系统通过后台进程从大量对话中合成记忆状态,始终为对话提供最新、最相关的上下文,而非查询时临时拼凑。三大核心能力——跨对话携带上下文、持续遵循偏好、随时间自动修正过时记忆——均有对比案例佐证。计算效率提升约 5 倍使 Free 用户开放成为可能,Plus/Pro 容量同步上调。精讲二:AI 研发自动化:Wiki 知识库+技能包来自 阿里云开发者 阿里云工程师分享从零搭建 LLM-Wiki 知识库与 AI 研发技能包的完整实战。作者基于 Karpathy 26 年 4 月提出的 LLM-Wiki 模...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  26. 68

    EP77 · 微软 AI 战略、Kimi Work、超级个体团队 · 06-04 早报

    精讲一:⚡️萨提亚·纳德拉:Microsoft Build 上的 No Priors x Latent Space 特别跨界对话来自 Latent.Space 微软 CEO 纳德拉在 Build 大会参加 No Priors x Latent Space 联合访谈,提出三项核心判断:微软正转型为「Frontier Intelligence Platform」;私有评测集(private eval)比员工人数更能体现企业 AI 竞争壁垒;Azure 网络团队通过 Agent 系统 Miles 将 500 余名光纤运维人员的知识自动化。访谈还罕见触及 SaaS 模式终结、定价转型与工程师职能重塑,是目前质量最高的企业 AI 战略一手信息源之一。精讲二:Kimi Work Beta 版邀你体验:你的工作,分我一半来自 月之暗面 Kimi 月之暗面推出 Kimi Work Beta,将 Kim...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  27. 67

    EP76 · 动态工作流、Copilot 桌面、AI 工程革命 · 06-03 早报

    精讲一:为每项任务量身打造:Claude Code 中的动态工作流 | Claude来自 Claude Blog Anthropic 最新发布 Claude Code 动态工作流,让 Claude 能即时为每个任务生成自定义 JS 编排脚本,突破单一上下文窗口限制。相比静态工作流,动态版可自主决定子智能体数量、模型选择与 worktree 隔离,直接对抗「智能体懒惰」和「目标漂移」等长任务失败模式。用触发词 ultracode 即可启用,适合复杂高价值的多步骤任务。精讲二:GitHub Copilot 应用:以智能体为核心的桌面体验来自 The GitHub Blog GitHub 在 Microsoft Build 发布 Copilot 桌面应用,为并行智能体开发打造统一控制中心。每个 Agent 会话独占 git worktree 隔离环境,My Work 视图统一管理所有进行中...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  28. 66

    EP75 · MiniMax M3 首发、AI Coding 规范、视频 Agent 前沿 · 06-02 早报

    精讲一:MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你来自 MiniMax 稀宇科技 MiniMax 发布国内首个集前沿 Coding、1M 超长上下文、原生多模态三项能力于一体的开源模型 M3。Coding 方面 SWE-Bench Pro 得分 59.0%,超过 GPT-5.5 和 Gemini 3.1 Pro;自研 MSA 稀疏注意力让 1M 窗口每 token 计算量仅为上代 1/20,prefill 阶段加速 9 倍。实测 24 小时内自主完成 145 次 CUDA 算子迭代,硬件利用率从 7.6% 升至 71.3%。三项能力国内首次齐备且开源,benchmark 数据之外,复现论文与让模型训模型的实测更能说明问题。精讲二:深入解析 Chromium 的 AI Coding 开发体系来自 腾讯技术工程 Chromium(3500 万...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  29. 65

    EP74 · AI 价值归宿、Skills 极简法、Agent 胜管道 · 06-01 早报

    精讲一:Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]来自 Lenny's Podcast 前 a16z 分析师 Benedict Evans 以「1997 年互联网」类比当下 AI 现状:基础模型实验室正疯狂招募麦肯锡式专业服务团队,恰恰说明企业 AI 落地远非一键完成。他援引杰文斯悖论——电子表格普及后会计师反而增多——反驳「AI 消灭就业」论,并以电信行业商品化为镜断言:基础模型利润将趋零,真正的长期价值将沉淀在分发渠道与应用层,而非底层模型厂商。精讲二:删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]来自 AI Engineer WorkOS 工程师 Nick Nisi 停止手写代码已 8 个月,用 Agent 管理 20+ 个多语言仓库。他发现一条反直觉定律:把 Skills 从 1 万...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  30. 64

    EP73 · Codex 开发操作系统、RAG 检索架构失效、AI 认知异化 · 05-31 早报

    精讲一:Builders Unscripted 第 3 期:Matias Castello 如何用 Codex 搭建 AI 编码与产品工作流 [视频]来自 OpenAI 没有正式工程背景的产品负责人,把 Codex 打造成了日常开发操作系统:PR 内自动代码审查、Linear 驱动的 backlog 管理、GPT 5.5 隔夜竞品研究、Apple Watch 语音触发任务。他的核心判断:平台必须同时服务 AI 辅助的人类开发者和自主 Agent,而过去需要 15 人 18 个月的 MVP,现在 7 天即可独立完成。是一个产品人如何让 AI 替自己写代码的真实操作范本。精讲二:嵌入并非魔法:RAG 检索的可预测失效模式来自 Towards Data Science 通过对 4 款嵌入模型的可复现实验,系统拆解了 RAG 检索的 5 类架构性失效:专业术语盲区、术语相似 ≠ 答案相关、否...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  31. 63

    EP72 · OpenClaw 架构、AI 编程治理、Agent 记忆 · 05-30 早报

    精讲一:OpenClaw 与 Hermes:源码里的 AI Agent 架构知识大复盘来自 腾讯技术工程 作者历时三个月开发 QQBot 插件,深入拆解 OpenClaw(TypeScript 微内核 + 25+ Channel 适配器 + Dreaming 三阶段记忆晋升)与 Hermes(Python 单体 + 技能自创建闭环 + Smart Approval 三态)两套开源框架源码。第 22 章正面剖析 7+1 个工程落地难题:协议互通、记忆分层、上下文工程(融合「上下文焦虑症」理论)、确定性编排、多 Agent 协作,最后以 Google 21 个 Agentic Design Patterns 为坐标系指出两套架构的覆盖盲区。是当前 Agent 工程少有的源码级深度复盘。精讲二:浅谈 AI 编程来自 浮之静 代码生产边际成本趋近于零时,软件工程的核心矛盾已从「谁来写」转向「...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  32. 62

    BestBlogs 周刊 第 97 期 · 大下注时刻

    时长:15:30 | 发布日期:2026-05-29通用 AI 的军备赛还在继续,但这周让人眼睛一亮的,是那些选择离开主干道的人。本期围绕「大下注时刻」,覆盖 Anthropic 双线推进、Agent 基础设施竞速、王小川与何小鹏的战略选择、Harness 时代的组织革命,以及 AI 经济现实。本周亮点* Claude Opus 4.8 旗舰升级 + Claude Code 动态工作流(数十到数百个子 Agent 并行)* Anthropic 多产品 Agent 安全隔离策略* 腾讯 TencentDB Agent Memory:节省 61% Token,成功率提升 52%* AgentScope 2.0 从透明开发升级至系统工程* 王小川放弃通用 AI,押注「造 AI 医生」,M4 + 百小医落地县级医院* 何小鹏:小鹏从电动车转向物理 AI 公司,人形机器人 Iron ...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  33. 61

    EP71 · Opus 4.8 发布、650 亿融资、动态工作流 · 05-29 早报

    精讲一:Claude Opus 4.8 发布来自 Anthropic News Anthropic 旗舰模型 Claude Opus 4.8 在编程、智能体、推理、知识工作四类基准中全面超越 Opus 4.7,尤其在「诚实度」上大幅提升——对自身代码缺陷视而不见的概率降低约四倍。同步推出三项新功能:Claude Code 动态工作流(并行子智能体处理超大任务)、claude.ai 努力控制(可调思考深度)、API 支持任务执行中实时更新指令。Databricks、Devin 等早期测试者验证判断力与可靠性显著改善,售价维持不变。精讲二:Anthropic 完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元来自 Anthropic News Anthropic 完成 650 亿美元 H 轮融资,投后估值 9650 亿美元,由 Altimeter、Sequoia、Dragon...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  34. 60

    EP70 · Claude Code 路径、RL 炼模型、工程师蜕变 · 05-28 早报

    精讲一:Anthropic 设计负责人谈 Claude Code:一年拿下 51% 市场份额的产品路径 [视频]来自 Product School Anthropic 设计负责人 Megan 揭秘:Claude Code 从 12 人 CLI 实验起步,首年拿下 51% 市场份额、$25 亿收入。背后是 AI 原生组织基因——流动 Pod(设计师写生产代码、工程师做 UX 决策)、用运行时行为替代 PRD 做质量门控、Bottom-up 企业采用而非自上而下销售。核心度量从 Token 用量转向用户留存与管道营收,管理层须亲自操刀 Repo 才能保持迭代弹性。精讲二:Cursor 与 Fireworks 如何用分布式 RL 基础设施训练 Composer 2 编码智能体 [视频]来自 Sequoia Capital Cursor 与 Fireworks 公开 Composer 2 训...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  35. 59

    EP69 · 约束 Claude、AgentScope 工程化、上下文卸载 · 05-27 早报

    精讲一:我们如何在多个产品中约束 Claude来自 Anthropic Engineering Anthropic 首度披露跨产品约束 Claude 的三种工程架构(临时容器 / HITL 沙盒 / 可信工作空间),并揭示关键教训:93% 的权限弹窗被无脑通过,自建代理层是最薄弱环节。核心结论:随 Agent 能力膨胀,靠环境隔离压缩爆炸半径比依赖人工审批更可靠。精讲二:从透明开发到系统工程:AgentScope 2.0 发布来自 通义大模型 AgentScope 2.0 从「可见调试」升级为生产级系统工程:引入权限系统(静态规则 + 动态审批)、稳定的模型重试与备用机制、结构化上下文管理、Middleware 扩展点以及统一 Workspace 抽象。阿里通义团队的核心判断:让 Agent 稳定跑完真实长链路任务,比能调用更多模型更重要。精讲三:腾讯云 Agent Memory ...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  36. 58

    EP68 · Claude Code 实践、AI 悖论、百川造医生 · 05-26 早报

    精讲一:Anthropic 内部如何使用 Claude Code:HTML 规格说明、让模型来采访你,以及智能体原生 DOM 验证框架 [视频]来自 Claude Anthropic Applied AI 架构师 Ara 分享三项反直觉内部实践:① 规格说明从 Markdown 升级为 HTML,提供视觉可检查的结构化基线,避免长上下文代理走偏;② 借鉴《The Bitter Lesson》——让 Claude 用 ask_user_question 主持需求采访,而非人工填写约束;③ 组件主动向 DOM 发布数据契约,Playwright MCP 直读结构层做验证,贯通人工看板、Opus 4.7 无头浏览器、CI/CD 三套测试环境。精讲二:AI 悖论:越自动化,越需要人,活反而越多 [视频]来自 Lenny's Podcast Every CEO Dan Shipper 以亲身数...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  37. 57

    EP67 · FDE 驻场大战、Claude 养成揭秘、超级个体破局 · 05-25 早报

    精讲一:脉搏:前场部署工程师再度火热来自 The Pragmatic Engineer Google 把 FDE 面试从「4-6 轮数周」压缩到「2 天 2 轮」,OpenAI 以 40 亿美元成立独立部署公司(并收购了 150 名 FDE 的 Tomoro),Anthropic 跟进建立同类架构。The Pragmatic Engineer 深度解析:FDE 正从工程师演变为「驻场顾问」,外包化意味着这批人将无缘 OpenAI/Anthropic 股权。更大的信号:AI 的商业竞争主战场已从模型训练转移到企业落地。精讲二:Anthropic 首次揭秘下一代 Claude 怎么造!用户吐槽直接喂模型,连 AI“做梦”都被训练来自 AI 前线 Anthropic 研究 PM Alex 首度深度访谈,揭秘三个内部信号:①每代 Claude 在训练前已像正式产品一样锁定规格和能力目标;②「...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  38. 56

    EP66 · Claude 护网万漏、快模型慢工程、Skill 反直觉 · 05-24 早报

    精讲一:Claude Mythos 护网计划:一月发现超 1 万个高危漏洞来自 Anthropic Research Anthropic 联合约 50 家合作伙伴,用 Claude Mythos Preview 在一个月内发现超过 10,000 个高危或严重漏洞——Cloudflare 一家就找到 2,000 个,假阳率低于人工测试员。开源代码扫描超 1,000 个项目,估算 6,202 个高危漏洞。修补瓶颈已从「发现」转移到「修补」:安全 patch 的生产速度正在超过人类的核查与部署能力。精讲二:快模型需要慢开发者:超高速 AI coding 时代的工程纪律 [视频]来自 AI Engineer Cerebras 与 OpenAI 联合开发的 Codex Spark 可达每秒 1,200 tokens——传统推理速度的约 20 倍。Sarah Chieng 论证,速度越快反而要求...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  39. 55

    EP65 · Agent 架构分叉、Notion 重新创业、GLM-5.1 · 05-23 早报

    精讲一:AI 智能体的未来:展望 Interrupt 2027 [视频]来自 LangChain LangChain 在 Interrupt 2027 主题演讲中点名 Agent 生产分裂为两类:长时程知识 Agent(运行数分钟乃至数天,需要沙箱与多 Agent 协调)和亚秒延迟的客户体验 Agent(原生语音、实时交互)。同步发布 Langsmith Fleet——领域专家无需写代码即可用自然语言构建 Agent,内置 200+ 集成、7500 个长尾工具,内测结果显示商机合格率提升 240%、每位 AE 每月节省 40 小时,是「托管式 Agent 规模落地」的首批具体基准。精讲二:Notion 创始人 Ivan Zhao:重塑公司的艺术 [视频]来自 Sequoia Capital Notion CEO Ivan Zhao 在 Sequoia 深度对话中分享将 SaaS 公司...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  40. 54

    EP64 · Agent 记忆原语、Qwen3 基座突围、评委即未来 · 05-22 早报

    精讲一:用于自学习自主 Agents 的 Memory 与 Dreaming [视频]来自 Claude Anthropic 工程师 Ravi 首次公开「Memory」与「Dreaming」两项平台原语:Memory 把 Agent 经验建模为虚拟文件系统,让 Agent 跨会话保留知识并通过乐观并发控制安全共享;Dreaming 则在后台异步整合碎片记忆、消除多 Agent 团队的重复学习。企业案例惊人——Rakuten 首次执行错误率下降 97%。这是 Anthropic 在「长程自主智能体」上迄今最具体的架构路径。精讲二:Qwen3.7-Max 重新定义 AI Agent 基座来自 通义大模型 通义实验室的 Qwen3.7-Max 在 35 小时连续执行、1158 次工具调用零中断的极限测试中展示出国产最强 Agent 基座能力:解耦训练架构让其跨框架泛化,在长程 Agenti...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  41. 53

    EP63 · OpenAI 攻克 Erdős、Claude Code Routines 上云 · 05-21 早报

    精讲一:Erdős 突破:OpenAI 模型首次实现重大 AI 数学发现 [视频]来自 OpenAI OpenAI 模型首次自主攻克了一个组合几何里的开放难题,被研究团队描述为 AI 从「辅助验证」跨向「原创发现」的分水岭。这道几何问题表面平凡、内部极为精细,需要在数千个微小战术决策之间做穿透式搜索;模型借助代数数论的结构性工具,找到了人类一直认为已是最优的构造之外的更优解。团队最初看到输出时连续几天反复核验,认为「太美好以至于不真实」,并坦言这条结果显著缩短了他们对 AI 自主科学发现到来时间表的预估。精讲二:用 Claude Code Routines 构建主动式智能体工作流 [视频]来自 Claude Anthropic 在开发者工作坊上发布 Claude Code Routines —— 把 Claude Code 从「敲指令才动」的被动工具升级为可在云端持续运行的主动智能体...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  42. 52

    EP62 · Google I/O 2026 / Karpathy 加入 Anthropic · 05.20 早报

    今日精讲Google I/O 2026 开发者主题演讲全览Google I/O 2026 把过去一年的 AI 押在「智能体」上:Gemini 3.5 系列模型登场,Antigravity 2.0 和全新 Antigravity CLI 让一个开发者就能调度多个子智能体并发处理工作流,内建跨平台终端沙箱、凭据掩码与 Git 策略;Android CLI 把 Android Studio 的能力封装成任意 LLM 都能调用的工具,WebMCP(Chrome 149 起 Origin Trial)让浏览器内智能体直接消费网页结构化能力。比起任何一条单独的模型 / 产品,更值得关注的是 Google 这次把「构建—运行—交付智能体」整条工程链路一次性补齐。 来自 Google Developers BlogKarpathy 重返一线研发:宣布加入 AnthropicKarpathy 在 X...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  43. 51

    EP61 · Composer 2.5 / 长时间 Agent / AI 生码率 · 05.19 早报

    今日精讲Cursor 发布 Composer 2.5:基于 Kimi K2.5 的智能升级Cursor 发布 Composer 2.5,基于 Moonshot Kimi K2.5 开源 checkpoint,引入 textual feedback RL(在 rollout 关键节点插入文本提示作教师信号)+ 25 倍合成任务规模。新模型显著提升长任务持续工作能力和指令遵循度,价格 0.50/2.50 美元每 M token,首周双倍额度。同时联合 SpaceXAI 用 Colossus 2 训练新一代模型 —— 交付节奏正在从产品迭代切换到模型迭代。 来自 Cursor Blog构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成 - 评估架构 [视频]Anthropic Applied AI 团队 Ash Prabaker 和 Andrew Wilson 在 A...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  44. 50

    P60 · AI 原生初创 / 资深工程师 LLM · 05.18 早报

    今日精讲创始人手册:打造 AI 原生初创公司Anthropic 官方从四个阶段(构思、MVP、发布、扩展)重构了 2026 年的创业方法论,宝玉翻译并补充了中文读者视角的注解。核心论点:创始人角色已从「写代码的工程师」转变为「AI 智能体的指挥家」,没有技术背景的人也能发布生产级软件,10 人估值超 10 亿美元的精益独角兽已从传说变为常规操作。文章在每个阶段给出可操作的工具栈(Claude Chat / Cowork / Code)和具体策略,是 2026 年创始人最值得精读的一手创业指南,也是理解 AI 如何从根本上改写「创始人」含义的权威视角。 来自 宝玉的分享2026 年,我作为资深工程师如何使用 LLM一位 GitHub 资深工程师以前后对照的方式,诚实记录了 AI 工具在 15 个月内的进化:从「偶尔用一下」变成「每个改动都先交给 Agent 跑一遍」。核心发现:Age...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  45. 49

    EP59 · ChatGPT 理财 / 智能体控制平面 / 新时代的产品 · 05.17 早报

    今日精讲ChatGPT 中的全新个人理财体验OpenAI 面向美国 Pro 用户推出 ChatGPT 个人理财功能:通过 Plaid 安全连接超过 1.2 万家金融机构,自动分类支出并生成可视化仪表盘,涵盖投资组合表现、订阅和待付账单。每月已有逾 2 亿人用 ChatGPT 咨询预算和投资;配合 GPT‑5.5 的推理能力,这次更新将通用建议升级为基于真实账户的个性化财务规划。这是 OpenAI 迄今最明确地向高信任垂直领域进军的一步,也是 ChatGPT 从对话工具向「个人 CFO」转型的关键节点。 来自 OpenAI BlogClaude 的下一个企业战场不是模型:而是智能体控制平面VentureBeat 对企业 AI 编排平台的首次系统调查显示,微软以 38.6% 份额领跑,OpenAI 以 25.7% 位居第二,Anthropic 从零起步跃至 5.7%,首次出现在企业智能...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  46. 48

    EP58 · AI 思考伙伴 / Abridge 医疗智能层 · Imagen 2.0 · 05.16 早报

    今日精讲将 AI 用作大规模工程系统的思考伙伴Google 高级 Staff 工程师 Julie Qiu 在 InfoQ 分享:她带的 gcloud CLI 团队要维护九种语言的客户端库,是个跨多仓库、多语言的复杂工程系统。她把 AI 当成一个能问问题、能一起做实验的伙伴,分三步:先读懂系统、再做实验,最后重新设计。最有用的不是让 AI 写代码,而是把每次「我应该这样改吗」的犹豫时间,从几天压到几小时。一份真正在用 AI 做事的资深工程师实操总结。 来自 InfoQAI 原生医疗:Abridge 一年 8000 万次就诊、为医生每周省 10-20 小时Abridge 成立于 2018 年,比 ChatGPT 早四年起步,安安静静做医疗里最难的一件事——医生和病人之间的对话。今年预计支持 8000 万次问诊,覆盖美国 250 家医院、28 种语言、50 多个专科;2025 年 6 月...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  47. 47

    BestBlogs 周刊第 95 期:Agent 工程化的全面落地

    本周亮点本周没有顶级模型发布,但 Anthropic、OpenAI、阿里、腾讯、淘宝、Kimi 同时把 Agent 真正推向生产。Coding 工具走出 IDE 走向整个计算机、Computer Use 工程化、Windows 沙箱、Agent Skill 开放标准;国内多智能体 Harness 三连发(Kimi×TiDB / 腾讯 / 阿里 Java 1.1);阿里继续追问 AI Native 时代研发组织该往哪走。时间线00:00 开场 · 本期主题 + BestBlogs 三步引导 / 邀请 / 老用户赠送01:41 主题一 · Coding 工具走出编辑器(Anthropic + OpenAI 同步答卷)06:19 主题二 · 评估 + 长时运行 + Agent Skill 开放标准08:57 主题三 · 国内多智能体 Harness 三连发12:25 主题四 · A...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  48. 46

    EP57 · Claude Code 最佳实践 / GPT-Realtime-2 · 05.15 早报

    BestBlogs Pro 早鸟内测开放:你可以自定义订阅源、配置兴趣标签,每天获得一份属于自己的头条早报。欢迎抢先体验,并把反馈发回给我们:https://bestblogs.dev今日精讲Claude Code 在大型代码库中的运作方式:最佳实践与入门指南 | ClaudeAnthropic 官方深度指南,面向百万行级大型代码库。核心洞察:「Harness 和模型同等重要」——五大扩展点(CLAUDE.md / Hooks / Skills / Plugins / MCP)加上 LSP 与子智能体共同决定实际表现。关键建议:用 LSP 实现符号级导航,子智能体解耦探索与编辑;每 3-6 个月随模型迭代更新配置,避免旧规则约束新能力。大型组织正出现「Agent Manager」这一新兴职能。 来自 Claude BlogBuild Hour 深解 GPT-Realtime-2:语...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  49. 45

    EP56 · Claude Agent 实战 / Codex 沙箱 · 05.14 早报

    今日精讲使用 Claude 进行计算机和浏览器操作的最佳实践Anthropic 针对 Claude 4.6 / Opus 4.7 发布权威最佳实践:点击不准的根本原因是截图超过 API 内部尺寸上限后被静默下采样导致坐标系偏移,解法是发送前主动将截图缩放到 1280×720(Opus 4.7 建议 1080p)。全文覆盖安全架构(必须使用专用虚拟机、绝不暴露敏感主机数据)、Browser Use 与 Computer Use 的场景取舍,以及 Agent 循环中人工确认门控的设计原则,是构建任何浏览器或桌面自动化 Agent 前的必读指南。 来自 Claude Blog在 Windows 上为 Codex 构建安全有效的沙箱Windows 没有 Linux seccomp 或 macOS Seatbelt 那样开箱即用的沙箱原语,OpenAI 为 Codex 逐一评估了 AppCo...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

  50. 44

    EP55 · 什么是代码 / ADK 长时间 Agent / Codex Computer Use · 05.13 早报

    今日精讲什么是代码?Unmesh Joshi(Thoughtworks 首席工程师、《Patterns of Distributed Systems》作者)在 LLM 时代重新追问:代码究竟是什么?他的答案:代码同时承载两个使命——给机器的指令(正在被 LLM 商品化),以及问题域的概念模型(这是真正难以被替代的价值)。当 LLM 将语法生成商品化,稀缺技能从「会写代码」转向「构建精准词汇表和共享理解」。这与 DDD 的「通用语言」和有界上下文一脉相承——在 AI 时代,开发者应该主动变强的是建模能力,而非打字速度。 来自 Martin Fowler构建支持暂停、恢复且永不丢失上下文的长时间运行 AI 智能体(基于 ADK)Google ADK 教程通过一个「新员工入职协调 Agent」展示了三项关键架构转变:持久化状态机(六个明确节点替代对话历史,彻底消除上下文污染)、事件驱动休...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动

Type above to search every episode's transcript for a word or phrase. Matches are scoped to this podcast.

Searching…

We're indexing this podcast's transcripts for the first time — this can take a minute or two. We'll show results as soon as they're ready.

No matches for "" in this podcast's transcripts.

Showing of matches

No topics indexed yet for this podcast.

Loading reviews...

ABOUT THIS SHOW

BestBlogs 早报音频版,精选 AI、技术、产品、设计与商业科技领域值得关注的高质量内容,陪你每天从真正重要的信息开始。

HOSTED BY

BestBlogs.dev

CATEGORIES

Frequently Asked Questions

How many episodes does BestBlogs have?

BestBlogs currently has 50 episodes available on PodParley. New episodes are automatically indexed when they're published to the podcast feed.

What is BestBlogs about?

BestBlogs 早报音频版,精选 AI、技术、产品、设计与商业科技领域值得关注的高质量内容,陪你每天从真正重要的信息开始。

How often does BestBlogs release new episodes?

BestBlogs has 50 episodes. Check the episode list to see recent publication dates and frequency.

Where can I listen to BestBlogs?

You can listen to BestBlogs on PodParley by clicking any episode. We provide an embedded audio player for direct listening, and you can also subscribe via your preferred podcast app using the RSS feed.

Who hosts BestBlogs?

BestBlogs is created and hosted by BestBlogs.dev.
URL copied to clipboard!