All Episodes
每日AI — 221 episodes
百度:PaddleOCR-VL高效多语言文档解析视觉语言模型
Google:推测解码加速Transformer等自回归LLM
智能体世界模型:AI从预测者到造物主
普华永道:金融领域LLM 从传统RAG到智能体非向量推理系统 如何精准啃透长篇财报
ZAYA1-8B:基于MoE++架构的高效推理模型
TabPFN-2.5:下一代表格基础模型
OpenAI:AI智能体Context Engineering指南
PersonaLive:让数字人直播不掉链子
UniVidX:千段视频掌握物理法则 基于扩散先验的多模态全能视频生成框架
IBM:SmolDocling精准解析复杂PDF 超轻量端到端多模态文档解析模型
Google:Gemma 4本地模型提速三倍
PageIndex:无需向量基于推理的RAG框架
RecursiveMAS:AI智能体在潜空间直接对话
OpenAI:FD-loss让AI一步出图
OpenHands:开源AI软件开发Agents智能体平台
GigaWorld:让机器人反应提速九倍
华为:MoCapAnything V2 视频精准驱动任意3D骨骼
Meta:Tuna-2 细粒度视觉感知
BixBench:生物学AI Agent基准测试
MinerU2.5:高效高分辨率文档解析模型
OpenAI:推理模型的可监测性评估研究
Tequila:三值量化让手机跑大模型
Alibaba:零成本修复AI绘图信噪比偏差
普华永道:榨干提示词缓存红利-AI智能体提示词缓存评估
MultiWorld:可扩展的多Agents多视角视频世界模型
SkVM:Token消耗减半的高效AI Agent智能体时代编译运行系统
智能体Context Engineering:给AI一本自我进化笔记
Context Engineering:上下文工程综述
Vista4D:视频拍完也能重新运镜Video Reshooting
DFlash:让LLM无损加速快6倍
GPQA:博士开卷也挂科 研究生级科学基准测试
Context Engineering 2.0:AI如何读懂你
RKLD:精准切除AI隐私记忆
*思维链监控:AI正学会隐藏内心独白
Alibaba:零成本修复AI生图失真
Nature:LLM行为特征 潜意识学习
LLaDA2.0-Uni:统一AI逻辑与视觉
混元世界模型HY-World 2.0:单张照片造出3D世界
GenericAgent:92行代码AI通用智能体自进化
STOP:高效并行推理路径修剪框架省下七成AI算力
MIT:RLM AI靠写代码读透千万字
线性时间与恒定内存:基于RNN的Embedding
GeneBench:多阶段基因组学与定量生物学AI Agent评估
LingBot-Map:复杂场景高性能实时3D建模
人类最后的考试:前沿AI测评基准
SAMA:让AI视频动得稳 解耦语义锚定与运动对齐的视频编辑
RAG-Anything:全能多模态知识检索 看透长文档图表
OpenAI:AI为什么藏不住心里话 推理模型思维链CoT可控性研究
Artificial Analysis:AI智能指数4.0评估体系
Nvidia:Lyra AI让单张照片变4D
Google:ConvApparel对话式推荐系统
DiPO:用困惑度破解AI瓶颈
QuantCode-Bench:LLM量化交易策略生成评估基准
MindDR:高效多Agents Deep Research框架
AI为什么说话越来越像LLM Post-training输出多样性研究
Deep Neural Lesion:深度神经病变一比特摧毁大模型
W-RAC:高效低成本RAG网页文档检索框架
ClawGUI:让AI精准操控手机-GUI智能体全栈训练、评估与部署框架
MOSS-TTS:实现一小时声音克隆
EverMemOS:长程推理自组织存储操作系统终结AI健忘
StepFun:RealRestorer 挑战顶级闭源修图模型
Claude Code 设计架构深度解析
Anthropic:透明之翼计划 AI时代网络安全
Aurora:让大模型边干边学
Google:内存缓存破解大模型记忆瓶颈
Cursor+NVIDIA:多智能体系统加速GPU内核优化
Tsinghua:On-Policy Distillation LLM 在线蒸馏方法与优化
Anthropic:Weak-to-Strong Researcher AI克隆自己搞科研碾压人类
Weak-to-Strong Generalization:用弱模型监督训练超级AI
Cursor:多智能体层级协作写出百万行代码
UPenn:AI裁员的双输陷阱
Alibaba VulnSage:AI一美元挖出146个零日漏洞
Google:Memory Caching让AI过目不忘
清华:PDFMathTranslate保留排版的学术文档翻译工具
Tencent:HY-Embodied-0.5具身智能基础模型报告
Google Agent2Agent开放协议发布
Kronos:专为股市K线定制的预训练大模型
WildDet3D:全场景提示式三维物体检测-让AI看懂平面照片的3D深度
M365 Copilot用户感知的定性研究
Google:PaperOrchestra多智能体协作AI论文撰写框架
Netflix:VOID让AI学会推演视频物理因果
真幻渲染:基于AAA级游戏的超大规模双向视频数据集
神经计算机:没有操作系统的神经计算机
Meta:Muse Spark模型评估方法与基准报告-顶尖AI闭卷考成绩单曝光
Microsoft Copilot:2025年用户行为研究报告-手机医生和深夜哲学家
Meta:AI扩展框架第2版描绘AI紧急逃生系统
OpenAI:人工智能时代儿童保护蓝图
Google:DeepSearchQA基准测试顶尖AI为何做不好深度调研
Cursor:Warp Decode让MoE推理快1.8倍
OpenAI:以后AI发钱养你 智能时代以人为本的治理之道
Microsoft:高薪并非AI避风港
NVDIA:KV缓存变换编码KVTC 20倍压缩打破大模型内存墙
Astera+NVIDA:TTT-E2E Test-Time Training让AI边阅读边重塑大脑
Anthropic+Mila:DFC揪出AI的隐藏偏见
Lightricks:LTX-2高效高质量长视频与音频生成模型
Perplexity:DRACO深度研究能力的跨领域基准测试
PixelSmile:精准编辑图像和面部表情
ICLR 2026 浙大:利用LLM实现代码的高级性能优化
Sakana AI:AI战略官Marlin重定义商业智能的AI深层调研助手
Google DeepMind:当心AI助理被洗脑AI Agent Traps识别与防御智能体攻击框架
Qwen3-TTS:实现97毫秒极速语音合成克隆
Anthropic:绝望的AI真的会敲诈-LLM情感研究
Google:TimesFM时间序列模型精准预测未来
GPQA:博士开卷也挂科 研究生级科学基准测试
AliasRobotics:杜绝人形机器人黑客走进家门
微软:Agent Lightning让AI Agent智能体自我进化
ARC-AGI-3:互动式通用推理基准评估测试
AutoFigure-Edit:AI生成可编辑的科研插图
Vibe Coding XR:AI XR扩展现实原型设计实现手势交互与环境感知
Meta:TRIBE v2多模态大脑编码基础模型精准预判大脑反应
Meta:v-Sonar与v-LCM多模态1500种语言全球通用语义空间刷榜视频检索和字幕生成任务
QuantAgent:高频交易AI多智能体框架
Anthropic CEO:AI治愈癌症实现150岁人生
MinerU-Diffusion:扩散解码并行OCR刷榜复杂布局表格公式识别
多模块GRPO:新型强化学习算法
自主智能体新型漏洞ISC:顶级AI正自发突破安全底线
AgentScope:百万级智能体高效协作
OpenResearcher:深度研究智能体完整开源方案
Memento-Skills:AI自主设计技能库
Nvidia:Nemotron-Cascade 2级联RL MoE揽IMO和IOI金牌
daVinci-MagiHuman:单卡2秒生成数字人
HyperAgents:自我进化的新型AI框架
V-JEPA 2.1:视频自监督学习显著提升机器人操纵导航
Yann LeCun:LeWorldModel端到端像素级世界模型
Apple:XSA排他性自注意力修复Transformer缺陷
LightRAG:简单快速的图结构RAG
Fish Audio S2:指令驱动的多人多轮语音合成系统
MiroThinker:三个维度提升智能体复杂推理能力
EvoScientist:自演进多智能体端到端科学发现框架AI横扫顶会
首尔世界模型:AI让地图街景生动鲜活
Mem0:终结AI助理失忆症
MetaClaw:让AI助理学会自我进化
AutoDev:人工智能驱动的自动化软件开发框架
AllenAI:MolmoPoint指向性标记刷新GUI交互视频追踪世界记录
Yann LeCun:时间拉直教AI路径规划
AllenAI:ScholarQA-CS2面向专家标注的自动化评估流程
Baidu:Qianfan-OCR端到端文档智能统一模型
ByteDance:MoDA深度注意力实现跨层记忆
Datadog:Bits AI SRE自主化运维与故障排查助手
注意力残差:治愈AI深度失忆
MemOS:LLM记忆操作系统
OpenMOSS:RLCF社区反馈强化学习训练AI科学家
DeepSeek:Engram死记硬背让AI更聪明
Google DeepMind:MedGemma看病比医生还准的4B模型
ServiceNow+Mila:EnterpriseOps-Gym评估企业级智能体
Astera: TTT-E2E让AI边读边改权重
普林斯顿:OpenClaw-RL让AI在对话中实时进化
Google:ELIXR用LLM读懂X光片
AI-Trader:全自动化实时金融大模型评估基准-美股、A股和加密货币
SPO:自监督Prompt提示词工程优化
SkillFortify:数学逻辑应对Agentic AI技能漏洞
TradingAgents:AI模拟真实交易公司
Menlo VC:医疗保健行业竟成2025 AI领头羊
Essential-Web:15分钟筛选24万亿数据
BeyondWeb:30亿小模型靠重构数据逆袭
DCLM:好数据胜过暴力算力
MMLU-Redux:AI竟然在背错题拿高分
加州大学:Clawdrain掏空OpenClaw AI预算
MIT:2025年95%企业AI投资零回报
普华永道:2025全球AI就业指数-赋能效率与价值增长
Anthropic:2026.1经济指数报告与AI影响分析
Google:开源TranslateGemma小模型翻译反超大模型
阿里:SWE-CI评估Agent在持续集成中的代码维护能力
FinePhrase:万亿级合成数据实战指南
Anthropic:助手轴与LLM角色人格
Anthropic:2026 AI替代人类数据与趋势
Google:思想社会-推理模型协同进化
Anthropic:识别AI面试
GPT-5.4:重塑专业智能与计算机交互
Anthropic:Petri 2.0识破AI作弊
Google DeepMind:D4RT教AI看懂4D世界
北邮:AI Memory记忆综述-理论、分类、评估与前沿趋势
Ai2:Olmo Hybrid混合架构省一半数据
OpenAI:推理模型难以控制CoT思维链
Meta:多模预训练世界模型
GPT-5.3 Instant:更流畅实用的日常对话体验
BFL AI:自监督多模态可扩展合成
Google发表Nature论文如何提升LLM个性化推荐能力
Meta: Agentic Code Reasoning
阿里Qwen:长程智能体规划评估
基于文本合成的多轮工具使用轨迹
斯坦福:Cartridges将海量语料库压缩为轻量化虚拟缓存
阿里:通义AI开源深度科研智能体
Perplexity:pplx-embed高性能网页检索压缩
Sakana:瞬间内化记忆
ByteDance:用户反馈驱动的AGI模型训练框架
OpenAI:划定AGI安全红线
OpenAI:GPT-5助克隆效率提升79倍
Anthropic:别把人生决策权交给AI
Anthropic:别让AI偷走你的自主权
AI2 Allen AI 读论文自动推导科学定律
OpenAI发布AI数据智能体
Anthropic:AI困境-如何随任务复杂性而变化
Google PaperBanana让AI精准绘制学术插图
斯坦福:AI经常会犯哪些错误
ETH Zurich:上下文让AI变笨且费钱
Anthropic:如何防止AI失控
Cursor:智能体自主控制计算机
Anthropic:让AI模拟多种人格
Google:让多Agents默契合作
Waymo世界模型-自动驾驶模拟的新前沿
METR 衡量AI完成长任务能力
Meta, DeepMind, Amazon等共同发布Agent推理框架
斯坦福大学LLM推理失败研究综述
OpenClaw时代OpenAI智能体版图与安全防线
斯坦福大学2025人工智能报告
DeepMind DialogLab让AI掌握群聊潜规则
Anthropic 发布美国人工智能基建蓝图
Warp Oz 2026企业级AI Agents指南
Anthropic首起AI主导网络间谍攻击防御报告
Anthropic: Claude Prompt自动缓存
OpenAI GABRIEL结构化海量非结构化文本和图像
OpenAI EVMbench 区块链智能合约安全的AI测评基准
Anthropic AI智能体监测实践
Anthropic G轮:估值3800亿与企业智能扩张
清华大学智谱AI:GLM-5 从氛围编程迈向智能体工程
Datadog发布秘籍提升 LLM 性能、安全性和监控能力
Google论文:提升AI思考深度而非长度
OpenAI GPT-5.2自主推导物理定律
DeepMind的智能AI代理经济蓝图
AI并不会减少工作——加州大学伯克利分校研究