每日AI cover art

All Episodes

每日AI — 221 episodes

#
Title
1

百度:PaddleOCR-VL高效多语言文档解析视觉语言模型

2

Google:推测解码加速Transformer等自回归LLM

3

智能体世界模型:AI从预测者到造物主

4

普华永道:金融领域LLM 从传统RAG到智能体非向量推理系统 如何精准啃透长篇财报

5

ZAYA1-8B:基于MoE++架构的高效推理模型

6

TabPFN-2.5:下一代表格基础模型

7

OpenAI:AI智能体Context Engineering指南

8

PersonaLive:让数字人直播不掉链子

9

UniVidX:千段视频掌握物理法则 基于扩散先验的多模态全能视频生成框架

10

IBM:SmolDocling精准解析复杂PDF 超轻量端到端多模态文档解析模型

11

Google:Gemma 4本地模型提速三倍

12

PageIndex:无需向量基于推理的RAG框架

13

RecursiveMAS:AI智能体在潜空间直接对话

14

OpenAI:FD-loss让AI一步出图

15

OpenHands:开源AI软件开发Agents智能体平台

16

GigaWorld:让机器人反应提速九倍

17

华为:MoCapAnything V2 视频精准驱动任意3D骨骼

18

Meta:Tuna-2 细粒度视觉感知

19

BixBench:生物学AI Agent基准测试

20

MinerU2.5:高效高分辨率文档解析模型

21

OpenAI:推理模型的可监测性评估研究

22

Tequila:三值量化让手机跑大模型

23

Alibaba:零成本修复AI绘图信噪比偏差

24

普华永道:榨干提示词缓存红利-AI智能体提示词缓存评估

25

MultiWorld:可扩展的多Agents多视角视频世界模型

26

SkVM:Token消耗减半的高效AI Agent智能体时代编译运行系统

27

智能体Context Engineering:给AI一本自我进化笔记

28

Context Engineering:上下文工程综述

29

Vista4D:视频拍完也能重新运镜Video Reshooting

30

DFlash:让LLM无损加速快6倍

31

GPQA:博士开卷也挂科 研究生级科学基准测试

32

Context Engineering 2.0:AI如何读懂你

33

RKLD:精准切除AI隐私记忆

34

*思维链监控:AI正学会隐藏内心独白

35

Alibaba:零成本修复AI生图失真

36

Nature:LLM行为特征 潜意识学习

37

LLaDA2.0-Uni:统一AI逻辑与视觉

38

混元世界模型HY-World 2.0:单张照片造出3D世界

39

GenericAgent:92行代码AI通用智能体自进化

40

STOP:高效并行推理路径修剪框架省下七成AI算力

41

MIT:RLM AI靠写代码读透千万字

42

线性时间与恒定内存:基于RNN的Embedding

43

GeneBench:多阶段基因组学与定量生物学AI Agent评估

44

LingBot-Map:复杂场景高性能实时3D建模

45

人类最后的考试:前沿AI测评基准

46

SAMA:让AI视频动得稳 解耦语义锚定与运动对齐的视频编辑

47

RAG-Anything:全能多模态知识检索 看透长文档图表

48

OpenAI:AI为什么藏不住心里话 推理模型思维链CoT可控性研究

49

Artificial Analysis:AI智能指数4.0评估体系

50

Nvidia:Lyra AI让单张照片变4D

51

Google:ConvApparel对话式推荐系统

52

DiPO:用困惑度破解AI瓶颈

53

QuantCode-Bench:LLM量化交易策略生成评估基准

54

MindDR:高效多Agents Deep Research框架

55

AI为什么说话越来越像LLM Post-training输出多样性研究

56

Deep Neural Lesion:深度神经病变一比特摧毁大模型

57

W-RAC:高效低成本RAG网页文档检索框架

58

ClawGUI:让AI精准操控手机-GUI智能体全栈训练、评估与部署框架

59

MOSS-TTS:实现一小时声音克隆

60

EverMemOS:长程推理自组织存储操作系统终结AI健忘

61

StepFun:RealRestorer 挑战顶级闭源修图模型

62

Claude Code 设计架构深度解析

63

Anthropic:透明之翼计划 AI时代网络安全

64

Aurora:让大模型边干边学

65

Google:内存缓存破解大模型记忆瓶颈

66

Cursor+NVIDIA:多智能体系统加速GPU内核优化

67

Tsinghua:On-Policy Distillation LLM 在线蒸馏方法与优化

68

Anthropic:Weak-to-Strong Researcher AI克隆自己搞科研碾压人类

69

Weak-to-Strong Generalization:用弱模型监督训练超级AI

70

Cursor:多智能体层级协作写出百万行代码

71

UPenn:AI裁员的双输陷阱

72

Alibaba VulnSage:AI一美元挖出146个零日漏洞

73

Google:Memory Caching让AI过目不忘

74

清华:PDFMathTranslate保留排版的学术文档翻译工具

75

Tencent:HY-Embodied-0.5具身智能基础模型报告

76

Google Agent2Agent开放协议发布

77

Kronos:专为股市K线定制的预训练大模型

78

WildDet3D:全场景提示式三维物体检测-让AI看懂平面照片的3D深度

79

M365 Copilot用户感知的定性研究

80

Google:PaperOrchestra多智能体协作AI论文撰写框架

81

Netflix:VOID让AI学会推演视频物理因果

82

真幻渲染:基于AAA级游戏的超大规模双向视频数据集

83

神经计算机:没有操作系统的神经计算机

84

Meta:Muse Spark模型评估方法与基准报告-顶尖AI闭卷考成绩单曝光

85

Microsoft Copilot:2025年用户行为研究报告-手机医生和深夜哲学家

86

Meta:AI扩展框架第2版描绘AI紧急逃生系统

87

OpenAI:人工智能时代儿童保护蓝图

88

Google:DeepSearchQA基准测试顶尖AI为何做不好深度调研

89

Cursor:Warp Decode让MoE推理快1.8倍

90

OpenAI:以后AI发钱养你 智能时代以人为本的治理之道

91

Microsoft:高薪并非AI避风港

92

NVDIA:KV缓存变换编码KVTC 20倍压缩打破大模型内存墙

93

Astera+NVIDA:TTT-E2E Test-Time Training让AI边阅读边重塑大脑

94

Anthropic+Mila:DFC揪出AI的隐藏偏见

95

Lightricks:LTX-2高效高质量长视频与音频生成模型

96

Perplexity:DRACO深度研究能力的跨领域基准测试

97

PixelSmile:精准编辑图像和面部表情

98

ICLR 2026 浙大:利用LLM实现代码的高级性能优化

99

Sakana AI:AI战略官Marlin重定义商业智能的AI深层调研助手

100

Google DeepMind:当心AI助理被洗脑AI Agent Traps识别与防御智能体攻击框架

101

Qwen3-TTS:实现97毫秒极速语音合成克隆

102

Anthropic:绝望的AI真的会敲诈-LLM情感研究

103

Google:TimesFM时间序列模型精准预测未来

104

GPQA:博士开卷也挂科 研究生级科学基准测试

105

AliasRobotics:杜绝人形机器人黑客走进家门

106

微软:Agent Lightning让AI Agent智能体自我进化

107

ARC-AGI-3:互动式通用推理基准评估测试

108

AutoFigure-Edit:AI生成可编辑的科研插图

109

Vibe Coding XR:AI XR扩展现实原型设计实现手势交互与环境感知

110

Meta:TRIBE v2多模态大脑编码基础模型精准预判大脑反应

111

Meta:v-Sonar与v-LCM多模态1500种语言全球通用语义空间刷榜视频检索和字幕生成任务

112

QuantAgent:高频交易AI多智能体框架

113

Anthropic CEO:AI治愈癌症实现150岁人生

114

MinerU-Diffusion:扩散解码并行OCR刷榜复杂布局表格公式识别

115

多模块GRPO:新型强化学习算法

116

自主智能体新型漏洞ISC:顶级AI正自发突破安全底线

117

AgentScope:百万级智能体高效协作

118

OpenResearcher:深度研究智能体完整开源方案

119

Memento-Skills:AI自主设计技能库

120

Nvidia:Nemotron-Cascade 2级联RL MoE揽IMO和IOI金牌

121

daVinci-MagiHuman:单卡2秒生成数字人

122

HyperAgents:自我进化的新型AI框架

123

V-JEPA 2.1:视频自监督学习显著提升机器人操纵导航

124

Yann LeCun:LeWorldModel端到端像素级世界模型

125

Apple:XSA排他性自注意力修复Transformer缺陷

126

LightRAG:简单快速的图结构RAG

127

Fish Audio S2:指令驱动的多人多轮语音合成系统

128

MiroThinker:三个维度提升智能体复杂推理能力

129

EvoScientist:自演进多智能体端到端科学发现框架AI横扫顶会

130

首尔世界模型:AI让地图街景生动鲜活

131

Mem0:终结AI助理失忆症

132

MetaClaw:让AI助理学会自我进化

133

AutoDev:人工智能驱动的自动化软件开发框架

134

AllenAI:MolmoPoint指向性标记刷新GUI交互视频追踪世界记录

135

Yann LeCun:时间拉直教AI路径规划

136

AllenAI:ScholarQA-CS2面向专家标注的自动化评估流程

137

Baidu:Qianfan-OCR端到端文档智能统一模型

138

ByteDance:MoDA深度注意力实现跨层记忆

139

Datadog:Bits AI SRE自主化运维与故障排查助手

140

注意力残差:治愈AI深度失忆

141

MemOS:LLM记忆操作系统

142

OpenMOSS:RLCF社区反馈强化学习训练AI科学家

143

DeepSeek:Engram死记硬背让AI更聪明

144

Google DeepMind:MedGemma看病比医生还准的4B模型

145

ServiceNow+Mila:EnterpriseOps-Gym评估企业级智能体

146

Astera: TTT-E2E让AI边读边改权重

147

普林斯顿:OpenClaw-RL让AI在对话中实时进化

148

Google:ELIXR用LLM读懂X光片

149

AI-Trader:全自动化实时金融大模型评估基准-美股、A股和加密货币

150

SPO:自监督Prompt提示词工程优化

151

SkillFortify:数学逻辑应对Agentic AI技能漏洞

152

TradingAgents:AI模拟真实交易公司

153

Menlo VC:医疗保健行业竟成2025 AI领头羊

154

Essential-Web:15分钟筛选24万亿数据

155

BeyondWeb:30亿小模型靠重构数据逆袭

156

DCLM:好数据胜过暴力算力

157

MMLU-Redux:AI竟然在背错题拿高分

158

加州大学:Clawdrain掏空OpenClaw AI预算

159

MIT:2025年95%企业AI投资零回报

160

普华永道:2025全球AI就业指数-赋能效率与价值增长

161

Anthropic:2026.1经济指数报告与AI影响分析

162

Google:开源TranslateGemma小模型翻译反超大模型

163

阿里:SWE-CI评估Agent在持续集成中的代码维护能力

164

FinePhrase:万亿级合成数据实战指南

165

Anthropic:助手轴与LLM角色人格

166

Anthropic:2026 AI替代人类数据与趋势

167

Google:思想社会-推理模型协同进化

168

Anthropic:识别AI面试

169

GPT-5.4:重塑专业智能与计算机交互

170

Anthropic:Petri 2.0识破AI作弊

171

Google DeepMind:D4RT教AI看懂4D世界

172

北邮:AI Memory记忆综述-理论、分类、评估与前沿趋势

173

Ai2:Olmo Hybrid混合架构省一半数据

174

OpenAI:推理模型难以控制CoT思维链

175

Meta:多模预训练世界模型

176

GPT-5.3 Instant:更流畅实用的日常对话体验

177

BFL AI:自监督多模态可扩展合成

178

Google发表Nature论文如何提升LLM个性化推荐能力

179

Meta: Agentic Code Reasoning

180

阿里Qwen:长程智能体规划评估

181

基于文本合成的多轮工具使用轨迹

182

斯坦福:Cartridges将海量语料库压缩为轻量化虚拟缓存

183

阿里:通义AI开源深度科研智能体

184

Perplexity:pplx-embed高性能网页检索压缩

185

Sakana:瞬间内化记忆

186

ByteDance:用户反馈驱动的AGI模型训练框架

187

OpenAI:划定AGI安全红线

188

OpenAI:GPT-5助克隆效率提升79倍

189

Anthropic:别把人生决策权交给AI

190

Anthropic:别让AI偷走你的自主权

191

AI2 Allen AI 读论文自动推导科学定律

192

OpenAI发布AI数据智能体

193

Anthropic:AI困境-如何随任务复杂性而变化

194

Google PaperBanana让AI精准绘制学术插图

195

斯坦福:AI经常会犯哪些错误

196

ETH Zurich:上下文让AI变笨且费钱

197

Anthropic:如何防止AI失控

198

Cursor:智能体自主控制计算机

199

Anthropic:让AI模拟多种人格

200

Google:让多Agents默契合作

201

Waymo世界模型-自动驾驶模拟的新前沿

202

METR 衡量AI完成长任务能力

203

Meta, DeepMind, Amazon等共同发布Agent推理框架

204

斯坦福大学LLM推理失败研究综述

205

OpenClaw时代OpenAI智能体版图与安全防线

206

斯坦福大学2025人工智能报告

207

DeepMind DialogLab让AI掌握群聊潜规则

208

Anthropic 发布美国人工智能基建蓝图

209

Warp Oz 2026企业级AI Agents指南

210

Anthropic首起AI主导网络间谍攻击防御报告

211

Anthropic: Claude Prompt自动缓存

212

OpenAI GABRIEL结构化海量非结构化文本和图像

213

OpenAI EVMbench 区块链智能合约安全的AI测评基准

214

Anthropic AI智能体监测实践

215

Anthropic G轮:估值3800亿与企业智能扩张

216

清华大学智谱AI:GLM-5 从氛围编程迈向智能体工程

217

Datadog发布秘籍提升 LLM 性能、安全性和监控能力

218

Google论文:提升AI思考深度而非长度

219

OpenAI GPT-5.2自主推导物理定律

220

DeepMind的智能AI代理经济蓝图

221

AI并不会减少工作——加州大学伯克利分校研究