EPISODE · Mar 31, 2026 · 11 MIN
EP14 · Voxtral TTS / Qwen3.5 Omni / Claude 5.0 · 03.31 早报
from BestBlogs
## 今日精讲00:35 Mistral 发布 Voxtral TTS 语音模型,并展望 Mistral 4Mistral AI 推出首款语音生成模型 Voxtral TTS,基于 3.8B 参数骨干网络,支持九种语言,质量媲美 ElevenLabs 但成本更低且权重开放。采用自回归语义 token 与声学 token 流匹配的独特架构。同时介绍了 Forge 微调平台和精简版 Leanstral。03:14 阿里发布 Qwen3.5-Omni,多模态能力超越 Gemini-3.1 Pro阿里新一代全模态大模型 Qwen3.5-Omni 在 215 项音视频任务中超越 Google Gemini-3.1 Pro。支持 113 种语言方言,具备音视频结构化描述和 Vibe Coding 能力。通过阿里云百炼平台提供三种 API 版本,每百万 tokens 输入不足 0.8 元,仅为竞...去小宇宙查看完整单集简介前往小宇宙评论区与主播互动
NOW PLAYING
EP14 · Voxtral TTS / Qwen3.5 Omni / Claude 5.0 · 03.31 早报
No transcript for this episode yet
Similar Episodes
No similar episodes found.
Similar Podcasts
No similar podcasts found.