EPISODE · Feb 10, 2025 · 1H
DeepSeek:從量化交易 Side Project 顛覆 AI 賽局
from MDBros|Paradigm Shifts in Healthcare · host MDBros
DeepSeek 由中國量化交易巨頭幻方量化創立,專注開發大型語言模型並堅持開源策略,V3 以超低成本與 GPT-4 媲美,擁有 671B 參數及創新 MLA、MTP 等技術;R1 更藉強化學習強化思考能力,展現自我反思、多元解法等 Emergent Behavior,對 AI 產業影響及意義深遠。 DeepSeek V3 DeepSeek R1 模型 -- Hosting provided by SoundOn
What this episode covers
DeepSeek 由中國量化交易巨頭幻方量化創立,專注開發大型語言模型並堅持開源策略,V3 以超低成本與 GPT-4 媲美,擁有 671B 參數及創新 MLA、MTP 等技術;R1 更藉強化學習強化思考能力,展現自我反思、多元解法等 Emergent Behavior,對 AI 產業影響及意義深遠。 DeepSeek V3 DeepSeek R1 模型 -- Hosting provided by SoundOn
NOW PLAYING
DeepSeek:從量化交易 Side Project 顛覆 AI 賽局
No transcript for this episode yet
Similar Episodes
Mar 19, 2026 ·34m
Feb 18, 2026 ·11m
Feb 11, 2026 ·45m
Nov 12, 2025 ·35m
Oct 17, 2025 ·40m