通義千問開源模型Qwen3 全面超越Deepseek R1

4月29日,通義App與通義網頁版(tongyi.com)全面上線阿裏新一代通義千問開源模型Qwen3(千向3)。

千問3以235B參數量的混合專家(MoE)架構,在性能上全面超越DeepSeek-R1、OpenAI-o1等頂尖模型。其創新性的”混合推理”機制將”快思考”(低算力秒回簡單問題)與”慢思考”(多步驟深度處理複雜任務)無縫整合,實現算力消耗降低60%。

在三大關鍵評測中刷新紀錄
AIME25奧數評測:81.5分(超越所有開源模型)
LiveCodeBench代碼能力:突破70分大關(超過Grok3)
Arena人類偏好對齊:95.6分(領先OpenAI-o1)

革命性成本優勢​​
部署旗艦模型僅需4張H20顯卡,顯存佔用僅為同類模型的1/3。通過參數啟動優化(僅需啟動22B參數),企業級32B稠密模型可跨級實現上代72B模型的性能。

智能化升級
以”超級智能體”為核心:
多模態交互:圖片理解/生成、多語言即時翻譯(支持119種語言)
場景化服務:文檔寫作助手、跨設備操作(手機/電腦Agent協同)
代碼生成:支持主流編程語言即時糾錯與優化
教育輔助:拍照解題準確率提升至92%,覆蓋K12至研究生數學題
企業服務:32B模型提供私有化部署方案,API調用延遲降低40%

開放戰略升級​​
延續Apache2.0協議,模型已上線魔搭社區、HuggingFace等平臺,全球衍生模型超10萬個。開發者可通過阿裏雲百煉獲取商業API服務。
​​
硬體需求:H20顯卡性價比優勢凸顯,或影響英偉達產品線佈局
企業轉型:中小企業AI部署成本門檻降低至萬元級
國家安全:完全自主的架構設計為關鍵領域國產替代提供技術保障

Disclaimer © 2025 TASTY MONEY
以上資訊僅供參考,相關內容純屬個人意見,不代表本台立場。投資涉及風險,股票和結構性產品如窩輪、牛熊證之價格可升可跌,投資者可能會損失全部本金,請自行注意風險。

訂閱及追蹤 Tasty Money 財經節目、主持人及專欄作家的最新動向
https://www.tastymoney.hk/subscribe/