聽新聞
0:00 /
0:00
阿里最強開源模型 上秀

阿里巴巴昨(29)日發布新一代通義千問Qwen3(千問3)系列人工智慧(AI)模型,新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降。
在LiveCodeBench大語言模型評測榜單中,千問3模型性能全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。
千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創下所有大陸國產模型及全球開源模型的性能新高。
據中國證券報,千問3是大陸國內首個「混合推理模型」,「快思考」與「慢思考」集成進同一個模型,對簡單需求可低算力「秒回」答案,適用於對速度要求高於深度的簡單問題。而對複雜問題可多步驟「深度思考」,節省算力消耗。
至於性能方面,千問3預訓練數據量達36T ,並在後訓練階段進行多輪強化學習,在推理、指令遵循、工具調用、多語言能力等方面均有增強。
在效能提升的同時,Qwen3部署成本下降,僅需四張H20即可部署Qwen3滿血版,顯示卡記憶體占用僅為性能相近模型的三分之一。
阿里通義已開源200餘個模型,全球下載量超三億次,千問衍生模型數超10萬個,衍生模型數量已超越美國Llama,成為全球第一開源模型。
延伸閱讀
贊助廣告
商品推薦
udn討論區
共 0 則留言
規範
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言