
這波國產模型與晶片的即時協作,也讓關注本土技術進展的開發者能更快看到實際表現。

MiniMax M3開源 國產GPU即日支援 事件脈絡與關鍵事實
2026年6月,AI新創公司MiniMax正式開源其新一代多模態大模型M3,成為首款同時具備百萬級超長上下文、原生多模態與頂尖程式設計能力的國產大模型。該模型基於自研的MSA稀疏注意力架構,上下文長度可達100萬Token,在長文本處理、智慧體調用與程式生成等任務中表現突出。為支援此高運算需求,摩爾線程同步宣布其旗艦AI訓練與推理整合智算卡MTT S5000完成Day-0適配。MTT S5000搭載80GB大容量顯存與1.6TB/s超高頻寬,單卡稠密AI算力達1000 TFLOPS,並具備原生FP8加速能力,可有效處理百萬Token級別的資料緩存與吞吐。
摩爾線程透過硬體、軟體與框架三層優化,確保M3在國產GPU上的高效運行。軟體層面,基於MUSA架構與完整工具鏈,實現新算子快速移植與定制化原生算子開發,在不損失精度下降低推理延遲、提升吞吐效率。該卡也同步相容vLLM與SGLang兩大主流推理框架,提供開發者多元部署選擇。目前開發者可透過官方鏡像,基於MUSA軟體棧快速部署與體驗M3模型。
此舉標誌國產AI軟硬體生態進一步整合。摩爾線程已持續完成多款主流國產大模型的即日適配,建立從模型支援、部署到效能調校的完整體系,推動大模型技術落地與規模化應用。隨著本土技術鏈的成熟,國產AI解決方案的自主性與實用性正持續提升。
事實
- 2026年6月13日,MiniMax正式開源其新一代多模態大模型M3,支援百萬級超長上下文。
- 摩爾線程宣布其旗艦AI智算卡MTT S5000完成對MiniMax M3的Day-0即日適配。
- MTT S5000搭載80GB顯存與1.6TB/s頻寬,單卡AI算力達1000 TFLOPS,支援FP8原生加速。
- MiniMax M3基於自研MSA稀疏注意力架構,上下文窗口可達100萬Token。
- 該模型已可透過官方鏡像在摩爾線程MUSA軟體棧上快速部署。
Canto 的視覺新聞解說。製作過程可能有 AI 輔助。 編輯政策





