30 秒看重點

  • 微軟在 Build 2026 發布 MAI-Thinking-1,一兆參數的自研推理模型完全不使用 OpenAI 資料訓練,宣稱在程式碼任務上匹敵 Claude Opus 4.6。
  • 微軟同步推出 50 億參數的 MAI-Code-1-Flash 程式碼模型,價格比 Claude Haiku 4.5 更便宜,已可在 GitHub Copilot 中選用。
  • DeepSeek 即將完成首輪約 74 億美元融資,估值上看 590 億美元,騰訊和寧德時代等中國巨頭搶著投。
  • Intel 在台北 COMPUTEX 展出首款 18A 製程 Xeon 6+ 處理器,單一液冷機櫃塞入 36,864 核心,主打 AI Agent 推論密度。

微軟為什麼要自己做 AI 模型,不靠 OpenAI 了?

微軟在 Build 2026 正式發布 MAI-Thinking-1 推理模型,這是微軟第一款完全不使用 OpenAI 資料訓練的自研大型語言模型,代表微軟正在系統性地降低對 OpenAI 的依賴。

規格很有看頭。MAI-Thinking-1 採用稀疏混合專家架構(MoE),總參數約一兆,但每次推論只啟用 350 億個活躍參數,搭配 256,000 token 的上下文視窗。據 CNBC 和 Euronews 報導,微軟宣稱這款模型在 AIME 2025 數學推理測試中拿到 97%、AIME 2026 拿到 94.5%,在程式碼任務上匹敵 Claude Opus 4.6,而且在獨立人工評測中被評為優於 Claude Sonnet 4.6。不過要注意,這些基準成績目前只有微軟自己發表的預印本,尚未被獨立實驗室重現驗證,實際實力還需要時間證明。

微軟還同時端出了 MAI-Code-1-Flash,一個只有 50 億參數的輕量程式碼模型,已經可以在 GitHub Copilot 裡選用。它的定價比 Claude Haiku 4.5 更低,對微軟來說,自己的模型跑在自己的 Azure 上,不用付第三方授權費,省錢邏輯很直接。昨天我們才報導 Copilot 改計量計費讓開發者帳單暴漲,現在看來,微軟推出更便宜的自家模型,某種程度也是在回應這波不滿。

Build 大會上另外兩個東西也很有意思。Aion 1.0 系列是微軟的本地端小模型,其中 Aion 1.0 Plan 是 140 億參數的推理與工具呼叫模型,可以直接在 Windows 裝置上跑 AI Agent,不需要連雲端。另外 Project Solara 是一個以 AI Agent 為核心的全新平台,微軟展示了兩款概念裝置:一個桌上型 AI 助理用臉部辨識解鎖,另一個是穿戴式 AI 徽章,配備相機和即時對話轉錄功能。

名詞小教室:MoE(Mixture of Experts,混合專家架構)是一種聰明的模型設計方式。想像一間醫院有 100 位專科醫師,但每個病人來看診時,只會被分配到最合適的 3 到 5 位醫師會診,其他人不用上場。這樣整間醫院的能力很強(一兆參數),但每次看診只用到一小部分資源(350 億參數),所以回覆速度快、運算成本也低。

DeepSeek 首輪融資 74 億美元代表了什麼?

中國 AI 新創 DeepSeek 即將以 520 億至 590 億美元的估值完成約 74 億美元(約 500 億人民幣)的首輪融資,據彭博社 6 月 3 日報導,這將是中國 AI 產業史上最大規模的一筆募資。

投資人陣容堪稱豪華。據 CNBC 報導,騰訊考慮投入約 100 億人民幣,電池龍頭寧德時代(CATL)約 50 億人民幣,網易和京東也在洽談中。更特別的是,創辦人梁文峰自掏腰包放入 200 億人民幣,一個人就扛了這輪近四成的金額,投資人總數控制在 10 家以內。

DeepSeek 在 2025 年初靠 V3 和 R1 模型一鳴驚人,用遠低於矽谷同行的成本,做出了讓全球 AI 社群驚豔的開源模型。講白了,DeepSeek 證明了做頂級 AI 不一定要燒美國那種等級的錢。但 590 億美元的估值放在全球來看,跟 OpenAI 的 8,520 億美元或 Anthropic 的 9,650 億美元還有一大段距離。這個落差反映了一個現實:中國的 AI 估值體系跟矽谷的估值泡沫,目前還在完全不同的量級。

對台灣的開發者和企業來說,DeepSeek 的開源模型一直是高 CP 值的選擇。如果這筆錢讓他們推出更強的下一代模型,受惠的不只是中國市場,全球使用開源模型的開發者都會跟著受益。

Intel 在 COMPUTEX 端出了什麼 AI 新武器?

Intel 在台北 COMPUTEX 2026 展出首款採用 Intel 18A 製程的資料中心處理器 Xeon 6+,搭配 SambaNova 的 SN-50 AI 加速器,主打整機櫃等級的 AI 推論方案。

數字很猛。據 Intel 官方新聞稿,單一液冷機櫃可以在 32U 的空間裡塞入 36,864 個核心,功耗約 100 千瓦,Intel 宣稱這是目前市場上「最高的 AI Agent 密度」。前兩天黃仁勳才在同個場地發布了 RTX Spark,Intel 顯然不想讓 NVIDIA 獨占所有鎂光燈。

Intel 的策略是避開 GPU 訓練的主戰場,專攻推論和 Agent 工作負載。跟 SambaNova 合作是這個思路的延伸:SambaNova 的 RDU(可重配置資料流單元)專門為 AI 推論最佳化,配上 Intel CPU 做成整機櫃方案,瞄準的是那些不想把所有雞蛋放在 NVIDIA 籃子裡的企業客戶。新任 CEO Lip-Bu Tan 選在 COMPUTEX 親自上台演講,18A 製程首次用在資料中心 CPU 上,對 Intel 的製程轉型來說是一個關鍵的里程碑。

名詞小教室:AI 推論(Inference)跟 AI 訓練(Training)是兩件不同的事。訓練像是讓學生花好幾個月讀書準備考試,需要大量 GPU 和電力;推論則像是考試當天作答,重點是速度和效率。目前多數 AI 應用的成本其實花在推論上,也就是讓已經訓練好的模型不斷回答使用者的問題,所以推論效率越高,AI 服務的價格就越有機會降下來。

編輯觀點:每個人都在找備案,這對台灣是好事

今天三則新聞放在一起看,有個很清楚的共同訊號:AI 產業正在從「一家獨大」走向「多極分散」。

微軟砸了 130 億美元投資 OpenAI,現在卻積極自建模型陣線,還上週才因成本問題砍掉 Claude Code 授權;DeepSeek 用中國的資金和人才證明做頂級 AI 不是矽谷獨有的遊戲;Intel 選擇跟 SambaNova 合作打推論市場,而不是在 GPU 訓練領域跟 NVIDIA 死磕。每個玩家都在找不同的路。

我覺得這個趨勢對台灣反而是好消息。AI 產業越分散,供應鏈就越多元,台灣的半導體生態系就越有議價空間。台積電同時是 NVIDIA Vera Rubin 和 Intel 18A 的製造夥伴,微軟和 DeepSeek 的模型最終都跑在台灣晶片上。不管哪一方勝出,台灣都不會缺席。

明天值得關注

COMPUTEX 6 月 5 日迎來最後一天,預期還有更多 AI 產品發表。另外,SpaceX 與 xAI 的 IPO 路演據報定在 6 月 8 日啟動,科技圈的「兆元上市」競賽正持續升溫。


常見問題 FAQ

MAI-Thinking-1 是什麼模型?跟 OpenAI 有什麼關係?

MAI-Thinking-1 是微軟在 Build 2026 發布的首款自研推理模型,採用約一兆參數的混合專家架構(MoE),完全不使用 OpenAI 的資料或模型進行訓練。微軟宣稱它在數學推理和程式碼任務上的表現接近 Claude Opus 4.6,目前透過 Microsoft Foundry 提供私人預覽。

DeepSeek 的 74 億美元融資規模有多大?

DeepSeek 的首輪融資約 74 億美元(約 500 億人民幣),是中國 AI 產業史上最大的一筆募資。主要投資者包括騰訊(約 100 億人民幣)和寧德時代(約 50 億人民幣),創辦人梁文峰自己出資 200 億人民幣,估值預計達到 520 億至 590 億美元。

COMPUTEX 2026 有哪些 AI 相關亮點?

COMPUTEX 2026 以「AI Together」為主題,匯集 33 國、1,500 家企業、6,000 個攤位。AI 方面的亮點包括 NVIDIA 的 Vera Rubin 量產宣布和 RTX Spark 晶片、Intel 首款 18A 製程 Xeon 6+ 處理器搭配 SambaNova 的 AI 推論機架方案,以及多家台灣廠商展示的 AI 伺服器和機器人技術。


覺得這篇快報有幫助嗎?歡迎分享給同樣關注 AI 趨勢的朋友,我們每天更新,讓你不錯過任何重要的 AI 動態。