30 秒看重點

  • Mistral AI 發布 Medium 3.5 旗艦模型,128B 密集架構搭配 256K 上下文視窗,以開放權重釋出,並在 Le Chat 加入可自動執行多步驟任務的「Work 模式」。
  • 鴻海入選 TIME 2026 年百大影響力企業「創新者」類別,AI 伺服器全球市佔超過 40%,雲端部門已超越消費電子成為最大業務。
  • DeepSeek V4 首度針對華為 Ascend 晶片最佳化,同一週美國國務院發出外交電報指控中國 AI 公司竊取美國技術,中美 AI 晶片角力進入新階段。

Mistral Medium 3.5 為什麼值得關注?

Mistral AI 在 5 月 2 日發布旗艦模型 Medium 3.5,這是一個 128B 參數的密集模型,把指令遵循、推理和程式撰寫能力整合在同一組權重裡,並以修改版 MIT 授權開放下載。

目前 AI 界有兩條路線:一派追求超大模型(像 DeepSeek V4 的 1.6 兆參數混合專家架構),另一派在研究怎麼把單一模型做得更全能。Mistral 走的是後者。根據 WinBuzzer 報導,Medium 3.5 在 SWE-Bench Verified(測試 AI 修真實軟體 bug 的基準)拿下 77.6% 的成績,超過自家 Devstral 2 和 Qwen3.5。不過 SWE-bench 近期被質疑有資料污染問題,分數僅供參考。

真正有意思的是搭配推出的兩個功能。第一是 Le Chat 的「Work 模式」,你丟給它一個複雜任務,它會自己拆步驟、呼叫工具、一步步做完,不用你盯著。第二是 Vibe 遠端代理,在雲端跑長時間的程式開發任務。根據 MarkTechPost 報導,推理力道還能依需求調整,同一個模型可以回簡單問題也能跑複雜的 AI 代理人流程。

對一般使用者來說,重點就一個:又多了一個免費的強力 AI 模型。因為開放權重,企業可以自己架在內部伺服器上,資料不用交給別人。對在意資料隱私的台灣企業,這比純粹訂閱 ChatGPT 或 Claude 多了一個選擇。

名詞小教室:密集模型(Dense Model)和混合專家模型(MoE)差在哪?想像餐廳的運作方式。密集模型像一個全能主廚,每道菜從頭做到尾;MoE 像有一群各自專精的廚師,每道菜只派最合適的幾個人動手。密集模型通常比較穩定均衡,MoE 可以用更少的運算資源達到類似效果,各有優勢。

鴻海憑什麼入選 TIME 百大影響力企業?

鴻海以「AI 伺服器領域最重要的參與者」身分,入選 TIME 雜誌 2026 年全球百大影響力企業的「創新者」類別,全球 AI 伺服器市佔率已超過四成。

TIME 在 4 月 29 日公布榜單時特別提到,鴻海是 NVIDIA 旗艦級 GB200 伺服器的主要組裝商,在 AI 基礎建設供應鏈中佔據關鍵位置。根據 Focus Taiwan 報導,鴻海 2025 年的雲端運算與網路業務部門已超越消費性電子,成為公司最大的業務板塊,AI 伺服器營收年增 170%。

轉變有多劇烈?根據多家媒體報導,鴻海 2026 年第一季營收達到約 666 億美元,年增近 30%,主力成長來自 AI 伺服器訂單。鴻海正在墨西哥興建 9 億美元的新工廠,德州也有新設施在建,專門生產 NVIDIA 伺服器。更有意思的是,鴻海還跟 OpenAI 達成合作,共同設計下一代 AI 基礎設施。

對台灣來說,鴻海的轉型是整個產業的縮影:從「幫人組裝手機」升級成「幫全世界蓋 AI 大腦」。前幾天報導微軟和 Meta 分別砸下上千億美元 AI 資本支出,這些錢有很大一部分最終會流向台灣供應鏈。

DeepSeek V4 改用華為晶片,中美 AI 角力怎麼了?

DeepSeek V4 是第一個公開針對華為 Ascend AI 晶片最佳化的頂尖大型語言模型,中國 AI 產業正加速建立不依賴 NVIDIA 的替代路線。

我們在 4 月 25 日報導了 V4 的 1.6 兆參數和超低定價,但後來浮出的另一個重點是:V4-Flash(285B 參數的輕量版)很可能是在華為晶片上訓練的。根據 Cybernews 報導,這是首個在華為 Ascend 處理器上運行的頂尖 AI 模型,等於中國在 AI 晶片自主化上跨出了具體的一步。

時間點很微妙。V4 發布隔天,美國國務院就向全球大使館發出外交電報,要求外交人員警告各國政府「中國 AI 公司正在竊取美國技術」。據報導,電報點名了 DeepSeek、Moonshot AI 和 MiniMax。更早兩天,白宮科技政策辦公室發備忘錄,指控中國企業進行「蓄意的、工業規模的行動」來蒸餾美國的頂尖 AI 系統。中國外交部則回應稱指控「毫無根據」。

說白了,AI 的「晶片戰」正在升級。美國收緊對中國的 AI 晶片出口管制,中國用華為晶片證明自己不是非 NVIDIA 不可。昨天報導五角大廈與科技巨頭簽約、封殺 Anthropic,也是同一個地緣政治脈絡下的動作。對全球 AI 產業來說,供應鏈走向「一個世界、兩套系統」的可能性正在升高。

名詞小教室:蒸餾(Distillation)在 AI 裡是什麼?想像你有一瓶昂貴的威士忌(大型 AI 模型),蒸餾就是用這瓶酒的風味去「教」一瓶小酒(小模型),讓它學到精華。具體做法是用大模型產生的回答當教材來訓練小模型。美國指控中國公司拿 GPT-4 等模型的輸出來訓練自家模型,就是這個意思。

編輯觀點:三條戰線同時開打

三件事看似各自獨立,拼在一起卻能看出產業的走向。

模型層:Mistral 用 128B 密集架構挑戰閉源巨頭,DeepSeek 用超大 MoE 搭配破盤定價搶市場,開源陣營從「追趕者」變成「攪局者」。硬體層:鴻海吃下四成 AI 伺服器市場,華為試圖替代 NVIDIA,台灣和中國各自在不同環節搶佔位置。地緣政治層:美國指控中國竊取 AI 技術,中國加速晶片自主化,歐洲靠 Mistral 這樣的本土公司爭取 AI 主權。對台灣科技從業者來說,這三條戰線每一條都跟我們直接相關。

明天值得關注

Anthropic 的 Code with Claude 開發者大會下週登場,預計會發布新的開發工具。DeepSeek V4 Pro 的促銷定價 5 月底到期,想試用的開發者可以把握最後幾週。


常見問題 FAQ

Mistral Medium 3.5 跟 ChatGPT 比起來如何?

Mistral Medium 3.5 是一個 128B 參數的開源密集模型,在程式碼修復測試 SWE-Bench Verified 上拿下 77.6% 的成績。最大優勢是開放權重,企業可以免費下載部署在自己的伺服器上,不需要把資料傳到外部雲端,適合對資料隱私要求高的應用場景。

鴻海在 AI 伺服器市場的地位有多重要?

鴻海目前是全球最大的 AI 伺服器組裝商,市佔率超過 40%,也是 NVIDIA 旗艦級 GB200 伺服器的主要組裝商。2025 年 AI 伺服器營收年增 170%,雲端業務已超越消費電子成為公司最大業務板塊,2026 年第一季營收達約 666 億美元、年增近 30%。

DeepSeek V4 使用華為晶片代表什麼?

DeepSeek V4 是第一個公開針對華為 Ascend AI 晶片最佳化的頂尖大型語言模型,代表中國 AI 產業正在建立不依賴 NVIDIA 的替代供應鏈。在美國持續收緊對中國 AI 晶片出口管制的背景下,這對全球 AI 晶片市場格局可能產生重大影響。


覺得這篇快報有幫助嗎?歡迎分享給同樣關注 AI 趨勢的朋友,我們每天更新,讓你不錯過任何重要的 AI 動態。