30 秒看重點
- Google 搜尋框迎來 25 年來最大改版,從單純的關鍵字輸入框變成支援文字、圖片、文件、影片的多模態 AI 對話入口,AI Mode 月活躍使用者已突破 10 億。
- Google 推出「資訊代理人」功能,能 24 小時在背景自動監控你指定的主題,有新消息就推播通知到手機,今年夏天先開放美國 AI Pro 和 Ultra 訂戶使用。
- Google 發表 Gemini Omni 世界模型,能理解物理法則、光影和場景邏輯,使用者可以用自然語言對話的方式編輯影片,已開放 AI Plus 以上訂戶使用。
- Microsoft AI 執行長 Mustafa Suleyman 預測,幾乎所有「坐在電腦前」的白領工作任務,都將在 18 個月內被 AI 全面自動化。
Google 搜尋框為什麼要在 25 年後大改版?
Google 在 I/O 2026 宣布了搜尋框自 2001 年推出以來最大幅度的改版,正式從關鍵字輸入工具轉型為支援多模態互動的 AI 對話入口,搜尋結果也從藍色連結清單變成由 AI 直接生成的整合式答案。
回想一下你平常怎麼用 Google:打幾個關鍵字、按搜尋、從一堆連結裡挑一個點進去。這個流程用了二十幾年,幾乎沒什麼變化。但 Google 搜尋副總裁 Liz Reid 在 I/O 上丟出一句很有分量的話:「這是搜尋框推出以來最大的一次升級。」據 VentureBeat 報導,新的搜尋介面不再只接受文字,你可以直接丟圖片、文件、影片、甚至正在瀏覽的網頁分頁進去,搜尋框會動態擴展,讓你有空間好好描述你到底想找什麼。以前那個窄窄的搜尋框鼓勵你用兩三個關鍵字,新版本則鼓勵你把問題完整說清楚。
更驚人的數字是:AI Mode 的月活躍使用者已經突破 10 億,搜尋量每季翻倍成長。這代表已經有很多人開始習慣用 AI 對話的方式搜尋,而不是傳統的關鍵字。
不過最讓人興奮的可能是新推出的「資訊代理人」功能。你可以在 AI Mode 裡下一個指令,比如「幫我追蹤台北飛東京的機票價格」或「每天告訴我 AI 產業有什麼新消息」,然後這個代理人就會 24 小時在背景持續運作,有符合條件的結果就直接推播通知到你手機上。據 Google 官方部落格介紹,它不只是簡單的關鍵字比對通知(那是舊版 Google 快訊做的事),而是真的會去理解多個來源的資訊、比較不同觀點、告訴你為什麼這件事重要。昨天我們報導了 Gemini 3.5 Flash 和 Spark 的細節,今天的搜尋改版可以看成同一個大方向:Google 想讓 AI 不只是回答你的問題,還要主動幫你找答案。
這項功能預計今年夏天先在美國開放給 Google AI Pro 和 Ultra 訂戶使用。
名詞小教室:AI Mode 是 Google 搜尋裡的 AI 對話模式。你可以把它想成在 Google 搜尋裡面內建了一個像 ChatGPT 的對話框,你用自然語言問問題,它直接給你整理好的答案,而不是丟一堆連結要你自己去翻。
Gemini Omni 是什麼?為什麼 Google 說它能「模擬世界」?
Google 在 I/O 2026 同步發表了 Gemini Omni,這是一個「世界模型」,能理解物理法則、光影邏輯和文化脈絡,讓使用者透過自然語言對話的方式來生成和編輯影片。
「世界模型」聽起來很抽象,講白一點就是:這個 AI 不只會把畫面拼起來,它真的懂東西掉下來會往下、光從窗戶照進來會在地上產生影子、一個人走路的動作應該要合理。據 Decrypt 報導,Google DeepMind 執行長 Demis Hassabis 表示,Gemini Omni 結合了 Gemini 語言模型和多個媒體生成模型(包括 Veo、Nano Banana 和 Genie),能同時處理文字、圖片、音訊和現有影片片段,產出物理上合理的影片內容。
最酷的功能是「對話式影片編輯」。以前你想改一段影片的背景、光線或鏡頭角度,需要開專業剪輯軟體一個一個調。現在你只要用講的:「把背景換成夕陽海邊」、「鏡頭拉遠一點」、「光線調暖一些」,Omni 就能幫你搞定。對完全不會用 Premiere 或 Final Cut 的人來說,這等於直接跳過學習曲線。
Gemini Omni Flash 已經開放給 Google AI Plus、Pro 和 Ultra 訂戶使用,並且整合進 YouTube Shorts 和 YouTube Create app,本週開始不額外收費。
名詞小教室:世界模型(World Model)是一種能理解真實世界運作方式的 AI 模型。你可以想像成一個在腦中建立了物理世界「常識」的 AI,它知道球會彈、水會流、影子會隨光源移動。這讓它生成的影片看起來更真實,而不是那種手指有六根、文字會扭曲的 AI 影片。
Microsoft AI 執行長預測:18 個月後白領工作全面自動化?
Microsoft AI 執行長 Mustafa Suleyman 近期預測,幾乎所有涉及「坐在電腦前工作」的白領任務,將在未來 18 個月內被 AI 全面自動化,包括會計、法律、行銷和專案管理等領域。
這個預測來自 Suleyman 接受英國《金融時報》專訪時的發言。據 Fortune 報導,他用的措辭是「human-level performance on most, if not all professional tasks」(在大多數甚至所有專業任務上達到人類水準)。換算一下時間,18 個月後大約是 2027 年底。
說實話,這種預測每隔幾個月就會出現一次,而且通常來自正在賣 AI 產品的人,所以要打個折扣。但 Suleyman 的背景比較特殊:他是 DeepMind 的共同創辦人,後來被微軟挖去領導整個 AI 部門。他不是在做夢的創業家,而是手上握著 Azure、Copilot、GitHub 這些產品線的人。
不過,「自動化任務」和「取代工作」是兩回事。AI 能幫你自動整理報表、草擬合約初稿、排程行銷活動,不代表不需要人來做最終判斷和決策。比較務實的看法是:AI 會讓白領工作者的生產力大幅提升,同時淘汰一些純粹做重複性資料處理的職位。至於全面自動化?講真的,Suleyman 自己大概也知道這個時間表太激進了,但作為 AI 部門主管,他有動機把餅畫大一點。
編輯觀點:搜尋的本質正在改變
今天的三個消息串起來看,有一個共同的主題:AI 正在從「你來用我」變成「我主動幫你」。
Google 搜尋不再等你打關鍵字,資訊代理人會自己去盯著你關心的事。Gemini Omni 不需要你學剪輯軟體,用講的就能改影片。Suleyman 預測的白領自動化,本質上也是 AI 主動接手人類的例行任務。這些變化對台灣使用者的啟示很直接:不管你是學生、上班族還是創作者,學會「怎麼跟 AI 溝通」會越來越重要。不是學寫程式,而是學會把你的需求講清楚,讓 AI 幫你完成。
明天值得關注
Google I/O 2026 的 85 場以上技術講座將從明天起陸續上線,其中 Antigravity 2.0 開發者平台(把 AI 寫程式從單人作業升級為多代理人協作)的深度教學特別值得開發者關注。另外,Anthropic 的 300 億美元融資案據報導可能在本月底前完成交割,如果成真將成為全球估值最高的 AI 新創公司。
常見問題 FAQ
什麼是 Google 的 AI 資訊代理人?
Google 的 AI 資訊代理人是 Google 搜尋 AI Mode 裡的新功能,使用者可以指定想追蹤的主題(例如機票價格、產業新聞),代理人會 24 小時在背景持續監控網路上的相關資訊,有更新就透過 Google app 推播通知。跟舊版 Google 快訊不同,資訊代理人會理解內容、比較不同來源的觀點,並告訴你為什麼這件事重要。預計今年夏天先在美國開放給 AI Pro 和 Ultra 訂戶。
Gemini Omni 和一般的 AI 影片生成工具有什麼不同?
Gemini Omni 是 Google 的「世界模型」,最大的差異在於它理解物理法則和真實世界的運作方式,生成的影片在光影、動作和物理效果上會更合理。它還支援「對話式編輯」,使用者可以用自然語言指令修改影片中的背景、光線、鏡頭角度等元素,不需要使用傳統的影片剪輯軟體。目前已開放給 Google AI Plus 以上訂戶使用。
AI 真的能在 18 個月內取代所有白領工作嗎?
Microsoft AI 執行長 Mustafa Suleyman 預測大多數「坐在電腦前」的專業任務將在 18 個月內達到 AI 自動化,但這不等於完全取代白領工作。更可能的情況是 AI 大幅提升白領工作者的生產力,自動化重複性的資料處理和文書作業,同時人類仍然負責最終判斷、決策和需要創意的工作。這類預測通常來自 AI 產業領袖,會有一定程度的樂觀偏差。
覺得這篇快報有幫助嗎?歡迎分享給同樣關注 AI 趨勢的朋友,我們每天更新,讓你不錯過任何重要的 AI 動態。