最新 Google I/O 大會登場! AI 助理 Gemini 大進化,從手機、影像創作到改程式碼都包辦

Google I/O 大會於 5/21 盛大展開,其中執行長 Sundar Pichai 也趁勢宣布自家 AI 幾項重大升級。不只推出比上一代快上 10 倍的 Ironwood TPU、主打 3D 沉浸式通話體驗的 Google Beam,再到 Gemini App 的代理模式,能夠直接幫忙訂房、看房、安排行程等等新穎產品及功能,可以看出 Google 真的想朝著打造「萬能的 AI 助理」來邁進,融入全人類的日常生活。
Table of Contents
ToggleIronwood TPU 強勢登場,比前一代性能快上 10 倍
Pichai 率先推出自家第七代 TPU「Ironwood」,主打:
- 性能比前一代快 10 倍
- 一整組 TPU Pod 每秒可以運算 42.5 百萬兆次
將於年底提供給 Google Cloud 用戶。
廣告 - 內文未完請往下捲動


AI 驅動的 3D 視訊裝置,Google Beam 新推出
主打由 AI 驅動的 3D 視訊裝置:
- 由 6 個鏡頭組成
- 拍攝後能合成出 3D 光場影像
- 要讓遠端視訊能夠像面對面聊天一樣
第一批設備由 HP 協同開發,在今年會提供給首波用戶。
即時翻譯、螢幕共享全上線,Gemini 大進化
作為 Google 積極建構的 Gemini Live AI 模型,功能大進化:
-
即時語音翻譯:目前已支援英文與西文,其他語言將陸續推出
-
支援螢幕共享與畫面分析:能即時分析用戶眼前畫面,假設把路燈當作是人來跟蹤你,Gemini 會回「那是你的影子!」
-
Android 與 iOS 用戶從 5/21 起開放使用
AI 多工代理 Project Mariner 啟動,透過 Gemini API 給開發者
Pichai 也宣布 Google 即將開放多工代理 Project Mariner,能夠:
-
一次處理 10 個任務
-
學習並複製任務流程
-
可透過 Gemini API 提供給開發者使用
Gemini App 新模式 Agent Mode 可幫你找房,同時安排行程
作為 Google 自家 AI 招牌應用的 Gemini App,這次的功能進化相當亮眼:
- 加入 AI 代理模式,可以自動搜尋房源、安排看房行程
- 也可幫忙打電話、訂行程
Gemini App 加入「代理人模式」功能,會自動搜尋 Zillow 等平台房源、安排看房行程,甚至幫你打電話、訂行程,支援 MCP 整合其他服務。
而 MCP 就像是幫 Gemini 可以和各種網站、App、服務系統對接,從只會講話,升級成「能幫忙動手做事的代理」。
Gmail 開始導入 Gemini,自動幫忙用戶回信
作為典型電子郵件功能的 Gmail,也開始導入 Gemini,其中:
- 由 Gemini 讀取用戶過去常用的寫信風格、文件與行事曆
- 自動生成回信內容
- 今年夏天於 Gmail 開放訂閱用戶使用
Gemini Flash 與 2.5 Pro 大升級,AI 程式小助理 Jules 幫忙改 Code
Gemini 新版 Flash 模型也比過去更快、推理更強,不只:
- 推出 2.5 Pro 「Deep Think」模式,能夠處理高難度數學題目與長篇任務
- 6 月正式推出
- 支援 24 種語言、能自然轉語調、雙語模式,全部整合進 Gemini API
- 把程式碼截圖後餵給 2.5 Pro,開發者專用 AI 助理 Jules 就能幫忙改程式碼,5/21 開放公測
音樂與影像 AI 新模型連發,AI 影音創作平台 Project Flow 登場
- Imagine 4:新一代影像 AI 生成模型,文字處理更準確,還有 10 倍的生成速度,字體排版也能搞定
-
Veo 3:能整合旁白與環境音的新影片生成模型
-
Lyria 2:生成 AI 音樂模型,可做出高品質音樂
-
Project Flow:新型 AI 影片創作平台,可自由生成或上傳角色、場景,再透過文字指令讓 AI 製作畫面
與 Chrome、Wear、TV 全面整合,讓 Search AI 能確實協助
Search AI 全面進化:「AI 模式」變成真正助理
-
AI Mode:可問複雜問題,會用圖表、表格與摘要報告來回覆
-
Search Live:像打視訊電話一樣能夠搜尋互動
-
試穿功能:上傳照片即可模擬、比對衣服試穿狀況
-
一鍵結帳:價格變化提醒、加入購物車、自動結帳全部搞定
-
Gemini in Chrome:可直接讀取頁面內容給答案
-
Deep Research + Canvas:讓你上傳報告後一鍵變成網頁、Podcast、測驗
-
Gemini Live 與 Keep、Maps、Calendar 整合中
Gemini 進軍 XR 領域,與三星打造 AI 眼鏡與頭顯
Google 也與三星合作打造 XR 智慧眼鏡 Project Muhan ,預計將在今年推出。
Project Muhan支援語音、視覺搜尋、翻譯、導航、即時回應等功能,並與 Warby Parker 合作開發樣式。
Ultra 訂閱方案與全球佈局
-
Google AI Pro / Ultra:Pro 能提供更高的使用上限、Ultra 則能搶先體驗新功能,並享有 YouTube Premium 與大容量雲端容量
-
2.5 Pro Deep Think、Veo 3、Flow 等功能都將優先開放給 Ultra 訂閱者
如同執行長 Pichai 最後所說,Gemini 正從一個多模態模型進化成「AI 世界模型」,而 Google 的願景就是要打造真正的「萬能 AI 代理人」,能夠陪人類寫信、解題、剪片、穿搭、試鏡、甚至走路找咖啡廳都能搞定,完全融入人類日常生活。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。
AI agentAI 代理GeminiGoogle I/OSundar Pichai
衍伸閱讀
- SEC 佛心大開?Gemini 擺脫調查,執行長 Winklevoss 痛批監管打壓已重創加密產業
- 美國 CFPB 恐解散!代理局長拒絕申領 FED 預算與監管,Coinbase、馬斯克大讚決策
標題:
地址:https://www.pressbased.com/post/13211.html