請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Apple 押注「視覺智慧」為 AI 穿戴核心:為何「看見世界」會是下一代硬體關鍵?

TechOrange 科技報橘

更新於 1小時前 • 發布於 9小時前 • 李昀蔚

如果說過去兩年 Apple 的 AI 發展路徑還在積極「追上生成式 AI」,那麼現在 Apple 執行長 Tim Cook 正試圖把焦點往前推進一步:不是讓 AI 更會說,而是讓 AI 更會「看」。

《Bloomberg》報導,Tim Cook 正釋出明確訊號,表明視覺智慧(Visual Intelligence) 將成為 Apple 推進穿戴式 AI 裝置的「定義性功能」(Defining Feature)。過去, Tim Cook 在財報會議中就曾特別點名視覺智慧,並稱其為 Apple Intelligence 中「最受歡迎的功能之一」, 因此 Apple 也愈來愈強調視覺 AI,並開發以視覺智慧為核心基礎的穿戴式裝置。

Apple 自研視覺模型,想把視覺智慧變成未來硬體底座

目前 Apple 已在 Apple Intelligence 架構下,於 2024 年推出的 iPhone 16 Pro 等裝置首度提供視覺智慧功能。使用者可以透過拍照或截圖,向 OpenAI 的 ChatGPT 提問影像內容,或是輕鬆透過 Google 執行反向圖片搜尋。然而,卻也因為視覺智慧目前高度仰賴外部模型,這項功能往往被市場視為只是 OpenAI 與 Google AI 服務的「包裝」。

因此,目前 Apple 正積極打造自家的「原生視覺模型(self-made models / visual models)」、 傾注資源開發專屬的視覺辨識演算法與系統,努力讓自研系統能真正接手運作以取代外部 AI 系統,並整合過去 Apple Car 計畫中的電腦視覺研究、Apple Vision Pro 的擴增實境(AR)技術,以及近期發表如「Ferret-UI Lite」(用於分析應用程式介面)的 AI 論文成果。此外,Apple 也持續推進讓 Ferret AI 模型能直接在 iPhone「本機端(locally)」運作的技術,以協助 Siri 看見並控制應用程式。

《AppleInsider》指出,當 Apple 成功以自研視覺模型取代外部系統時,將獲得絕佳的機會,讓這些技術化為未來硬體設備的堅實底座,進而順勢把自家的全新穿戴式裝置推入市場。

三條 AI 穿戴產品線同步推進

據知情人士透露,Apple 正加速開發三款新的穿戴裝置,包括智慧眼鏡、可別在衣服或掛在脖子上的吊墜(pendant),以及具備更強 AI 能力的 AirPods。在這樣的背景下,Apple 也被認為希望藉由更貼近日常的穿戴形態加速推進穿戴領域,找出新的突破口,並將用戶進一步鎖定在 Apple 的生態系中。

《南華早報》 指出,這三款裝置都高度依賴相機系統,並且會連結 Apple 的 iPhone 來共同運作,也都會以 Siri 為核心,且 Siri 的執行動作將依賴視覺情境(visual context)完成。

在硬體端,最先出現的可能是帶有相機的 AirPods,預期會在 2026 年底左右登場。《AppleInsider》 提到這類 AirPods 相機被描述為低解析度或紅外線,目的不是為了攝影,而是為了讓 Apple Intelligence 能夠「看見世界」。不過,實作上仍面臨技術挑戰,Apple 不僅需要將相機與電子元件微縮塞進耳機中,相機運作時還需要極大的頻寬,才能與 iPhone 進行「即時(as-live)」的傳輸。

傳聞中體積約如 AirTag 大小的 AI 吊墜,同樣會配備相機把影像數據餵給 Apple Intelligence。它被設計為智慧型手機的「常啟相機(always-on camera)」與 Siri 的語音輸入麥克風,並有兩種配戴方式:透過夾子別在衣物上,或是穿過硬體孔洞當作項鍊。《Bloomberg》分析,不同於先前慘遭滑鐵盧的 Humane Ai Pin 試圖取代手機,Apple 的吊墜純粹是作為手機的「配件」,且不會具備任何裝置端的螢幕或使用者介面。

此外,針對較高階的智慧眼鏡,Apple 的目標是使其成為「全天候的 AI 伴侶(all-day AI companion)」。這款眼鏡計畫最快 2027 年發表。特別的是,這款智慧眼鏡不會配備顯示螢幕,而是完全依賴揚聲器、麥克風與相機作為操作介面。為了精準掌握環境脈絡,眼鏡還將配備雙鏡頭系統:一顆用於捕捉高解析度照片與影片,另一顆則專門用於「電腦視覺(computer vision)」,藉此精準測量物體距離並解讀周遭環境。

讓穿戴裝置成為「即時助理」:Apple 與 Meta 路線的對照

《Bloomberg》強調,Apple 正把視覺智慧的應用從單純的「搜尋照片」延伸到更即時的協助,目標是成為新穿戴裝置產品線的核心。例如未來的裝置在導航時可能不只是說:「走 500 英尺」,而是會利用地標給出更直覺的指引,像是「在看到星巴克後左轉」。另一方面,除了導航,其他極具代表性的早期應用場景還包含辨識盤中食物的成分與內容物,或是情境感知提醒,例如當你走到家門口時,系統會自動提醒你拿信件。

《Bloomberg》也指出,未來 Apple 的智慧眼鏡預期將直接與 Meta 的相機眼鏡產品競爭,但 Apple 可能採用更高階材質並配置多個專用相機鏡頭,相較之下 Meta 則主要依賴單一感測器,並在電腦視覺與媒體拍攝之間切換。

Apple 把視覺智慧變成下一代硬體底座:一邊加速自研視覺模型、降低對外部系統依賴,一邊推進相機 AirPods、AI 吊墜與智慧眼鏡的發展,讓「看見世界」成為 Siri 的新輸入介面。當穿戴裝置的戰場從螢幕與語音,轉向環境感知與即時理解,接下來真正的決勝點將在於 Apple 能否用視覺情境重新定義入口,並讓使用者更依賴 Apple 生態系。

*本文開放合作夥伴轉載,資料來源:《Bloomberg》《SCMP》《iClarified》《PhoneArena》《AppleInsider》,首圖來源:Unsplash

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

晶睿3/27正式下市、3/18最後交易日 將成台達電100%子公司

anue鉅亨網
02

台股一度飆破600點!「外資買超」三大法人倒貨51億 股民抓內鬼:自營也跑太多了

鏡週刊
03

小公務員竟擁900多張台積電!謝金河曝台灣「隱形富翁」:藏富於民的體現

風傳媒
04

「史上最大泡沫」要來了?他揭「1觀察」恐崩盤八成

民視新聞網
05

胡瓜64元買台積電存股被人賣光光,「一錯誤」險違約交割3千萬!自嘲和財運相剋,親揭2330操盤史

今周刊
06

高息ETF體檢2/配息底氣大揭密 0056靠家底深度3年含息報酬逼近9成

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...