讓送貨機器人獲「公分級」精準定位,《Pokémon Go》數據意外成為機器人導航關鍵
全球知名的擴增實境遊戲《Pokémon Go》,雖然已經是 2016 年時所推出的作品,但直到現在這款遊戲仍擁有許多忠實粉絲,甚至還為機器人產業做出了意想不到的貢獻。
2025 年 5 月,從《Pokémon Go》開發商 Niantic 特別分拆出來的 AI 與地理空間公司 Niantic Spatial,正在利用大量遊戲玩家們蒐集的超高精度城市地標圖像,打造出一套視覺定位系統,並希望於未來結合大型語言模型技術,創造出將 AI 根植於現實社會的「世界模型」。
Niantic Spatial 近期所推出的產品,是一套能夠根據使用者眼前建築物或地標的照片,就將位置精確定位於地圖上的創新模型,其誤差甚至僅有「幾公分」。
藉由這款創新模型,Niantic Spatial 希望協助 AI 機器人在 GPS 訊號不穩定的區域,比方說在摩天大樓櫛次鱗比的大城市中,進行更為精準、精確的導航。
送貨要準時,機器人不能迷路
為了實地驗證技術可行性,Niantic Spatial 選擇跟機器人新創企業 Coco Robotics 共同合作。
在美國洛杉磯、芝加哥、澤西市、邁阿密,以及位於芬蘭的赫爾辛基,Coco Robotics 已經累計部署了超過 1,000 台箱型送貨機器人。根據該公司執行長 Zach Rash 的說法,這些送貨機器人迄今已完成超過 50 萬次的配送任務,並且在各種天氣條件下,累計行駛逾數百萬英里。
只不過,若是要跟人類快遞員互相競爭,行駛速度只有每小時 5 英里的 Coco Robotics 機器人,必須盡可能達到安全、精準與可靠。Zach Rash 直言,準時抵達是衡量機器人是否能承擔送貨任務的評量標準,所以它們絕對不能迷路。
目前 Coco Robotics 所面臨的最大問題,在於機器人無法完全依賴 GPS 訊號進行導航,因為在城市之中,無線電訊號會被建築物反射並相互干擾,最終導致訊號變得微弱。
Zach Rash 指出,Coco Robotics 的機器人經常於高樓林立、充滿地下道和高速公路的密集區域進行配送,而這些地方正是 GPS 難以正常運作的區域。
從遊戲蒐集數據,打造視覺定位
Niantic Spatial 技術長 Brian McClendon 同意 Zach Rash 的說法,並補充表示大都市絕對是最不適合使用 GPS 的地方。
Zach Rash 舉例,假如使用者看著手機地圖上的藍色定位點,經常會發現它偏移了至少 50 公尺,使人直接置身完全不同的街區,甚至是朝著不同的方向移動,或者跑去馬路另外一側,這種情況正是 Niantic Spatial 想要解決的問題。
過去幾年以來,Niantic Spatial 一直利用從《Pokémon Go》,以及另一款手機 AR 遊戲《Ingress》玩家手中的數據,打造一套全新的視覺定位系統,希望可以根據使用者所看見的景象,協助裝置判斷用戶當下身處的位置。
Niantic Spatial 執行長 John Hanke 以幽默但精準的方式比喻,想要在遊戲中讓皮卡丘逼真的四處奔跑,其實就跟在現實世界中,讓 Coco Robotics 的送貨機器人精準穿梭於都市叢林,本質上屬於相同的問題。
累積巨量資料,玩家熱點貢獻大
美國環境系統研究所公司(ESRI)專家 Konrad Wenzel 則表示,雖然在數位製圖與地理空間分析領域,視覺定位並不屬於嶄新技術,然而另一個顯而易見的事實,在於只要現實世界中部署的攝影機越多、蒐集的影像越多,那麼視覺定位技術的表現就會更精準。
在「資料越多,表現越好」的前提概念下,Niantic Spatial 利用超過 300 億張都市環境影像,訓練其所打造的視覺定位模型,同時這些影像特別集中於某些「熱點」周圍,例如《Pokémon Go》中的補給站或道館等。
Brian McClendon 自豪表示,類似的熱點於全球至少超過一百萬處,因此能夠精確定位使用者的位置,並且可以使定位誤差縮小到僅有數公分,更重要的是系統甚至能夠明白,使用者正面朝著哪個方向。
即便照片大致都拍攝於相似位置,但由於角度、攝影時間各異,而且拍攝時的氣象條件也各不相同,Niantic Spatial 在一百萬處熱點、難以估算數量的真實影像紀錄,搭配影像本身詳細的中介資料,例如 GPS 定位、手機朝向、移動速度等,自然形成了一組規模龐大的資料集。
透過這組資料集,Niantic Spatial 成功訓練出一套視覺定位模型,透過影像分析來精確預測使用者位置,而且即便非熱點地區的影像和數據來源較為稀缺,該模型依然可以成功進行定位。
機器人裝上模型,實現公分級誤差
當 Niantic Spatial 的技術應用到 Coco Robotics 的送貨機器人身上,除了仰賴原先的 GPS 定位外,身上共具備 4 台攝影機的機器人,將會開始利用模型,進一步判斷自身位置與行進方向。
即使 Coco Robotics 機器人的攝影機安裝位置,主要都在跟人類臀部差不多的高度,與《Pokémon Go》的玩家視角略有不同,但官方表示,手動針對數據進行微調其實相當簡單。
Zach Rash 相信,Niantic Spatial 的技術將為 Coco Robotics 帶來市場競爭優勢;他形容,未來送貨機器人將能夠精準定位到餐廳的正確取貨點,並確保自己不會於人行道上妨礙他人通行,送貨時也可以精確停在顧客家門口,而非像過去一樣只能停於幾步路程之外。
從 AR 到機器人,下一步是活地圖
Niantic Spatial 執行長 John Hanke 表示,起初投入研發視覺定位系統,主要是想要將其應用於增擴實境,比方說使用者若戴著 AR 眼鏡,並希望畫面可以鎖定自己注視的方向,那麼自然需要某種方法進行實現;然而,機器人技術的猛烈爆發,令視覺定位技術迎來了截然不同的商機。
John Hanke 舉例,某些機器人可能會需要跟人類共享作業空間,例如建築工地或人行道,若機器人想要融入類似的環境,同時又不對人類作業造成干擾,它們就必須具備跟人類相似的空間理解能力,而 Niantic Spatial 所開發的技術,可以讓機器人遭受推擠或碰撞時,依然精準定位自身所處的位置。
John Hanke 進一步表示,跟 Coco Robotics 的合作只是開端,Niantic Spatial 的長期目標是打造一套「活地圖」,即高度精細的虛擬化世界,並且會隨著現實世界的變化而動態更新。
當 Coco Robotics 和其他公司的機器人,陸續在世界各地展開活動,它們也將擔當起地圖數據蒐集者的角色,協助 Niantic Spatial 建構出越來越精細的模型,並於有朝一日發展成活地圖,或者是外界俗稱的「世界模型」。
加入描述數據,讓機器理解世界
另一方面,John Hanke 與 Niantic Spatial 技術長 Brian McClendon 認為,未來的地圖不只會變得更加精細,還會獲得機器高度利用,而這點將會徹底改變地圖本身的功能。
長期以來,地圖一直被人們用來在世界上找尋自己的定位,隨著地圖從 2D 演進到 3D,接著可能邁入結合即時模擬、數位孿生的 4D,地圖的基本原理本質上並沒有改變,即令地圖上的某個點,對應到某個空間或時間中的特定位置。
然而,未來替機器所打造的地圖,將會更像是一份「指南」,充滿著人類早已熟知或習慣性忽略的資訊。諸如 Niantic Spatial 與 ESRI 等公司,他們都在尋找方法為地圖加入「描述性數據」,想辦法讓機器知道,它們究竟正在看著什麼,並為每一項被機器識別出來的物體,標記清楚屬性與內容。
John Hanke 說,AI 機器人時代之下的一件重要工作,就是建立起有效的「世界描述」,讓機器能夠理解現實生活中的一切,目前 Niantic Spatial 所擁有的數據,將是讓機器明白真實世界運作方式的絕佳起點。
專注做好地圖,最終將涵蓋一切
雖然大型語言模型看似無所不知,可是在解讀物理世界行為、日常環境互動方面,卻幾乎稱得上缺乏「常識」,世界模型正是為了彌補這項缺憾而誕生。
部分前沿企業如 Google DeepMind 和 World Labs 等,正致力於開發可以即時生成虛擬現實世界的模型,作為 AI 代理的訓練場。
至於對 Niantic Spatial 來說,該公司強調,他們從有點不同的角度切入問題,希望先將地圖的開發工作推向極致,最終自然就能涵蓋一切。
Brian McClendon 並不諱言,目前 Niantic Spatial 的技術能力還沒有達到「世界模型」的程度,但公司對此有著無比的渴望,並專注於在虛擬世界中,徹底重現你我熟悉的真實世界。
【推薦閱讀】
◆ 小米把「機器人實習生」送進車廠:連跑 3 小時、成功率 90.2%,人形機器人開始接受產線考核
◆ 加速人形機器人商業部署:Virtuals Protocol 推 Eastworld Labs,先攻物流、製造等高重複任務場景
◆ 告別遙控示範?NVIDIA 研究發表機器人世界模型 DreamDojo,模擬與真實相關性達 99.5%
*本文開放合作夥伴轉載,參考資料:MIT Technology Review、Coco Robotics,首圖來源:Coco Robotics
(責任編輯:鄒家彥)