你是我的眼！AI支援圖像辨識　即刻解說

AI人工智慧應用越來越廣泛，聊天機器人ChatGPT在近期發布了一款更強大的模型GPT-4，除了文本，還具備圖文辨識能力；現在與專門為視障人士打造的應用程式結合，幫助他們「看見」世界；只要拍照上傳，人工智慧就能鉅細靡遺地告訴使用者圖片內容，還能問後續問題，像是義大利麵要煮幾分鐘，或是建議冰箱內食材，可以煮出什麼菜色。目前這款功能仍在測試中，不過已經有受試者認為讓他感到更獨立自主。

拿出手機拍張照，人工智慧就能馬上告訴你拍的是什麼東西。

虛擬志工：「虛擬志工，這是一張這是一張John West沙丁魚罐頭的照片，標籤是綠色和黃色的，罐頭頂部有紋路。」

這是一款專門為視障人士打造的應用程式《Be My Eyes》；因為早產導致視網膜受損，現在完全失明的浩頓，就時常依靠它來分辨食物。

"Be My Eyes"用戶浩頓（Jesper Holten）：「罐頭類食物很難確定裡面裝什麼，當然你可以搖晃它，但它有可能是椰奶，也可能是番茄罐頭，我無法分辨。」

而它更在近期結合OpenAI最新模型GPT-4，升級成能支援圖像辨識，再以文字輸出，解釋照片中的內容。

"Be My Eyes"應用程式創辦人維伯格：「我們見識過這類技術，但那是辨識椅子、電視之類的東西，但現在它可以詳細描述它所看到的內容，而且還可以問後續問題。」

像是如果要問它，照片中的義大利麵需要煮多久，就難不倒它。

"Be My Eyes"應用程式創辦人維伯格（Hans Jørgen Wiberg）：「這義大利麵是什麼牌子，需要煮多久？」

虛擬志工：「虛擬志工，是的，Barilla義大利麵的煮法。」

又或者拿它來拍攝整面書架，也能告訴你每層分別擺了什麼。

虛擬志工：「照片是一張黑色金屬書架，有三層，最上面放了一個粉紅色的塑膠容器。」

聊天機器人ChatGPT問世後，在全球快速掀起「生成式AI」熱潮，讓開發商OpenAI趁勝追擊推出推理能力更強的新模組GPT-4，更在二月初，找上應用程式《Be My Eyes》的創辦人，協助開發新的圖像到文本生成器。

"Be My Eyes"應用程式創辦人維伯格：「接到合作以來，我就興奮到難以入眠，雖然現在只是一張照片被形容，但如果我們能讓它用在影音串流上，然後可以邊走邊為你導覽。」

《Be My Eyes》自2015年推出以來，已經擁有近50萬名視障用戶，主打與正常視力的志工配對，提供即時的聊天幫助；而新推出結合AI的新功能──「虛擬志工」，目前仍在Beta版測試中，不過業者表示目的並非取代真人。

"Be My Eyes"技術長亨里克森（Jesper Hvirring Henriksen）：「我認為有很多使用情境，像是可能在一些看似不重要的事情上，不想麻煩別人，又或者也許是星期一早上，一大清早你不想和真人說話。」

被選上作為早期測試用戶的浩頓，就表示人工智慧讓他感到更獨立自主，也期望有一天能幫助他探索未知的地方。

"Be My Eyes"用戶浩頓：「我想要在陌生空間獲得一定程度的信心，如果 AI技術可以幫助我獲得，或重新獲得這種自信，那真的非常了不起。」

視障者的日常生活要面臨許多挑戰，要練習運動更是相當不容易。但對於從四歲就開始打網球，只剩下8%視力的夏洛特來說，照樣能打趴一堆視力正常的選手。

夏洛特隊友（Martina Brinkmann）：「當我第一次在球場上看到她時，根本沒有發現有什麼不同。」

使用特製的網球，能在落地、打擊的時候發出聲響，讓夏洛特掌握球的來向。

網球選手夏洛特（Charlotte Schwagmeier）：「盲人網球讓我有更多時間，因為球可以彈兩次，然後球速也比普通網球慢，你無法讓它像標準網球那麼快。」

但除了靠聽力，還要一邊在腦中記算軌跡，判斷球可能會往哪裡跑。

網球教練（Marc-René Walter）：「我們就是這樣訓練她的，她必須知道球路，如果看不見球，就要知道，如果我把球傳到那裡，球會從這裡和和那裡折返。95%的時候，她都可以判斷，她知道400個球路。」

憑藉著天賦和勤奮地練習，夏洛特已經摘下兩次視障網球世界冠軍，現在正為八月份的下一屆世界錦標賽，加強訓練。

立即加入《TVBS娛樂頭條》LINE官方帳號，給你滿出來的八卦和娛樂大小事！

請更新您的瀏覽器

國際

TVBS

留言 1

請更新您的瀏覽器

國際

你是我的眼！AI支援圖像辨識 即刻解說

TVBS

留言 1

你是我的眼！AI支援圖像辨識　即刻解說