AI人工智慧應用越來越廣泛,聊天機器人ChatGPT在近期發布了一款更強大的模型GPT-4,除了文本,還具備圖文辨識能力;現在與專門為視障人士打造的應用程式結合,幫助他們「看見」世界;只要拍照上傳,人工智慧就能鉅細靡遺地告訴使用者圖片內容,還能問後續問題,像是義大利麵要煮幾分鐘,或是建議冰箱內食材,可以煮出什麼菜色。目前這款功能仍在測試中,不過已經有受試者認為讓他感到更獨立自主。
拿出手機拍張照,人工智慧就能馬上告訴你拍的是什麼東西。
虛擬志工:「虛擬志工,這是一張這是一張John West沙丁魚罐頭的照片,標籤是綠色和黃色的,罐頭頂部有紋路。」
這是一款專門為視障人士打造的應用程式《Be My Eyes》;因為早產導致視網膜受損,現在完全失明的浩頓,就時常依靠它來分辨食物。
"Be My Eyes"用戶 浩頓(Jesper Holten):「罐頭類食物很難確定裡面裝什麼,當然你可以搖晃它,但它有可能是椰奶,也可能是番茄罐頭,我無法分辨。」
而它更在近期結合OpenAI最新模型GPT-4,升級成能支援圖像辨識,再以文字輸出,解釋照片中的內容。
"Be My Eyes"應用程式創辦人 維伯格:「我們見識過這類技術,但那是辨識椅子、電視之類的東西,但現在它可以詳細描述它所看到的內容,而且還可以問後續問題。」
像是如果要問它,照片中的義大利麵需要煮多久,就難不倒它。
"Be My Eyes"應用程式創辦人 維伯格(Hans Jørgen Wiberg):「這義大利麵是什麼牌子,需要煮多久?」
虛擬志工:「虛擬志工,是的,Barilla義大利麵的煮法。」
又或者拿它來拍攝整面書架,也能告訴你每層分別擺了什麼。
虛擬志工:「照片是一張黑色金屬書架,有三層,最上面放了一個粉紅色的塑膠容器。」
聊天機器人ChatGPT問世後,在全球快速掀起「生成式AI」熱潮,讓開發商OpenAI趁勝追擊推出推理能力更強的新模組GPT-4,更在二月初,找上應用程式《Be My Eyes》的創辦人,協助開發新的圖像到文本生成器。
"Be My Eyes"應用程式創辦人 維伯格:「接到合作以來,我就興奮到難以入眠,雖然現在只是一張照片被形容,但如果我們能讓它用在影音串流上,然後可以邊走邊為你導覽。」
《Be My Eyes》自2015年推出以來,已經擁有近50萬名視障用戶,主打與正常視力的志工配對,提供即時的聊天幫助;而新推出結合AI的新功能──「虛擬志工」,目前仍在Beta版測試中,不過業者表示目的並非取代真人。
"Be My Eyes"技術長 亨里克森(Jesper Hvirring Henriksen):「我認為有很多使用情境,像是可能在一些看似不重要的事情上,不想麻煩別人,又或者也許是星期一早上,一大清早你不想和真人說話。」
被選上作為早期測試用戶的浩頓,就表示人工智慧讓他感到更獨立自主,也期望有一天能幫助他探索未知的地方。
"Be My Eyes"用戶 浩頓:「我想要在陌生空間獲得一定程度的信心,如果 AI技術可以幫助我獲得,或重新獲得這種自信,那真的非常了不起。」
視障者的日常生活要面臨許多挑戰,要練習運動更是相當不容易。但對於從四歲就開始打網球,只剩下8%視力的夏洛特來說,照樣能打趴一堆視力正常的選手。
夏洛特隊友(Martina Brinkmann):「當我第一次在球場上看到她時,根本沒有發現有什麼不同。」
使用特製的網球,能在落地、打擊的時候發出聲響,讓夏洛特掌握球的來向。
網球選手夏洛特(Charlotte Schwagmeier):「盲人網球讓我有更多時間,因為球可以彈兩次,然後球速也比普通網球慢,你無法讓它像標準網球那麼快。」
但除了靠聽力,還要一邊在腦中記算軌跡,判斷球可能會往哪裡跑。
網球教練(Marc-René Walter):「我們就是這樣訓練她的,她必須知道球路,如果看不見球,就要知道,如果我把球傳到那裡,球會從這裡和和那裡折返。95%的時候,她都可以判斷,她知道400個球路。」
憑藉著天賦和勤奮地練習,夏洛特已經摘下兩次視障網球世界冠軍,現在正為八月份的下一屆世界錦標賽,加強訓練。
留言 1
Jim Wu
德國跟義大利禁用
澳洲提告詐欺
現在只剩白癡媒體在吹了
2023年04月11日12:52
顯示全部