請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

找 AI 看診到底行不行?牛津大學:和搜尋引擎準確度差不多

科技新報

更新於 02月10日11:08 • 發布於 02月10日11:00

最新研究顯示,AI 聊天機器人醫療建議表現與傳統搜尋引擎相當,卻未改善用戶健康度。

研究由牛津網路研究所與牛津大學納菲爾德基層健康科學系的學者,與 MLCommons 及其他機構合作,近 1,300 名英國參與者,測試十個專家設計的醫療情境,參與者隨機分成兩組,一組用大型語言模型(LLMs)如 GPT-4o、Llama 3 和 Command R+,另一組為個人常用診斷方法,大部分為網路搜尋或個人知識。

結果顯示,使用 LLM 參與者的評估健康狀況和建議行動表現,與用搜尋引擎的參與者相當,成功率僅 33%~45%。儘管 LLM 理論上結構化問題有 94.9% 準確率,但實際互動時因人類與 AI 溝通不良,導致表現差距頗大。用戶經常忽略關鍵細節、誤解聊天機器人意思或忽視建議。

共同作者之一、牛津網路研究所副教授 Luc Rocher 表示,儘管 AI 不斷突破,但要保證將來模型能平衡用戶的慰藉需求與公共衛生系統的有限,仍是個挑戰。越來越多人依賴聊天機器人給予醫療建議,大眾可能會將錯誤但看似合理的診斷導入已吃緊的醫療體系。

研究者強調,AI 聊天機器人尚未準備好在現實世界當醫生,呼籲開發者和監管機構部署 LLM 照護病患前,必須實際評估用戶。

(首圖來源:AI 生成)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

紫南宮發財金超狂!出金4億返金6億 主委莊秋安:借600塊還300萬傳奇年年上演

鏡報
02

快訊/情人節財神送禮!大樂透1.9億獎落高雄小港 一人獨得變身富翁

三立新聞網
03

金價狂洗三溫暖 大跌後飆漲分析師上看「這價位」

CTWANT
04

大樂透頭獎1注獨得1.9億 今彩539頭獎2注中獎

自由電子報
05

時代的眼淚!Sony宣布全面停產「20年傳奇商品」:未來也不推新機

三立新聞網
06

擴大北京影響力!中國5月起給非洲53國零關稅優待,整片大陸「只有它」被排除

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...