財經

AI泡沫恐3年內爆破?研究對兩項目前景提質疑...

on.cc 東網
更新於 8小時前 • 發布於 8小時前 • on.cc 東網
 

自OpenAI於2022年底推出ChatGPT之後,人工智能(AI)就在一夜間成為科技界、投資界最受關注的技術。不過,科技龍頭蘋果公司(Apple Inc.)的研究部門卻在最近發布了一篇論文,直指如今的AI大語言模型(LLM)的推理能力「脆弱」,似乎不具備真正的邏輯推理能力。隨着市場對AI實際應用潛力開始產生質疑,甚至擔心科技企業過度投資AI未能帶來回報。摩根大通資產及財富管理市場及投資策略部主席岑博智(Michael Cembalest)亦指出,未來兩年內AI的應用趨勢要進一步提高,才可以避免泡沫爆破。

廣告(請繼續閱讀本文)

Apple的研究科學家Mehrdad Farajtabar等人發表了一篇論文,對LLM的推理能力提出了尖銳的質疑,甚至稱LLM「可能只是複雜的模式匹配(sophisticated pattern matching),而不是真正的邏輯推理(logical reasoning)」。此番結論基本上是否定了LLM的發展方向。儘管該論文未有完全否認LLM作為一款AI模型種類的作用,但點明了包括ChatGPT在內所有以LLM為基礎的AI,可能都會在某個階段陷入發展瓶頸,無法更進一步。

導入數據 死記硬背

要理解為何Apple的研究員會得出如此觀點,就要從LLM的特質開始解釋。在過去AI的研究方向主要集中在演算法的改進,試圖利用更高明、更先進的演算法,令AI變得更加「聰明」,用邏輯推理的方法去處理問題。而LLM則採用了另一條道路,透過大量的數據導入,當AI模型所吸收的資料愈多,就能夠「記住」更多的事實,最終「由量變引起質變」,使AI極備回答大多數問題的能力。

廣告(請繼續閱讀本文)

不過,這種類似於「死記硬背」的方式,導致LLM在特定情景下效率奇低,尤其在處理簡單數學問題時,經常會計錯數。幾乎所有用過ChatGPT的用戶都不難留意到這一點。而Farajtabar最新的論文便是基於此進行的深度分析,研究團隊把用於測試AI數學能力的GSM8K題目,在不影響題目邏輯的前設之下,對題目中的人名、地名、個別數值進行了隨機改變,得出了GSM-Symbolic工具,並以此測試各AI的能力。

隨機改問題後頻計錯

GSM8K是「Grade School Math 8K」的縮寫,是用來評估數學問題解決能力的資料集。這個資料集主要包含小學等級的數學題目(大約8,000道題目),由於只涉及簡單運算,一般人類中學生能夠完全做對所有題目。

廣告(請繼續閱讀本文)

然而,針對AI模型的研究結果卻發現,包括Llama、Phi、Gemma、Mistral等開源模型,以及GPT-4o和o1系列等閉源模型,一旦用上了GSM-Symbolic的問題,答題的正確率會大幅下滑。簡單來說,就好像把數學題中的「小明」名字換成「小強」,把「蘋果」換成「香蕉」,或者在問題中加入一些無關緊要的句子,這類LLM就會突然「想不通」答案,開始頻頻計錯數。論文的作者認為,這正正反映出LLM仍然不具備邏輯推理能力,才會導致這樣的結果。畢竟如果LLM能夠推理,不會因為題目人名不懂作答。

即使未來這類LLM使用了更多擴展資料、參數和計算量,或者為下一代Phi-4、Llama-4、GPT-5使用更好的訓練資料,最終得出可能只會升級成為更好的「匹配工具」,而不是一個真正具推理能力的工具。

或步元宇宙炒作後塵

另邊廂,市場最近亦開始對於AI投資產生了更多的質疑,特別是LLM的訓練及運作需要用到大量的算力,導致許多科企都要斥巨資建設AI伺服器數據中心。這些投入到底能否帶來合理的回報,目前仍然是未知之數。一直關注AI發展的岑博智認為,目前擔心AI泡沫爆破可能為時尚早,但「審判日」可能會在未來兩至3年內來臨,屆時如果AI未能夠展現其價值,可能會步上此前「元宇宙」炒作的後塵。

東網網站 : https://on.cc/東網Facebook專頁 : https://www.facebook.com/onccnews/

查看原始文章

更多 財經 相關文章

香港豪宅|鄧麗君赤柱故居7295方呎佈居曝光 市值5.9億元
BossMind
全國人大|人大常委會通過救市措施 增地方債限額6萬億 目標刺激經濟回暖
BossMind
金融大鱷|索羅斯基金公司傳離港 本月初僅剩1持牌員工
BossMind
港股收市跌225點 期指一度急跌逾500點
商台新聞
「金融大鱷」索羅斯撤港 據報基金管理公司擬關閉港辦公室
am730
總統大選|「You are fired」特朗普有意辭退鮑威爾 鮑威爾:不會主動辭職
BossMind
商品大王羅傑斯訪港參觀會德豐山頂系列 稱香港經濟逐漸復甦
am730
譚仔國際向大股東收購香港丸龜製麵
on.cc 東網
特朗普打敗賀錦麗當選 《阿森一族》預言失效? 盤點《阿森一族》5大預言成真事件
BusinessFocus
業主移民低市價沽貨 逾千呎海景戶連車位呎售僅「8字頭」(有圖)|二手樓成交
am730
二手蝕讓|元朗柏𣾷兩房呎價6863元 跌穿8年前一手買入價 原業主蝕82萬
BossMind
【買多過租】多重利好樓市因素 租售比率大跌
美聯樓市情報站
鮑威爾稱若特朗普要求辭職他亦不會辭
商台新聞
特朗普勝選 澳洲家電大廠將把更多中國產能轉走
on.cc 東網
法外貿行︰中央救市恐未如市場預期所願
on.cc 東網
滙豐銀行下調港元最優惠利率0.25厘 下周一起生效
on.cc 東網
勁過燈神? 獎門人友好壽司店 2間結業1間大縮水1間傳執笠
易發睇樓團
鄧麗君故居上樓書!樓高4層提供6間睡房
易發睇樓團
人民幣定期利率比較|4間銀行上調定存利率 各銀行優惠一覽 【11月8日更新】
am730
美國減息|美聯儲局減息0.25厘符預期 港金管局跟隨(更新)
am730
立足股壇|特朗普當選後 恒指未來三至五日內或迎來突破契機?|JK爸爸(陳立展)
BossMind
世茂集團10月合約銷售額31.1億人幣
on.cc 東網
英偉達又破頂 市值逾3.6萬億美元 大行再籲買
on.cc 東網
美國再減息|樓按每借100萬每月供少140元 代理預計第4季港樓止跌回升
BossMind
樂風梁鎮峰:減息舒緩供樓壓力 料用家對樓市信心轉強
on.cc 東網
澳新楊宇霆:化債不明朗因素仍存在
商台新聞
快樂蜂全購添好運 矢言打造中餐旗艦品牌
am730
全日沽空金額283億元 佔大市成交12%
on.cc 東網
英鎊定期利率比較|一行兌換英鎊定存享6厘優惠 銀行定存大比併【11月8日更新】
am730
新債王:共和黨全勝將推升長息 中金:低利率非時代底色
商台新聞
【投資攻略】特朗普當選 減息或煞車 銀行再現4厘港元定期存款 一文看清有冇可能穩賺6厘以上息率?
BusinessFocus
長沙灣41年舊商廈翻新成彩色大樓 未來將改做學生宿舍?或成文青打卡點?
易發睇樓團
減息後入市升溫 十大屋苑周末預約睇樓量報480組 創5周新高|二手市況
am730
南區大潭道45號洋房6號3.03億元售出
on.cc 東網
【新屋苑獲區內客青睞!】大埔天鑽524實呎戶650萬元易手 原業主持貨5年 帳面蝕約30.4萬元
美聯樓市情報站
利嘉閣廖偉強:減息作用不會立竿見影 市場料逐漸升溫
am730
施政報告刺激CCL急彈1.24% 3月以來最大升幅 全年樓價有望跌5%內|樓價走勢
am730
日本上季兩度干預匯市 涉5.54萬億日圓 隨時再出手?
on.cc 東網
莊士中國預警半年虧損擴大至最多2.1億
on.cc 東網
「新債王」岡拉克:共和黨倘掌控眾院 利率勢向上
on.cc 東網