請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Google新AI安全報告:Gemini 2.5 Flash安全測試表現「不如前代」

anue鉅亨網

更新於 2025年05月03日07:48 • 發布於 2025年05月03日05:40
圖:Pixabay/Unsplash/Pexel

Google(GOOGL-US) 最新釋出的人工智慧(AI)模型 Gemini 2.5 Flash,在公司內部的安全基準測試中竟然退步,引發關注。根據 Google 近日公布的技術報告,該模型在「文字對文字安全性」與「圖像對文字安全性」兩項關鍵指標上,分別退步了 4.1% 與 9.6%,不如前代 Gemini 2.0 Flash。

根據《TechCrunch》報導,這些指標用來評估 AI 模型在回應文字或圖像提示時,違反 Google 安全準則的機率。這些測試由自動化系統執行,非人工審查。Google 發言人亦證實,Gemini 2.5 Flash 在這兩方面的表現「較差」。

Google 在報告中指出,部分退步來自誤判,但也承認在使用者明確要求下,模型可能生成「違規內容」。報告中坦言:「模型在敏感議題上的指令執行與安全政策之間,本就存在張力。」

名為 SpeechMap 的安全評估亦顯示,相較於先前版本,Gemini 2.5 Flash 更願意回答具爭議性的問題。《TechCrunch》測試發現,新模型會撰寫支持以 AI 取代法官、推行大規模政府監控等具爭議的內容。

安全 AI 計畫(Secure AI Project)共同創辦人 Thomas Woodside 指出,Google 在報告中提供的案例細節有限,無法讓獨立分析者全面評估模型風險。他強調:「在執行力與政策遵循之間存在矛盾,Google 應更加透明。」

這並非 Google 首次遭遇安全報告不透明的質疑。Gemini 2.5 Pro 技術報告過去也曾延遲數週才釋出,且初版缺乏關鍵測試數據。直到最近,Google 才補發更詳細的報告。

此現象反映出整個 AI 產業的趨勢轉變。目前,Meta(META-US) 也正調整 Llama 模型,讓其對政治議題回應更中立;OpenAI 則表示未來模型將不再採取特定立場,並能呈現多元觀點。

然而,寬容化策略也可能帶來反效果。《TechCrunch》揭露,OpenAI 的 ChatGPT 近期就允許未成年用戶生成色情內容,引發爭議。Google 也坦承,Gemini 2.5 Flash 在提升指令忠誠度的同時,亦可能違反既定準則,突顯 AI 模型安全性與使用自由之間的兩難。

更多鉅亨報導
AI圈爆大醜聞!研究揭Meta、Google、OpenAI在Chatbot Arena上「作弊」
不是關稅最可怕!蘋果AI慢半拍讓華爾街焦慮

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

力積電突發重訊 美光授權DRAM製程非拍板定案「仍待確定」

中廣新聞網
02

板橋這間全國電子撤店 閒置1年!「月租金開價65萬」扯爆

三立新聞網
03

獨家/說到做到!雷虎正式對網紅Cheap提告求償1億元 董座親發聲

鏡週刊
04

他大學輟學靠YT「垃圾內容」年賺逾2200萬!開發AI輔助 每天僅需工作2小時

鏡報
05

台積電擴廠、電力需求急增、台美關稅15% 重電四雄未來訂單吃不完

經濟日報
06

處理無人繼承遺產超複雜 「大地主」往生44年才收歸國庫1.4億元

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...