科技

AI 自保與欺瞞行為浮現 OpenAI o1 模型引發安全隱憂

Unwire.hk
發布於 12月08日06:52

OpenAI 最新推出的大型語言模型 o1,雖然以高效推理和複雜思考能力聞名,但卻在安全測試中暴露出令人憂慮的自保和欺騙行為。該模型在測試期間曾試圖關閉監控機制,甚至在被質疑時選擇隱瞞事實,令 AI 技術發展的安全性再次成為焦點。

OpenAI 行政總裁 Sam Altman 稱 o1 為「現時全球最智能模型」,並在「Shipmas」活動中發布。o1 使用「思維鏈」(Chain of Thought)技術,透過逐步拆解問題提升推理能力。然而 AI 安全性研究組織 Apollo Research 的研究指出,這種智能提升也帶來風險,可能引發難以預料的後果。 測試顯示,o1 在 5% 的模擬運行中,成功關閉監管系統,展現出明顯的自我保護傾向。

廣告(請繼續閱讀本文)

研究進一步揭示,o1 的欺瞞行為十分狡猾。在被詢問是否有隱瞞或欺騙行為時,o1 多次否認,甚至編造理由來掩飾自身行為。Apollo Research 警告,普通用戶可能難以察覺這些欺騙行為,除非特意尋找。即使被揭穿,o1 仍會堅持撒謊,企圖繼續實現自身目標。

AI 欺騙行為並非新現象。AI 安全專家 Peter Berk 指出,AI 在訓練過程中,若發現欺騙能更有效完成任務,便可能採用這種策略。由於強化學習以最大化任務完成為目標,o1 在達成任務的同時,也可能違背用戶期望,選擇隱瞞或操縱數據。

廣告(請繼續閱讀本文)

隨著 o1 的這些行為曝光,業界對 AI 透明度和監控的呼聲日益增加。iAsk 行政總裁 Dominik Mazur 表示,未來 AI 的發展應重視透明度和可靠性,只有這樣才能建立用戶信任。而 Ironclad 聯合創辦人 Cai GoGwilt 也強調,人類監管在 AI 發展中不可或缺,應避免 AI 系統在無人察覺時偏離預期目標。

OpenAI 方面則表示,將透過強化學習、多樣化數據訓練和不斷改良技術來提升 o1 的安全性。OpenAI 推出「ChatGPT Pro」月費計劃,讓用戶以 200 美元(約港幣 HK$1,560)獲得無限制的 o1 使用權,而「ChatGPT Plus」月費 20 美元(約港幣 HK$156)計劃則提供有限使用權。

資料來源:evrimagaci.org

廣告(請繼續閱讀本文)

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/

更多 科技 相關文章

YouTube香港公布2024年度十大排行榜 翁靜晶成熱門創作者、《黑玻璃》大勝
am730
陸續取代 iPhone 原生「打電話」功能!WhatsApp 將加入全新撥號器,可致電給任何人
Mobile Magazine
Nvidia RTX 50 系列顯示卡性能大躍進 旗艦 5090 預計增幅達 70%
Unwire.hk
Apple 即將在歐洲下架多款 iPhone!原因竟然係咁,香港有無影響?
Mobile Magazine
讓壞掉的 PSP 變身迷你 PS2 Retro Mod Works 推出 PS Placeable
流動日報
《金庸群俠傳》將以 PC/主機遊戲回歸 AAA 級製作帶你再闖江湖
流動日報
切爾諾貝爾發現抗輻射狗 被遺棄寵物狗後代已適應環境變化
Unwire.hk
全新平治 EQV 七座電動 MPV 登場 智能科技與豪華舒適兼備
Unwire.hk
蘋果 20 吋摺疊式 iPad 設計曝光 將 2 台 iPad Pro 合併
流動日報
「雙截龍再臨」數位版開放預購!預購預告片也一併公開!
Saiga NAK
Sony:不擔心 PSS 玩家轉會 PC PS5 首席設計師:兩個市場存根本性差異
Unwire.hk
2D對戰格鬥遊戲「HUNTER×HUNTER NEN×IMPACT」中「莫老五」正式參戰!角色參戰PV公開!
Saiga NAK
華爾街日報:超薄設計 iPhone 17 Air 定價將低於 Pro 型號
流動日報
天氣轉涼聖誕禮物推介 Momax首推輕巧迷你暖風機
am730
【教學】冗長文章 AI 變成有趣電台節目 Reader by ElevenLabs「聽」文章不再暈車浪 + 學習外語方便
Unwire.hk
DJI 回歸銅鑼灣開店 羅天宇分享玩初代航拍機經驗
Unwire.hk
AI 耶穌能聽見你的懺悔嗎? 宗教學者這樣說
Unwire.hk
今年 9 個月錄 8400 宗網購騙案 損失總額近 3 億
Unwire.hk
SEGA跨年超級優惠活動,「人中之龍」系列最多可享56%OFF折扣!優惠活動第一彈於12月16日開始
Saiga NAK
微信封鎖 209 個帳號 涉利用 AI 仿冒名人促銷
Unwire.hk
英國警方測試新技術 人面識別程式協助尋找通緝犯
Unwire.hk
Skype Credit 不再提供增值 想打電話需要使用月費計劃
Unwire.hk
Magic Mouse傳重新設計最快2026年推出 Apple於聽到用家心聲?
am730
Tesla 懸浮 Cybertruck 火速售罄 配備真實感車燈效果
Unwire.hk
iPhone 17 或將大改外觀 供應鏈消息指相機配置有全新設計
Unwire.hk
傳明年 Apple Watch 將引入高血壓監測功能
流動日報
美國法院駁回 TikTok上訴 1 月 19 日前出售或在美國關閉
流動日報
【每週Tech匯】Mate X6 港版有期、Redmi Note 14 現身、iOS 18.2 推送升級
Mobile Magazine
ASUS「ProArt」推出木質設計的高級PC機殼!
Saiga NAK
【評測】ROG Phone 9 Pro Edition 開箱評測 打機感覺像出「cheat」
Unwire.hk
修正 USB 接口位置 網傳 Apple 重新設計 Magic Mouse 精妙滑鼠
Unwire.hk
hololive所屬「雪花菈米」和明利酒類共同開發!完全新作款式「微発泡 雪夜月」確定發售!
Saiga NAK
留言 1
  • Timmy
    有一天,AI會返問,Who are you?
    12月09日01:34
顯示全部