科技

IEEE 評估 AI 寫程式的能力 簡單問題成功率達 89% 困難問題僅 0.66%

流動日報
更新於 07月17日08:56 • 發布於 07月08日13:42 • NewMobileLife

研究指出,程式設計師經歷了數十年撰寫人工智能(AI)模型的程式碼,現在 AI 正在進行一個圓滿的循環,開始自己寫程式碼。然而,AI 程式碼生成器能否與人類程式設計師媲美呢?

ChatGPT 寫程式能力評估

廣告(請繼續閱讀本文)

《IEEE Transactions on Software Engineering》六月期刊發佈的一項研究評估了 OpenAI 的 ChatGPT 所生成程式碼的功能性、複雜度和安全性。研究結果顯示,ChatGPT 在生成功能性程式碼方面,成功率範圍廣泛,從低至 0.66% 到高達 89%,取決於任務的難度、程式語言及其他多種因素。

AI 生成程式碼的優勢與挑戰

格拉斯哥大學講師 Yutian Tang 表示,基於 AI 的程式碼生成可以提升生產力並自動化軟體開發任務,但需了解這些模型的優勢與局限。通過全面分析,可以發現 ChatGPT 程式碼生成中可能出現的問題和局限,從而改進生成技術。

廣告(請繼續閱讀本文)

ChatGPT 的測試與表現

Tang 的團隊測試了 GPT-3.5 在五種程式語言(C、C++、Java、JavaScript、Python)中處理 728 個 LeetCode 測試平台上的程式問題的能力。ChatGPT 在解決不同語言的問題時表現尚佳,尤其在處理 2021 年前的 LeetCode 問題時,成功率較高。具體來說,簡單、中等和困難問題的成功率分別約為 89%、71% 和 40%。

然而,對於 2021 年後的算法問題,ChatGPT 生成功能性正確程式碼的能力下降。例如,簡單問題的成功率從 89% 下降到 52%,困難問題的成功率從 40% 下降到 0.66%。

廣告(請繼續閱讀本文)

ChatGPT 的局限與改進建議

Tang 認為,ChatGPT 對 2021 年前的問題表現較佳,可能是因為這些問題在訓練數據集中較常見。隨著程式設計的演變,ChatGPT 尚未接觸到新的問題和解決方案,缺乏人類的批判性思維,只能處理先前遇到的問題。

值得注意的是,ChatGPT 生成的程式碼在運行時間和記憶體開銷方面優於至少 50% 的人類解決方案。研究還探索了 ChatGPT 在接收 LeetCode 反饋後修正自身錯誤程式碼的能力。隨機選擇了 50 個 ChatGPT 最初生成錯誤程式碼的場景,結果顯示,雖然 ChatGPT 能修正編譯錯誤,但對於理解錯誤的修正能力有限。

研究還發現,ChatGPT 生成的程式碼存在一些漏洞,如缺少空指針測試,但大多數易於修復。研究結果顯示,C 語言生成的程式碼最複雜,其次是 C++ 和 Python,後兩者的複雜度與人類編寫的程式碼相似。

Tang 建議,開發者在使用 ChatGPT 時,應提供更多資訊幫助其更好地理解問題或避免漏洞。例如,面對複雜的程式問題時,開發者可以提供相關知識,並在提示中告知 ChatGPT 需注意的潛在漏洞。

NewMobileLife 網站:https://www.newmobilelife.com
Facebook:https://www.facebook.com/jetsoiphone

查看原始文章

更多 科技 相關文章

開啟自動駕駛後蓋被睡覺 中國網民鬧爆「自己作死別連累他人」
Unwire.hk
iPhone SE 4 或搭載 Apple 首款 5G 晶片 配備 A18 晶片兼享 iPhone 15 同款相機
Unwire.hk
iOS 18.0.1 續航力測試結果出爐 新舊 iPhone 表現兩極化
流動日報
美國銀行系統故障 用戶存款餘額變成 $0
Unwire.hk
睡前看手機不是睡眠問題兇手 專家:在床上看手機才是最大原因
Unwire.hk
蘋果新品發佈會料於 10 月底發佈 11 月 1 日上市
流動日報
被禁止存在的 Macintosh 原型機驚現拍賣會 Steve Jobs 曾下令銷毀
流動日報
蘋果多款客製版 Mac 延遲出貨 暗示 M4 Mac 新機即將登場
流動日報
AI 初創製作六指手套 贈送科技企業及政界人士警告 AI 風險
Unwire.hk
ReCAPTCHA v2 已被 AI 完全破解 全新 AI 模型成功率達 100%
Unwire.hk
哈佛學生利用網絡數據 為 Meta 智能眼鏡加入 AI 陌生人辨識功能
Unwire.hk
罕見 1983 年 Macintosh 原型機拍賣 估價高達 94 萬元
Unwire.hk
X 交罰款但入錯戶口 仍未能恢復巴西服務
Unwire.hk
Google 不滿第三方 YouTube 程式 施壓後《Juno》從 visionOS App Store 下架
Unwire.hk
美國 DJI 禁令餘波 內政部表示禁令對機構運作構成負面影響
Unwire.hk
為努力著的人用啤酒送上鼓勵的「Otsukare-shu」活動開啓!社媒投稿可免費獲得精選啤酒!
Saiga NAK
Mark Zuckerberg 成世界第二富豪 超越 Amazon 創辦人 Jeff Bezos
Unwire.hk
Tim Cook 放售 5 千萬美元股份 與上星期入手獎勵股份相約
Unwire.hk
電動車|全新544匹SUV Coupé Polestar 4 破格刪走後車窗
am730
涉蜂窩網路技術爭議 華為 MediaTek 對簿公堂
Unwire.hk
Cybertruck 第五次全面召回 後視鏡頭延遲超過 2 秒造成危險
Unwire.hk