請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

Amazon Bedrock 搭載 Claude 3 Sonnet 發揮強生成式 AI 應用實力

Unwire.hk

發布於 2024年04月19日10:42

Amazon Web Service(AWS)早前與 AI 企業 Anthropic 合作,在旗下全託管 AI 平台 Amazon Bedrock 支援最新推出的 Claude 3 Sonnet 模型,為使用者帶來更靈活、更快的生成式 AI 效能。

Claude3 三個模型各有不同

Claude3 系列設有三個模型,分別名為「Haiku」、「Sonnet」及「Opus」,三者之間在效能、適用場景及使用成本方面有一定的差異,能夠適用於不同場景的需求。其中位列中等級別的 Sonnet 在效能、智能性、推理速度及成本達致平衡,適合大部分日常及商業應用場景。

配備 200k 超長上下文視窗,以及全面而強大的檢索及生成功能(RAG),Claude 3 系列能夠有效處理長文件及進行分析與生成,有利於需要利用生成式 AI 進行創意寫作或市場營銷的企業。

有測試分別要求 Claude 3 三個模型以同樣的故事前提設計角色,並為他們賦予名字及細節,並以指定風格寫出 14 個場景,以測試三者之間在創意方面的表現。測試結果發現,無論是 Haiku、Sonnet 或 Opus,都能夠生成高品質的場景大綱,在寫作質量上未見太大差異。然而,當涉及更細緻的創作要求,例如為角色命名,Sonnet 及 Opus 就能生成更具一致性的答案,並建立更多細節,對於需要豐富層次的創作更為有利。此外,相較於 Opus 注重故事的複雜程度,Sonnet 在創造具情感變化及現代感的對話上則更具優勢。這亦體現於創作具感染力廣告標語的效果,在另一項測試中,Sonnet 的生成結果比 Haiku 及 Opus 更能理解市場營銷策略背後的複雜性,創作更吸引及具效果的標語。

編程及多媒體處理能力優異

另一方面,編程能力同樣是衡量 AI 模型效能的關鍵指標之一。透過專為生成式 AI 編程能力而設的基準測試 HumanEval,不論 Haiku(75.9%)、Sonnet(73%)或 Opus(84.9%)的效能都比 GPT-4(67%)為高。

有測試使用 Claude 3 的三個模型進行編寫 Python 貪食蛇遊戲,結果發現儘管 Opus 能夠在基本遊戲以外,生成額外遊戲機制及互動元素等複雜編碼,Sonnet 卻能夠以平均每秒 56.68 個 Token 的高速度完成基本編程任務,比起平均每秒 21.875 個 Token 的 Opus 高出兩倍,而且生成的程式碼易於複製和直接使用,在成本更低的前提下,同樣能夠為用戶提供流暢及可靠的編程體驗,在速度及輸出品質上達致更佳平衡。

除創作及編程能力外,Claude 3 亦進一步加強影像理解效能。三個模型在 ANLS(文件影像對答)、AI2D(科學圖表)及 Relaxed Accuracy(圖表對答)等基準測試上,都錄得比 GPT-4 及 Gemini 1.0 Pro 更出色的表現,其中 Sonnet 在科學圖表測試上的結果更在眾多模型中首屈一指,足以應對使用者大量處理圖表、分析報告等視覺數據的需求。

有專家曾對 Amazon Bedrock 上的 Sonnet 進行視覺測試,其中透過展示兩張近乎相同的圖片,讓模型描述當中的差異,結果 Sonnet 能夠準確描述相異之處的位置、形狀和大小,效果令人滿意。專家亦進行工藝流程圖(P&ID)與 AWS 參考架構圖測試,結果在了解過相關文件的上下文資訊後,Sonnet 同樣能夠作出快速而準確的解讀。

配合需求選用合適模型

在坊間眾多生成式 AI 的測試與比較中,Claude 3 三個模型的表現同樣可圈可點,當中尤以功能最強大的 Opus 更適用於處理複雜的流程,然而其每百萬 Tokens 的輸入和輸出成本分別為 15 美元和 75 美元,對於資金有限的使用者無疑較大負擔。相比之下,擁有比 Haiku 更佳效能、與 GPT-4 智能水平相若的 Sonnet,每百萬 Tokens 輸入和輸出成本僅為 3 美元和 15 美元,在效能及成本之間取得平衡,適合大規模 AI 部署。

受惠於 AWS 雲端技術的完善的運算能力,Claude 3 Sonnet 在 Amazon Bedrock 上的應用將具備更快、更流暢的效能,同時透過 VPC 網路隔離、數據加密等嚴格的安全機制,將有助企業保護數據及機密資料,消除隱私外洩疑慮,讓企業更無後顧之憂地部署及應用生成式 AI,帶來無窮無盡的可能性。

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/

iPhone 17e 確認換上動態島、正式告別「M字額」!傳配 LTPS OLED 螢幕、《福布斯》:最快 2 月尾發佈

Mobile Magazine

Google 藉 Gemini 3 Pro 升級 AI Overviews 應對複雜查詢

流動日報

控ChatGPT開發商背離非營利初衷 馬斯克向OpenAI與微軟求償1340億美元

VOCO News
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...