請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

省下 o3 和 o4-mini API 一半成本,OpenAI 推「Flex 處理」模式適合什麼 AI 任務?

TechOrange 科技報橘

更新於 2025年04月18日13:13 • 發布於 2025年04月18日04:19 • 廖紹伶

為了與 Google 等競爭對手抗衡,OpenAI 宣布推出「Flex 處理(Flex processing)」,這是一種 API 選項,提供更低的 AI 模型使用價格。Flex 處理目前是測試版,率先適用於最新推出的 o3 和 o4-mini 模型。

根據 OpenAI,Flex 處理專為優先序較低與非生產性環境的任務所設計,例如模型效能評估、資料擴充(Data Enrichment)與非同步工作負載(asynchronous workloads)等場景。

「Flex 處理」可以降低多少成本?

根據《TechCrunch》,Flex 處理的開發者將可獲得與標準 API 相比「整整少一半」的成本。以 o3 模型為例,Flex 處理模式下的輸入費率為每百萬 token 5 美元、輸出 20 美元,相比標準版本分別為 10 美元與 40 美元。對於 o4-mini,Flex 處理費率則為輸入 0.55 美元、輸出 2.20 美元,標準費率則為 1.10 美元與 4.40 美元。

使用「Flex 處理」該注意哪些事?

然而,選擇使用 Flex 處理,同時也需接受較慢的反應時間,甚至在高峰期可能遇到資源不足、處理失敗的情況。

根據 OpenAI 說明,使用 Flex 處理時,因為處理速度較慢,API 請求出現逾時(timeout)或資源不足(429 錯誤)的機率將會上升。預設逾時為 10 分鐘,開發者可透過 OpenAI SDK 調整參數延長逾時時間。若出現 429 錯誤,表示當下資源無法分配,使用者不會因此被收費。

OpenAI 建議若開發者能容忍處理延遲,可採取「指數回退重試」策略處理錯誤。若處理時間重要,仍可透過切回標準服務等級(auto)以取得穩定回應。

【推薦閱讀】

企業導入 AI 為何須重新思考資安?「5 大情境」解析最常忽略的風險

【企業的 AI 模型安全指南】不讓 AI 模型成資安破口,2 大切入點看企業如何自保?

【邊緣 AI 安全全解析】在 IoT、製造設備、自駕車部署 AI,四大風險 + 三層防線一次掌握

* 本文部分初稿由 AI 生成,經《TechOrange》編撰,資料來源:《TechCrunch》OpenAI,首圖來源:取自 OpenAI

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

伊朗證實最高領袖哈米尼遇襲身亡 全國哀悼40天

anue鉅亨網
02

美伊緊張局勢持續升高 將如何影響全球市場?

anue鉅亨網
03

美以空襲伊朗 專家估算台股補跌點位出爐

NOWNEWS今日新聞
04

工程師炒股8個月「740萬滾成3.85億」!全靠這玩法

民視新聞網
05

美以聯攻伊朗恐重擊全球市場!專家揭最糟情況 但這金融資產看漲

鏡報
06

台股週一開盤剉咧等?反指標女神「一番話」網急了

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...