省下 o3 和 o4-mini API 一半成本，OpenAI 推「Flex 處理」模式適合什麼 AI 任務？

為了與 Google 等競爭對手抗衡，OpenAI 宣布推出「Flex 處理（Flex processing）」，這是一種 API 選項，提供更低的 AI 模型使用價格。Flex 處理目前是測試版，率先適用於最新推出的 o3 和 o4-mini 模型。

根據 OpenAI，Flex 處理專為優先序較低與非生產性環境的任務所設計，例如模型效能評估、資料擴充（Data Enrichment）與非同步工作負載（asynchronous workloads）等場景。

「Flex 處理」可以降低多少成本？

根據《TechCrunch》，Flex 處理的開發者將可獲得與標準 API 相比「整整少一半」的成本。以 o3 模型為例，Flex 處理模式下的輸入費率為每百萬 token 5 美元、輸出 20 美元，相比標準版本分別為 10 美元與 40 美元。對於 o4-mini，Flex 處理費率則為輸入 0.55 美元、輸出 2.20 美元，標準費率則為 1.10 美元與 4.40 美元。

使用「Flex 處理」該注意哪些事？

然而，選擇使用 Flex 處理，同時也需接受較慢的反應時間，甚至在高峰期可能遇到資源不足、處理失敗的情況。

根據 OpenAI 說明，使用 Flex 處理時，因為處理速度較慢，API 請求出現逾時（timeout）或資源不足（429 錯誤）的機率將會上升。預設逾時為 10 分鐘，開發者可透過 OpenAI SDK 調整參數延長逾時時間。若出現 429 錯誤，表示當下資源無法分配，使用者不會因此被收費。

OpenAI 建議若開發者能容忍處理延遲，可採取「指數回退重試」策略處理錯誤。若處理時間重要，仍可透過切回標準服務等級（auto）以取得穩定回應。

【推薦閱讀】
◆ 企業導入 AI 為何須重新思考資安？「5 大情境」解析最常忽略的風險
◆ 【企業的 AI 模型安全指南】不讓 AI 模型成資安破口，2 大切入點看企業如何自保？
◆ 【邊緣 AI 安全全解析】在 IoT、製造設備、自駕車部署 AI，四大風險 + 三層防線一次掌握

＊本文部分初稿由 AI 生成，經《TechOrange》編撰，資料來源：《TechCrunch》、OpenAI，首圖來源：取自 OpenAI。

加入『 TechOrange 官方 LINE 好友』掌握最新科技資訊！

請更新您的瀏覽器

理財

TechOrange 科技報橘

「Flex 處理」可以降低多少成本？

使用「Flex 處理」該注意哪些事？

更多理財相關文章

財經焦點／專訪！郭台銘姪女闖國際電影路10年有成　郭曉慶：串接台美資源讓世界看見台灣

ATM無卡提款規定變了！多家銀行調整規範

台積電下張王牌曝光！外媒看好布局1技術

勞退新制變革1／8月新制上路　5大改變一次看：月領可反悔、自提不得擋

抽中現賺6萬！　下周5檔抽籤股一次看

7-ELEVEN近80款飯糰、便當遭中聯油脂波及聯華食品公布退款方式

請更新您的瀏覽器啟用Javascript

省下 o3 和 o4-mini API 一半成本，OpenAI 推「Flex 處理」模式適合什麼 AI 任務？

TechOrange 科技報橘

「Flex 處理」可以降低多少成本？

使用「Flex 處理」該注意哪些事？

更多理財相關文章

財經焦點／專訪！郭台銘姪女闖國際電影路10年有成 郭曉慶：串接台美資源讓世界看見台灣

ATM無卡提款規定變了！多家銀行調整規範

台積電下張王牌曝光！外媒看好布局1技術

勞退新制變革1／8月新制上路 5大改變一次看：月領可反悔、自提不得擋

抽中現賺6萬！ 下周5檔抽籤股一次看

7-ELEVEN近80款飯糰、便當遭中聯油脂波及 聯華食品公布退款方式

請更新您的瀏覽器

財經焦點／專訪！郭台銘姪女闖國際電影路10年有成　郭曉慶：串接台美資源讓世界看見台灣

台積電下張王牌曝光！外媒看好布局1技術　

勞退新制變革1／8月新制上路　5大改變一次看：月領可反悔、自提不得擋

抽中現賺6萬！　下周5檔抽籤股一次看

7-ELEVEN近80款飯糰、便當遭中聯油脂波及聯華食品公布退款方式