請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Codex是新一代作業系統?新創CEO實測6種AI工作流,他為何甘願從Claude Code投奔Codex?

數位時代

更新於 7小時前 • 發布於 05月15日09:00

當 AI 代理人能寫程式、能讀你的 Gmail、能把策略文件直接推到 Notion,你打開電腦看到的第一個畫面,會不會就是它?

「Codex 三個月、六個月前還是垃圾。如果 OpenAI 的人在這通電話上聽到,我 100% 還是這句話。」 商業寫作平台 Every 創辦人兼 CEO 丹.希普(Dan Shipper)在 5 月 6 日的 Codex Camp 直播裡,當著兩百多位訂戶這樣說。

但他的下一句話卻 180 度反轉:「但我現在每天打開電腦,第一個開的應用程式就是 Codex。」

這段內部翻轉,發生的時間點剛好卡在 OpenAI 4 月 23 日發表 GPT-5.5、5 月 5 日推出 GPT-5.5 Instant 的當口。希普與 Every 成長主管 Austin 用一場 60 分鐘的對談,把這場「從 Anthropic 改投 OpenAI」的個人決定講清楚,但訊號其實不在「Codex 比 Claude Code 強」這層比較,而在他丟出的另一句判斷上:

「現在浮現的是一種新作業系統:一個專門用來管理代理人的工作介面(agent management interface),這場競賽會決定你未來在哪裡完成工作。」

換言之,希普看到的不是工具切換,是一張全新桌面正在被四家模型公司同時搶下。Anthropic 押 Claude Code、Claude for Work,OpenAI 押 Codex 桌面 app,xAI 在 4 月底與 Cursor 簽下 100 億美元戰略合作、附帶最高 600 億美元的收購選擇權(彭博社、CNBC 報導,目前仍未正式完成收購),Google 則推出代理人優先的 IDE「Antigravity」搶位。

誰拿下這層 surface,誰就拿下知識工作者打開電腦看到的第一個畫面。

從「資深工程師的私房工具」變成知識工作者的日常駕駛車

要懂 Codex 為何能在三個月內被希普捧成「日常駕駛車」,得先把時間軸倒回去。

GPT-5 時代,OpenAI 的內部分工很清楚:一般人在 ChatGPT 寫 vibe coding(口語下指令、AI 自動寫程式的編碼風格),資深工程師才開 Codex 做 pair programming。希普回憶當時的 Codex「沒有情商,會跟你吵架,讓你覺得自己很笨」,被刻意限制在沙盒裡。

真正翻轉這個分工的是 Anthropic。

希普的觀察是:Anthropic 證明了一件事,一個夠快、夠聰明、又有情商、能存取你電腦的模型,對程式設計師是極佳體驗;而既然它能自己寫軟體,就能做任何形式的知識工作。Claude Code 因此從工程師工具長成跨職能代理人,Claude for Work 把同一套邏輯擴張到行銷、業務、營運。

OpenAI 過去三個月對 Codex 做了希普口中的「硬轉向」:從只給工程師、變成寫作、招募、跑營運都能用的桌面 app。「我用它做深度工程、寫文章、找人才。」希普說。

為什麼是 Codex 桌面 app,而不是 Claude?

Every 成長主管 Austin 的故事,是更具體的對照樣本。

2025 年底到今年 1 月,Austin 在 CLI(命令列介面)裡把 Claude Code 接到所有工具,週末連續 12 小時不出門,就為了把 Codex 之前不能解的工作流跑通。他形容那是自己的「agent pill moment」,第一次相信代理人能接管知識工作。

到了 2 月,希普推他試 Codex。Austin 第一次使用就被勸退:「它問我三個技術選項要選哪一個,我完全聽不懂,回問為什麼,Codex 回我『為什麼你不直接照我推的做』。」那次他得到的結論是,「沒有什麼比兩個月前的 Codex 更能讓我覺得自己很笨。」

真正的轉折是 GPT-5.5。Every 一個月前拿到提前試用,Austin 發現除了設計工作他仍然信任 Claude Opus 之外,模型本身已經和 Anthropic 至少打平

但讓他「全面搬家」的不是模型,是 app 本體。「我從來沒成功讓 Claude for Work 在我這邊跑起來。」Austin 說,Codex 桌面 app 的速度、子代理(sub agent,把任務拆給多個代理人並行的功能)品質、自動化推送的順暢度,是 Anthropic 桌面 app 目前還沒追上的細節。

「我現在 80% 的工作時間都在 Codex 裡。它幫我從 Gmail、Slack、Notion、Stripe 拉資料,今天早上我說『幫我做這場 Camp 的流程表』,它知道去哪找、推到 Notion、丟到 Slack,完美。」Austin這樣說。

希普補了一個工程師會懂的觀察:兩家公司其實看到同一個終局,未來一兩年會像賽馬一樣,每隔幾週輪流領先;現在切換成本還不算高,但等生態真的長出來,你選定的代理人桌面 app,會像 10 年前選 iOS 還是 Android 那樣,把你綁進整個工作生態

Every 是怎麼用代理人的?兩條最反直覺的工作流

希普與 Austin 在直播裡 demo 了六種真實工作流(完整六條見下方配件)。其中兩條最值得讀者抄走,一條翻轉人跟工具講話的方向,另一條揭示代理人決策鏈的隱藏風險。

讓代理人告訴你工具該怎麼用

Austin 開新對話時,第一句常常不是下指令,而是反問 Codex:「請看看我最常用 Notion、Slack、Gmail 做什麼,建議幾個自動化。」Codex 會回提「跟進雷達」「事件指揮中心」「招募流程追蹤」等選項,由 Austin 選一個再執行。

希普對此下了一個值得記下來的結論:「讓一個前沿模型告訴你『這個工具該怎麼用』,會比自己想破頭快太多。」 這個微小的開場句切換,其實顛覆了過去十年的 SaaS 邏輯。

以前是「我有目的、工具幫我達成」,現在是「我有原料、模型告訴我能做什麼」。對任何還在用「打開十個分頁」工作的人,這就是思維升級的入口。

KPI 儀表板:3% 誤差會讓下游全歪

Austin 想做一份所有代理人都能讀的 Notion 即時 KPI 表,要求 Codex 一次到位,誤差落在 5–10%。他立刻退回手動驗證,原則只有一條:「只要源頭資料有 3% 誤差,整個代理人鏈下游的決策都會歪掉。」

要理解這個數據誤差所導致的問題,你可以想像你開一間飲料店,並請一整串「代理人」幫你做決策:

第一個代理人每天看 POS 數據,以觀察哪一款飲料賣最好,順便算飲料的「平均甜度」; 第二個代理人看這個「平均甜度」,自動設計新品、排下季菜單;第三個代理人拿新品菜單去算進貨量,決定要叫多少糖漿和茶葉。

結果,因為一開始 POS 設定就錯了 3% 誤差,所以本來點「微糖」的客人,有 3% 被記成「半糖」。

這 3% 看起來很小,但往下會變這樣:

第一層:報表顯示「客人其實喜歡再甜一點」,平均甜度被拉高。
第二層:設計新品的代理人以為「市場愛重甜」,新品全都比現在再甜一級。
第三層:進貨的代理人看到「未來菜單都偏甜」,就多叫一堆糖漿、少叫茶葉。

最後的結果是:新品一堆都偏甜、庫存裡糖漿爆多、茶葉常缺貨。

每個代理人看起來都只是「照數據做出合理調整」,但因為一開始那 3% 就是錯的,大家都在很認真地順著錯的方向前進,整條決策鏈就一起被帶歪了。

這條警示對任何想把代理人接到報表系統的公司都重要,當代理人開始為其他代理人提供資料,誤差會在鏈條中複合放大,不是線性增加。值得貼在每個編輯部、行銷部、營運團隊的牆上。

其餘四條工作流,把整套工作環境變成資料夾、代理人寫草稿人類完稿、GTM 計畫五分鐘出底稿、招募變成大海撈針,可詳見下方配件。

「不是寫給人看,是寫給人透過代理人讀」

這場直播裡最值得記下來的,是希普對工作本質的重新定義:

「你大部分上班時間,其實是把你已經想過的東西,轉成別人能讀的格式。重要的是先把思考做完。」

過去寫一份策略文件是花一整天打字,現在用語音 app Monologue 口述、丟給 Codex 整理,自己只負責確認每個 bullet point 是否站得住。希普對團隊立了一條規矩:你交出的代理人寫的文件,會議上有人問細節,不能說「啊我不知道有寫這個」,被抓包就完了

為了避免這種翻車,Every 在 Codex 的專案檔裡放了規則:「不要自己加沒在別處出現過的內容」「想到新建議丟到 chat 就好,不要塞進文件」。這條設計把 AI 從「會幻想的助理」拉回「會整理的祕書」。

更進一步,希普指出一個被多數公司忽略的轉變:文件的讀者已經從「人」變成「人透過代理人」

Every 的 COO Brandon 拿到 Austin 的 GTM 計畫,第一個動作不是讀,而是叫自己的代理人「幫我摘要、抽商業案、列我要負責的章節」。文件的可被代理人解析能力(agent-readability),開始比文字優美度更重要。Every 為此推出自家產品 Proof,一個用 markdown 在團隊之間傳遞、讓代理人直接讀的介面。

這場「桌面 app 戰爭」意味著什麼?

希普與 Austin 的觀察不是中立評論,他們是 OpenAI 的深度使用者與生態共建者,講話有立場。但把立場剝掉,這場對談指向三個值得台灣讀者放在心上的趨勢。

其一,代理人正在重定義「打開電腦做什麼」這件事。 過去十年知識工作的入口是瀏覽器與 SaaS 儀表板,未來十年的入口很可能是一個能看到、能點、能跨 app 操作的代理人桌面。誰先把這個 surface 設計成最順手的版本,就拿下未來通用作業系統級別的話語權。

其二,工具切換速度會持續以「季」為單位。Austin 從 Claude Code 全面搬到 Codex 用了三個月,希普則建議「每隔幾週測試一次競品」。對一般企業而言,這意味著「選定一家供應商一路走到底」的策略風險變高,編輯部、行銷部、營運團隊都該保留每季至少一天的「玩工具時間」。Every 自己每年辦兩次「Think Week」,整週停掉日常工作只為了學新東西。

其三,文件設計要開始為代理人讀者服務。 過去寫策略文件想著 CEO 怎麼看、怎麼讓他兩分鐘抓重點;以後要多想一層:CEO 的代理人怎麼解析這份文件。markdown、清晰章節、明確 bullet point、可被機器引用的段落結構,會從「工程師的偏好」變成「跨部門通用標準」。

希普在直播尾聲說了一句話,值得貼在每個編輯部的牆上:「工具與工作流變得太快,光跟著現在的工作方式跑,會被用新工具新範式的人靠預設值打敗。」

資料來源:Every YouTube《Why We Switched From Claude Code to Codex》彭博社:SpaceX-Cursor 600 億美元收購選擇權CNBC:SpaceX 與 Cursor 合作報導OpenAI:Codex 桌面 app 介紹

本文初稿為AI編撰,整理.編輯/ 李先泰

延伸閱讀

台積電上半年12人升官!資深副總與副總近30人,背後關鍵是AI擴產與美國賭注
執行長都這樣用AI!12位CEO親揭工作術:讓AI當幕僚長、情報蒐集、沙盤推演難關⋯
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

台積電一天賣光!世界先進爆鉅額交易

NOWNEWS今日新聞
02

LED大廠破產清算 8千坪廠房「13億流標」

EBC 東森新聞
03

小吃店誤開多張同號發票!發文求救追不回 中特獎「最少將賠1千萬元」

三立新聞網
04

餐飲也危險?億萬富豪曝「9種行業快撐不住了」:很多公司恐消失

鏡報
05

「小雨傘包包」退出台灣市場!結束20年代理全面撤櫃 粉絲不捨:年輕時超愛買

鏡週刊
06

台股突下墜「回檔海嘯第一排」曝光!謝金河示警1現象:股價超漲到2029

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...