先定流程

coding-AI 最貴的不是寫 code,是你讓它無邊界地反覆讀、改、測、再改。

你昨天用 coding-AI 寫的東西,今天才發現結果不對

你只是想「順手」整理一下專案結構。 丟一句:「幫我重構這個 feature,順便修掉相關測試。」 AI 很乖,開始掃檔案、改 40 幾個檔、跑測試、失敗、再改、再跑。你看著進度條覺得很療癒,像請了一個很勤奮的實習生。直到月底帳單跳出來:月費之外,多了 $200、$300,甚至更高的 usage。 那一刻才發現,原來「固定月費」只是入口票,不是吃到飽餐券。

為什麼會這樣?

coding-AI 的成本,不只算「它回你幾句話」。它常常在背後讀大量檔案、建立上下文、呼叫工具、跑測試、反覆修錯。你看到的是一個任務,系統看到的是一串 token、工具呼叫、agent round trip、測試執行和可能的 metered usage。

麻煩的是,大任務通常也更容易失準。Ryz Labs 做過 6 個月測試,超過 10k 行的 codebase,coding-AI 準確率掉到 50% 左右。也就是說,你花更多錢讓它看更多東西,它不見得更準,反而可能改出「看起來合理、跑得起來、邏輯有洞」的版本。

更氣的是,很多工具的收費頁寫得很像月費制,但月費裡其實有 quota。超過後就開始按量計費,或進入更高成本的模型、agent、工具執行。你不是被 AI 背刺,你是把它當無限工讀生用,結果它其實是按時計費顧問。

它是怎麼悄悄燒起來的?

**第一種:一句話大重構。** 「幫我把這個模組整理乾淨」聽起來很合理,但 AI 可能會自己擴張範圍:改命名、移檔案、調 import、更新測試、順便修 lint。40 個檔案不是你要求的,是它理解成「相關都要碰」。

**第二種:agent mode 自己繞圈。** 你叫它「跑測試直到通過」,它就進入很勤奮但很貴的模式:跑一次、失敗、猜原因、改 code、再跑。幾個 round trip 下來,成本比你手動看錯誤訊息還高,而且有時只是把錯誤藏到另一層。

**第三種:用 AI 做低價值雜工。** 像改格式、批次換字、整理 import、跑全量 test,這些其實很多時候用 IDE、script、formatter、CI 更便宜。你讓 AI 做,它會先理解語境,再生成修改,再驗證,等於請律師幫你貼標籤。

今天就能省下來的 4 個動作

**1. 每次任務先設「檔案上限」。** 不要丟「重構整個 feature」,改成:「只看這 3 個檔案,先提出計畫,不要修改。」等它列出會動到哪些地方,再決定下一步。大任務先變成估價單,不要一開始就開工。

**2. 把 AI 分成三種用法:問、寫、跑。** 「問」最便宜:請它讀錯誤、解釋架構、列風險。「寫」次之:讓它改小範圍 code。「跑」通常最容易燒:agent mode、自動測試、自動修復。不是不能跑,是每次跑之前先問:這件事用工具或 script 會不會更省?

**3. 大重構先要 patch plan,不要直接改。** 請 AI 先輸出:「會改哪些檔、每個檔為什麼要改、預估測試範圍、可能風險。」你看完砍掉一半範圍,再讓它處理第一批。這招很土,但很有效,因為成本失控多半發生在「它自動把任務擴大」。

**4. 設一個自己的停損線。** 例如:單次任務超過 10 個檔案先停;agent 修同一個錯誤超過 2 輪先停;全量測試先不要交給 AI 自己反覆跑。把停損寫進你的工作流,不要靠意志力。CodeRabbit 研究提到 AI PR 比人 PR 多出不少邏輯錯誤,代表你省下的 token,後面還可能變成 review 成本。

拿走的一句話

把 coding-AI 當按量計費的高級同事:先給小任務、先看計畫、先設停損,別一開口就叫它掃 40 個檔案。

  1. 1 / 4 · HOOK

    月費不是吃到飽,40 檔會燒錢。

    • 你丟一句重構,它開始掃全案
    • 測試失敗再修,來回次數疊高
    • 月底帳單才提醒你:已經超額了
  2. 2 / 4 · WHY

    錢燒掉,常常不是它寫太慢。

    • 範圍沒鎖,它把相關檔都算進來
    • 叫它跑到通過,工具呼叫一輪輪加
    • 月費其實有額度,超過才開始跳錶
  3. 3 / 4 · HOW

    先把工單變小,再讓它開工。

    • 指定只看三個檔,先列修改計畫
    • 要求修補計畫,逐項砍掉範圍
    • 同錯修兩輪沒過,先停下來看
  4. 4 / 4 · TAKEAWAY

    把 AI 當顧問,不是吃到飽。

    • 先看估價單,再准它改第一批
    • 格式和全量測試,先交給工具