給 AI 的不是整包程式碼,而是剛好能解題的 5 個檔案。
你昨天用 coding-AI 寫的東西,今天才發現結果不對
你把整個儲存庫(repo)丟進 AI coding 助手,心想:「這下它應該懂了吧。」結果它開始引用八百年前的舊檔案,抓錯架構,還很有自信地改了一個跟任務沒關的地方。你盯著回覆三秒:欸不是,我只是要修登入錯誤,你怎麼跑去改報表匯出?
真正的問題不是太大,是太吵
結論先講:大型程式碼庫(codebase)不是不能給 AI 看,而是不能「整包不分類」丟給它。AI coding 助手目前比較像一個讀很快、但注意力會漂的同事。你給它十幾萬行,它不會自動知道哪裡是主線、哪裡是歷史包袱、哪裡只是看起來很像。
這也是為什麼「給越多越懂」常常變成「給越多越亂」。真正有用的是最小可工作脈絡(context):夠它理解任務、定位入口、看見資料怎麼流、知道測試怎麼驗證,但不把整個雜物間搬到桌上。
Ryz Labs 6 個月測試提到:>10k 行的 codebase,coding-AI 準確率掉到 50%。這不代表工具沒用,而是提醒我們:任務越小、脈絡越準,AI 越不容易把旁支劇情當主線。
它是怎麼悄悄變糊的
第一種:檔名很像,AI 走錯門。你要改「新版付款頁」,它看到 `payment_old`、`payment_v2`、`payment_backup`,就開始腦補。人知道哪個是現役,AI 未必知道,尤其檔案裡還有註解寫「暫時保留」。
第二種:它抓到工具函式,卻沒看到呼叫路徑。你只貼了某個共用函式,它可以改得很漂亮,但不知道誰在呼叫、傳進來的資料長什麼樣。結果一跑,前端畫面沒事,後端流程歪掉。
第三種:你貼了太多「看起來相關」的檔案。像登入任務,你把帳號、權限、通知、報表、設定頁都貼上去。AI 會開始平均分配注意力,回答變成大雜燴:每段都碰一下,沒有一段真的咬住問題。
今天就能用的 5 檔選法
第一個檔案:任務入口。使用者點哪個按鈕、哪個網址、哪個指令會觸發問題,就貼那個檔案。不要先貼全專案地圖,先讓 AI 知道「事故現場」在哪。
第二個檔案:主要邏輯。從入口往下追,找到真正決定結果的那段程式。比如登入失敗,不是只看畫面檔,也要找到驗證帳密、發 token、判斷權限的地方。這一檔通常是 AI 最需要讀的一檔。
第三個檔案:資料形狀。貼型別定義、資料模型、API 回傳格式,讓 AI 知道資料長什麼樣。很多鬼故事不是語法錯,是它以為欄位叫 `userId`,實際上叫 `member_id`。
第四個檔案:相鄰範例。找一個同專案裡「已經做對」的類似功能。AI 很會模仿本地風格:錯誤怎麼處理、訊息怎麼回、資料怎麼命名,都能從範例學到,比你講十句規範有效。
第五個檔案:測試或驗證點。沒有測試就貼手動驗證流程、錯誤訊息、重現步驟。這是防止 AI 寫出「看起來修好了」的保險。Simon Willison 提過,假套件(hallucination)反而沒那麼危險,因為跑就會錯;麻煩的是跑得起來但邏輯不對。
拿走的一句話
別問「我要貼多少檔案」,先問「AI 要完成這個任務,哪 5 個檔案少一個就會猜」。


