Context 與大型 Codebase

別把整個 repo 丟給 AI

AI 不是吃越多越懂。先從任務倒推，挑出能讓它改對的 5 個檔案。

先看這句

給 AI 的不是整包程式碼，而是剛好能解題的 5 個檔案。

分類Context 與大型 Codebase

適合讀者已經在用 coding-AI 工具的進階使用者

閱讀時間5 分鐘

先定流程

給 AI 的不是整包程式碼，而是剛好能解題的 5 個檔案。

你昨天用 coding-AI 寫的東西，今天才發現結果不對

你把整個儲存庫(repo)丟進 AI coding 助手，心想：「這下它應該懂了吧。」結果它開始引用八百年前的舊檔案，抓錯架構，還很有自信地改了一個跟任務沒關的地方。你盯著回覆三秒：欸不是，我只是要修登入錯誤，你怎麼跑去改報表匯出？

真正的問題不是太大，是太吵

結論先講：大型程式碼庫(codebase)不是不能給 AI 看，而是不能「整包不分類」丟給它。AI coding 助手目前比較像一個讀很快、但注意力會漂的同事。你給它十幾萬行，它不會自動知道哪裡是主線、哪裡是歷史包袱、哪裡只是看起來很像。

這也是為什麼「給越多越懂」常常變成「給越多越亂」。真正有用的是最小可工作脈絡(context)：夠它理解任務、定位入口、看見資料怎麼流、知道測試怎麼驗證，但不把整個雜物間搬到桌上。

Ryz Labs 6 個月測試提到：>10k 行的 codebase,coding-AI 準確率掉到 50%。這不代表工具沒用，而是提醒我們：任務越小、脈絡越準，AI 越不容易把旁支劇情當主線。

它是怎麼悄悄變糊的

第一種：檔名很像，AI 走錯門。你要改「新版付款頁」，它看到 `payment_old`、`payment_v2`、`payment_backup`，就開始腦補。人知道哪個是現役，AI 未必知道，尤其檔案裡還有註解寫「暫時保留」。

第二種：它抓到工具函式，卻沒看到呼叫路徑。你只貼了某個共用函式，它可以改得很漂亮，但不知道誰在呼叫、傳進來的資料長什麼樣。結果一跑，前端畫面沒事，後端流程歪掉。

第三種：你貼了太多「看起來相關」的檔案。像登入任務，你把帳號、權限、通知、報表、設定頁都貼上去。AI 會開始平均分配注意力，回答變成大雜燴：每段都碰一下，沒有一段真的咬住問題。

今天就能用的 5 檔選法

第一個檔案：任務入口。使用者點哪個按鈕、哪個網址、哪個指令會觸發問題，就貼那個檔案。不要先貼全專案地圖，先讓 AI 知道「事故現場」在哪。

第二個檔案：主要邏輯。從入口往下追，找到真正決定結果的那段程式。比如登入失敗，不是只看畫面檔，也要找到驗證帳密、發 token、判斷權限的地方。這一檔通常是 AI 最需要讀的一檔。

第三個檔案：資料形狀。貼型別定義、資料模型、API 回傳格式，讓 AI 知道資料長什麼樣。很多鬼故事不是語法錯，是它以為欄位叫 `userId`，實際上叫 `member_id`。

第四個檔案：相鄰範例。找一個同專案裡「已經做對」的類似功能。AI 很會模仿本地風格：錯誤怎麼處理、訊息怎麼回、資料怎麼命名，都能從範例學到，比你講十句規範有效。

第五個檔案：測試或驗證點。沒有測試就貼手動驗證流程、錯誤訊息、重現步驟。這是防止 AI 寫出「看起來修好了」的保險。Simon Willison 提過，假套件(hallucination)反而沒那麼危險，因為跑就會錯；麻煩的是跑得起來但邏輯不對。

拿走的一句話

別問「我要貼多少檔案」，先問「AI 要完成這個任務，哪 5 個檔案少一個就會猜」。

1 / 4 · HOOK
不是丟太少，是丟太吵。
- 你只想修登入，它跑去改報表
- 整包儲存庫丟下去，舊檔也像主線
- 檔名長得很像，它容易走錯門
2 / 4 · WHY
AI 會糊，是因為你沒畫主線。
- 現役檔沒標清，舊版看起來也能用
- 只貼工具函式，它猜不到誰在呼叫
- 相關檔塞太多，注意力被平均分掉
3 / 4 · HOW
先挑 5 檔，再叫它動手。
- 先貼入口檔：哪個按鈕會觸發錯誤
- 再追主邏輯：誰驗帳密、發權杖
- 補資料形狀、相鄰範例、驗證步驟
4 / 4 · TAKEAWAY
少一檔會猜，才是該貼的檔。
- 別問要貼多少，先問少哪檔會歪
- 5 檔夠用：入口、邏輯、資料、範例、驗證

讀完這篇，接著看

P3-B-01 · Context 與大型 Codebase

五千行後 AI 迷路，先餵 context

小檔案改得像神，一碰 hooks、store、utility 就亂套；多半不是模型變笨，是專案地圖沒給清楚。

繼續看 →

← 回上一篇：AI 寫的 code 跑起來沒錯,但行為跟你預期不一樣 — 是哪一種錯

← 回首頁

別把整個 repo 丟給 AI

你昨天用 coding-AI 寫的東西，今天才發現結果不對

真正的問題不是太大，是太吵

它是怎麼悄悄變糊的

今天就能用的 5 檔選法

拿走的一句話

不是丟太少，是丟太吵。

AI 會糊，是因為你沒畫主線。

先挑 5 檔，再叫它動手。

少一檔會猜，才是該貼的檔。

五千行後 AI 迷路，先餵 context

想收到下一篇 AI 踩坑拆解？

如果這篇剛好講到你，也可以接著看這幾篇。

要 AI 改一個跨多個檔案的功能,怎麼避免它只改一半

五千行後 AI 迷路，先餵 context

AI 寫的條件判斷在邊界值(0 / null / 空陣列)上常常出錯

這篇用到的概念，詞典裡都有完整拆解。