最近大家其實卡在同一個地方
你最近可能也遇過這種事:只是多貼幾段文件、上傳一包資料,AI 卻回你一段空白,外層工具還補一句「格式檔 JSON 壞了」。我這兩週看到好幾個類似案例,從合約摘要、研究筆記到程式文件抽取,看起來像不同問題,最後都卡在同一個地方。它沒抓到重點。 這篇的核心判斷很簡單:問題常常不在資料太少,而在你一次給了太多沒分層的資訊。AI上下文,白話文講就是 AI 這次回答前看得到、也要消化的材料;材料一多,又沒有先講清楚這次要做什麼,它就容易把力氣花在猜任務,而不是完成任務。邊界先壞。
它不是缺資料,而是一次收到太多未分層材料,找不到任務邊界。
先替你做判斷
先把整包文件拆成任務、範圍、資料三層,再請 AI 處理。錯誤訊息寫 JSON 壞掉時,很多時候只是最後輸出被截斷或空掉,真正要查的是前面餵進去的材料太亂。先查邊界。
為什麼最近一直在同一個地方跌倒
這個坑最近一直浮上來,是因為大家開始把 AI 從「問一句答一句」拿去做整包文件處理。以前你貼 500 字,它還能順著你的語氣猜;現在你丟 2 萬字、5 份附件、還要它輸出固定格式,猜錯的機率就上來了。負擔變重。 有些開發者遇到的狀況更典型:某個文件抽取流程裡,模型最後回了一段空內容,外層程式卻把它包裝成「JSON 解析失敗」。JSON,簡單講就是讓程式讀資料的一種固定格式,像表格欄位要對齊;只要 AI 沒吐出完整內容,外層就可能以為格式壞了。訊息會誤導。 另一個訊號也值得看:有人開始替長文件處理加上快取記錄。快取(cache),用白話文講就是把看過的資料暫時存起來,下次少做一次;他們甚至把每份文件的暫存時間從 1800 秒縮到 300 秒,並記錄命中或失敗。這代表長文件不是丟進去就沒事,系統也需要知道哪一份資料何時被用到。脈絡要管。
真正讓事情失控的,不是表面那一層
表面症狀是 AI 回空白、格式壞掉、答案前後矛盾;真正讓事情失控的,通常是三件事疊在一起:任務不清、資料太滿、輸出規格太硬。這三件事單獨看都還能修,湊在一起就容易炸。問題會疊加。 先看任務不清。你說「幫我整理」,AI 可能理解成摘要;你其實想要它找風險、比版本、抽欄位、產報告。這些任務需要看的線索不同,它如果一開始猜錯,後面再多資料也只是增加噪音。方向先歪。 再看資料太滿。AI上下文不是一個無底洞,它比較像一張會議桌:文件可以放很多,但桌上如果同時有合約、聊天紀錄、需求表、錯誤紀錄,沒有人標出哪一疊最重要,討論就會開始漂。現在多數模型能吞的字變多了,但「能吞」不等於「能判斷優先順序」。重點會被淹。 最後是輸出規格太硬。很多工具要求 AI 回 JSON,因為程式比較好接;可是當前面資訊太亂、回答又太長,AI 可能只吐出半段,甚至空白。外層程式看到半段格式,就報「JSON 壞了」。讀者看到這句,會去修括號、逗號、引號,卻沒修到真正破口。錯修很常見。
如果你只想先止血,先照這樣做
想避免這種狀況,先不要把「整包丟進去」當成第一個動作。你要先在文件前面放一張小紙條,告訴 AI 這包資料怎麼看。這張小紙條不用長,200 字內就夠,重點是把任務、範圍、輸出樣子講清楚。先立路標。 可以這樣寫:「這次只做合約風險摘要,不改寫全文;請只看付款、違約、保密三類條款;每一類輸出風險、原文位置、建議追問。」這段話看起來普通,但它做了 3 件事:把任務收窄、把資料切層、把答案樣子先定住。AI比較有路。 如果文件很多,不要一開始就叫它產最終版。先請它回一個「它理解到的文件地圖」:有哪些文件、每份像是什麼、哪些跟這次任務最相關。這不是浪費時間,這是防止它拿錯材料。尤其是你手上有 10 份以上文件時,這一步常常能省掉後面重跑的時間。先看地圖。 遇到 JSON 錯誤時,也不要第一時間只修格式。你可以先把要求改成「先用一般文字回答,不要固定格式」,確認它真的能說出內容,再讓它改成 JSON。這樣做是在分辨兩種問題:如果一般文字也空白,是上下文或任務邊界出事;如果文字正常、JSON 才壞,才回頭處理格式。先分病因。 還有一個小技巧很實用:把「不要處理的內容」也說出來。像是「不要根據會議聊天紀錄推測法律責任」、「不要改寫條款」、「不要補沒有出現在文件裡的日期」。這不是為了限制 AI 發揮,而是把跑偏的岔路先封起來。少走彎路。
最容易讓你以為有答案,其實還沒收尾的三個誤區
最容易白忙的做法,是看到「JSON 壞了」就開始檢查每個逗號。格式當然要對,但在這類案例裡,格式錯常常只是最後一層煙霧。前面如果任務邊界已經亂了,後面再怎麼修括號,也只是把錯的答案包得更整齊。別只修外殼。 另一個誤區,是以為換更大的模型就能解決。較大的模型在長文件上通常比較穩,但如果你把摘要、翻譯、比對、抓錯、產表格全部塞在同一次要求裡,它仍然需要猜優先順序。模型能力會影響上限,流程邊界會影響穩定度。兩者不同。 還有一種情況,是你把所有背景都貼上去,覺得這樣比較完整。完整不等於可用。對 AI 來說,沒有標籤的完整資料,很像把整櫃資料夾倒在桌上,然後叫同事「幫我處理」。對方可能很努力,但仍會先問:你到底要哪一份?問題在這。
送出前最後看一眼,不然很容易重工
送出前最後看一眼,不用搞得很複雜。你只要問自己 5 個問題:這次任務是一句話說得完嗎?文件裡哪幾份最重要?哪些內容先不要看?輸出要一般文字,還是 JSON?如果失敗,我要先用 1 份文件重測嗎? 這 5 題如果有 2 題答不出來,就先別整包丟。先補一段 200 字內的任務說明,再把文件分批送。你的目標不是讓 AI 看最多,而是讓它先看對。看對優先。
如果下次又遇到,先照這篇的順序走一次
下次你要把整包文件丟給 AI 前,先用這篇當檢查稿:先寫任務小紙條,再丟文件,再看它是否能講出文件地圖。若你只是臨時摘要一份短文件,簡單貼上就夠;若是 5 份以上、還要固定格式輸出,就值得多花 2 分鐘先分層。這是取捨。
讀者最常問的幾個問題
不需要把文件切到碎掉。真正要切的是用途,不是頁數。如果你要 AI 摘要 5 份合約,可以先給它文件清單、每份文件的角色、這次只看哪些條款;如果你要它找矛盾,就先限定比對欄位。文件可以長,但任務邊界要短。
先拿同一批文件中的 1 份做測試。如果 1 份能正常輸出,5 份合起來開始空白或說 JSON 壞掉,八成要先懷疑材料塞太滿、輸出被截斷,或格式要求太硬。如果 1 份也失敗,再查檔案編碼、權限、工具連線或模型當下狀態。先縮小範圍。


