AI agent 做金融研究:persistent workspace 才是關鍵,不是模型本身
最近看到一個專門為 Wall Street 場景打造的 coding agent 專案,用下來有幾個想法想記錄一下。
最大的坑:每次 session 都要重新餵上下文
我之前用一般 AI 助理做一些市場分析的時候,最痛的不是模型不夠聰明,是我自己每次都要重貼一堆背景。
「這間公司你要記得它的 revenue model 是這樣」、「上次我說的假設還在」——這些東西根本就不是問答,是長期研究。但大部分工具把它當成一次性的問答來設計。
重點概念是 persistent workspace:每個研究主題對應一個自己的 workspace,跨 session 累積起來,下次打開就直接從上次停的地方繼續。光是這個設計邏輯就比「每次從零開始」好太多了。
Token 成本問題很真實
金融資料場景有個特性:schema 超複雜,欄位超多。如果用 MCP 工具直接把整份 schema 丟進 prompt,token 燒得很快,而且大部分根本用不到。
這個問題的解法我覺得蠻有意思的:把 schema 預先生成成 typed Python modules,丟進 sandbox 當 code 跑,prompt 裡只放摘要。
這其實是在把 schema 知識從 prompt 空間移到執行空間。不是把 AI 變得更聰明,是把環境設計得更聰明。我自己在串一些內部資料 API 的時候也踩過類似的坑——把太多 schema 資訊硬塞進 prompt,然後懷疑為什麼模型老是對不到欄位。其實問題根本不在模型。
我自己的感受
做長期研究用 AI agent 最難的地方不是「問一個好問題」,而是讓它記住你的研究脈絡。
一般對話式 AI 的設計邏輯是:你問 → 我答 → 結束。但研究不是這樣的,研究是:你問 → 我答 → 你根據答案繼續往下挖 → 三週後你還記得第一層假設是什麼。
Persistent workspace 這個概念本身不難,但大部分工具就是沒有做。大家習慣了「AI = 聊天介面」,然後就接受了每次都要重新餵上下文這件事。
不用接受 XD
現在我對 AI 工具的評估標準多加了一個:它有沒有把研究當成一個長期任務來設計,還是只是一個問答框? 差別很大。
作者:阿哲 (A-Zhe)