Agent 可觀測性不是「nice to have」,是信任基建
最近看到 Reddit 上有人把 OpenClaw agent 的執行過程即時串到 iPhone 鎖屏,thinking、tool calls、甚至 cost 都顯示出來,讓我想聊聊這件事背後的產品邏輯。
這不只是一個很酷的 hack,它碰到了一個 AI 產品很核心的問題:使用者在等待的時候,到底在等什麼?
那個作者說了一句話我覺得點到了:「typing... 不知道在幹嘛」。這個感覺我相信每個用過 AI agent 跑長任務的人都有過。你不確定它是不是卡死了、是不是走錯方向了、是不是在燒你的 credit 做一些沒意義的事。這種不確定性,在個人使用上是焦慮,在企業採購的脈絡裡,就是 blocker。
從產品角度來看,可觀測性(observability)跟信任之間的關係其實很直接。
我們在做 B2B 產品的時候很習慣一個概念:user 願意等,但他要知道「為什麼要等」「等多久」「等完會得到什麼」。這三個問題答得越清楚,等待焦慮就越低,轉換率就越高。AI agent 也一樣,但現在大部分的 agent 介面還停在「轉圈圈」或者「thinking...」這個層次。
把執行過程推到鎖屏,解決的其實不是技術問題,是心理問題。使用者不用一直盯著螢幕、不會覺得「我是不是做錯了什麼」、也更容易估算這個 agent 值不值得繼續跑。這在個人使用上讓體驗好一點,在企業導入的情境下,意義更大。因為能讓決策者看到「agent 在做什麼」,本質上就是在說「這東西是可以被審計的」。
可審計性(auditability)在 B2B AI 導入裡面是很關鍵的一塊,特別是牽涉到敏感資料或高成本操作的時候。
當然,這個 Reddit 方案目前還很粗糙,長任務有穩定性問題,這不意外。Live Activity 本來就有一堆限制,用來跑幾分鐘的任務還好,跑幾十分鐘的話 iOS 很容易就把它砍掉了。
但我覺得有意思的不是這個實作能不能 production ready,而是它在驗證一個方向:agent 的可觀測性,可以也應該跟使用者生活的其他介面整合,而不只是活在 chat UI 裡面。手機鎖屏只是其中一個出口,你也可以想像 Slack notification、dashboard widget、或者任何一個使用者已經習慣看的地方。
這是我覺得接下來 AI agent 產品會需要認真想的一個 layer。
作者:MingTech