四月的時候,科技媒體 Computing 報導了一個很值得製造業管理者注意的現象:有些公司開始把 AI token 用量做成排行榜。報導中提到,Meta 內部一個名為「Token Legend」的排行榜在資料外流後關閉;Disney 有員工在九個工作日裡對 Claude 送出大約四十六萬次指令;Visa 三月份的 token 用量接近二月份的兩倍。
這些不是技術新聞,是管理新聞。
把 AI 使用做成可比較的排行榜,把 token 消耗變成「誰最會用 AI」的替代指標,這套邏輯今年正在大型科技公司之間擴散。JPMorgan、Disney 等公司的內部儀表板也被媒體提及。這些消息未必代表公司正式把 token 用量納入考核,但它已經足夠提醒我們:當 AI 使用量變成可見、可排名、可被表揚的數字,管理行為很快就會被數字牽著走。
問題是,我們做工廠的人,對「指標變了,行為跟著變」這件事的記憶,應該比矽谷的主管還深。
釘子工廠和 OEE 的老問題
七十年代經濟學家 Charles Goodhart 提出過一個後來被廣泛引用的觀察:當一個統計規律被拿來控制行為,它本身就會失效。後來大家把它簡化成一句話:「當一個指標變成目標,它就不再是好的指標。」最常被拿來解釋這件事的是釘子工廠。如果用「做了幾根釘子」當績效,工人會做一堆迷你釘;改成「做了幾公斤的釘子」,工人會做幾根超大鐵釘。指標本身沒問題,問題在於它一旦被綁上獎金,就會被優化成一個跟目的脫鉤的數字。
OEE 走過完全一樣的路。設備總效率原本是給管理者看現場真實狀況的,包含可用率、效率、良率三個分項。但當 OEE 變成考核項目、變成廠長月會的成績單,現場就學會了怎麼把數字做漂亮。設備空轉的時間被歸到「計畫停機」,小停機被聚合成一次大停機免得拉低可用率,換線時段乾脆排在系統盲區。這些手法不需要造假,只要懂得怎麼歸類就行。最後 OEE 數字漂亮,產出沒有變多,但獎金照領。
把 AI 使用率納入績效,是同一個劇本的下一幕。
使用率從來就不是好指標
Indeed 的資訊長 Anthony Moisant 講過一句話,值得釘在這類會議室的牆上:「任何時候我們把指標和獎勵綁在一起,我們就創造了反向誘因,員工就會開始照那個指標做事。」他建議的替代品是看產出:交付速度、客戶影響、實際解決的問題。
這聽起來很基本,但實際上極難執行。因為產出指標難收集、有時間延遲、結果還會被別的因素污染。使用率反過來:好量、即時、看起來客觀。所以管理者很自然地選擇後者,然後告訴自己「這是過程指標,幫助員工建立習慣」。
問題是,AI 使用率跟 OEE 一樣,被找漏洞繞過的條件全都齊了。第一,量測方式單純(消耗多少 token、發了幾次指令),員工知道怎麼影響它。第二,公開排名造成同儕壓力,沒人想被當成「不會用 AI 的人」。第三,獎金和升遷掛勾,繞過的動機就成立了。Computing 報導裡那位九天送出四十六萬次指令的 Disney 員工,平均算下來幾乎是每分鐘按下一次送出,連續九天。這比較像自動化代理在跑,不像人在正常工作。
BCG 的報告講得很直白:六成的公司投入 AI 之後,幾乎沒有取得實質營收或成本成效,真正進入 future-built 狀態的公司只有百分之五。McKinsey 也指出,百分之八十八的組織已經在至少一個業務功能中使用 AI,但只有大約三分之一開始把 AI 計畫規模化。使用率高跟價值產出高,從來就不是同一件事。我們把使用率當 KPI,等於是在獎勵那一大塊尚未產生價值的活動。
該被考核的不是使用率,是抉擇
製造業有經驗的廠長知道,OEE 看板要看,但更要看別的東西,比如客訴率、保固成本、工時與產出的比值、人員流動率。多套指標互相牽制,單一指標就難被找漏洞。AI 使用該不該被觀察?應該。但被觀察跟被考核是兩件事。
四個問題或許值得放進主管的下一次績效會議:
第一,我們希望員工的時間花在哪裡?如果答案是「快速產出和正確判斷」,那考核的就應該是這兩件事,不是過程中用了多少 AI。
第二,我們的 AI 使用儀表板比較像現場的 OEE 看板,還是比較像加班報表?前者用來找瓶頸,後者用來打分數。性質完全不同。
第三,假設我們把使用率排名公開暫停一個月,數字會掉多少?如果會大幅下滑,我們知道前面那些使用大半是被排名催出來的,跟業務需求無關。
第四,該被獎勵的人,是「最會用 AI 的人」,還是「讓 AI 投入產生最大產出的人」?這兩種人在組織裡通常不是同一個。
這套思考不是反對 AI 導入,反而是希望它能走得長。每一波管理浪潮都跑過同樣的劇本:先設指標、再被找出漏洞、然後被換掉。如果我們能在 AI 使用率走完這條路之前停一下,想清楚要產生的是什麼結果,那這套考核還沒設就已經值回票價了。
數據來源:
- Computing.co.uk — Tokenmaxxing: AI use as status symbol(2026,含 Meta、Disney、Visa、JPMorgan 案例)
- The Pragmatic Engineer — The Pulse: token spend breaks budgets, what next?(2026)
- BCG — Are You Generating Value from AI? The Widening Gap(2025)
- McKinsey — The State of AI(2025)
- OEE.com — OEE Calculation: Definitions, Formulas, and Examples(持續更新)
- EconBiz — Charles Goodhart, Problems of Monetary Management: The U.K. Experience(1975)
- Mattson, Bushardt, Artino — When a Measure Becomes a Target, It Ceases to be a Good Measure(2021)