海爾維提情境與古德哈特定律(Helvetica Scenario and Goodhart's Law)

Helvetica-Scenario

自己明明小時候經常寫東西,卻從國中開始一直很怕寫作,或許可以用古德哈特定律(Goodhart’s Law)來解釋?

最近在重溫生成對抗網路(Generative Adversarial Networks, GANs)的原論文。2014年的論文,著實有一些年頭了,所幸寫得很直觀易懂,讀起來不怎麼費勁。其中有一個細節很有意思,不是算法和框架本身,而是在作者的分析之中,有提到一個叫「Helvetica Scenario」的東西(姑且稱作「海爾維提情境」吧),說是對抗網路需要避免這種情境。

這「海爾維提情境」是個什麼東西呢?DuckDuckGo和ChatGPT給了我不同的答案。根據搜尋引擎DuckDuckGo(其實是匿名套皮谷歌lol)的解釋,「海爾維提情境」是一個BBC喜劇節目中的哽,說是鈣原子的質心會在某些特定條件下到處遊走,形成非常不穩定的狀態。當然節目本身肯定是在扯淡,論文中引用這個捏他,估計是為了形容一種神經網路什麼都沒學到的混沌狀態吧。

helvetica scenario from Look Around You
BBC喜劇「Look Around You」中的海爾維提情境

有趣的是,GPT老師給了我完全不一樣的解釋。說的是這樣一個故事:如果讓個人工智慧「把世界變得更美麗」,這人工智慧有可能會把世界上所有的文字都變成Helvetica字體——因為人類和人工智慧都知道Helvetica字體是很好看,很標準的字體,但是人工智慧誤把這當作「唯一」美麗的標準了,因此把一切都變成Helvetica體,能夠最大化人工智慧關於「美麗」的標準。

雖然GPT老師給的大概率是Hallucination下的胡謅(畢竟DuckDuckGo給的是真有論據的嘛),但我個人覺得GPT老師的解釋更有道理。這很能描繪對抗模型中的mode collapse問題。對抗模型中,我們希望模型通過一些隨機噪聲生成多元的真實圖片,達到分類器看不出來的程度。對於人工智慧模型來說,ta很有可能就直接把一個真實的圖片給「背下來」,每次都生成這一張死記硬背的圖片。這當然可以達成糊弄分類器的目標,但是更顯然的是,這根本就不是想像中的人工智慧啊,完全沒有創造力欸,完全忽略了「多元化」的目標!

不僅是對抗神經網路,很多機器學習的框架,都有類似的問題:模型把一個指標做得太好了,反而在現實中不太適用。這在經濟學中被稱作「古特哈特定律(Goodhart’s Law)」——“Any observed statistical regularity will tend to collapse once pressure is placed upon it for control purposes”。用大白話來講,就是一個衡量標準變成一個一定要實現的目標,就不再是一個有用的標準了。感性上我非常認同。我的粗略理解是,人類會追求一些「好」的東西,因此會製作衡量標準,把抽象的「好」量化成直觀的數字或指標,從而最大化這些量。然而,人類的認知能力總歸有些限制,這些數字並不能夠反映「好」的所有方面。結果就是,這些優化後的冷冰冰數字,反而與「好」的概念背道而馳。正如對抗模型中,「好」僅僅被量化成「是否能騙過分類器」,因此會有非常荒謬卻合理的結果。

在廣義上將,如果一些衡量標準上有了「pressure」,即使在其上作優化,也會將此標準扭曲。過去的記憶又湧上心頭。唸國中之前,我是很喜歡寫東西的!小學的時候,每天在空間裡記日記,分享給同學們看(雖然童言無忌也得罪了一些人)。看哆啦A夢時寫過同人小說(雖然當時不知道這叫法)。看完《上下五千年》時,就有寫秦始皇穿越回現代的小科幻短文;讀完《西遊記》後,也有續寫過悟空和佛祖的故事呢!對於文字的熱情,明明曾經也是有的呀?

進入國中之後,一切都變了。想起了那時學的考場作文,根據幾個字或幾個似是而非的文字,寫一篇至少800字的文章。滿分60分,50及以上算寫得好。這種作文看似沒有標準,但是在敬愛的陳小川老師的諄諄教誨下,這種考場作文變得跟他所鄙夷八股文沒有區別:需要有好詞佳句,需要有煽情,需要提到親人,需要提一點古文經典,還需要所謂的昇華⋯⋯每次作文課我是學不到任何東西的。雖然有點得罪人,但是大多數時候陳小川先生念的優秀作文,都是華而不實。偶爾能聽到一兩篇令人耳目一新的,但絕大多數的來說,題材可能略微不同,空洞的感覺卻又大同小異。

而我呢,常常是被作為反面典型呀。照著那些標準寫文章,總有一種彆扭感。有人推薦我背一個模板,看到個題目就往上套,而我又不想這麼做。因此,不要說50分了,我是絕大多數情況下,連47都上不了的。我們敬愛的陳小川先生,每次考完後,總是要報一下幾個人沒上47分,順便酸一下;好多次都在唸完「優秀作文」後,故意讀一些「反面教材」。說是匿名,但小川就在往我這邊瞟呀——當然確實也是我寫的垃圾~。去他的辦公室,陳小川先生也很少給我好臉色看呢,可能也有因為我初一時得罪過他吧。對我歇斯底里地吼叫,卻不會真正教會學生如何寫作,現在想起來真是有點可憐呢。

我也有點可憐吧,有些玻璃心。自己的信心被一次又一次的低分作文消磨殆盡,對寫文字的態度,從熱情到無感,再到恐懼。日記什麼的就偶爾寫寫啦,公開的文字根本就不敢想像。即使是現在寫一些自己的東西,那「800字要求」也會是不是擾亂我的思緒。當然也不能完全怪小川先生啦~小時候父親比較嚴格,給我佈置過很多閱讀任務,還一定讓我寫所謂的讀後感。父親推薦的書確實都是好書,不過確實不適合小學生看,我也就漸漸地應付形式地「水」那些毫無感情的讀後感,寫過一兩週後也完全忘了。前陣子看我小時候寫的讀後感,還很震驚自己原來度過那麼多書——不過基本上忘光了。我何嘗不是那個「對抗模型」呢?有一說一,「對抗」真是個好翻譯呀,明明原本只是對應「adversarial」的說~

屈於升學壓力,初三的時候,還是迫使自己朝那些奇怪的標準「優化」自己了。或許看起來有些好結果吧。有一次週末的作文作業,題目忘了是什麼了,好像是關於自己的榜樣?反正我寫的是給漢字編碼的那位王選院士——其實我是在寫作文之前,根本不知道他是誰。在母親的督促(壓力?),「精雕細琢」了一個週末。最後確實拿了52分的高分,陳小川第一次讓我把我的文章當「優秀範文」唸了出來。他好像很高興,還在興頭上說什麼「一直在用有色眼鏡看我」,給我道歉什麼什麼的。我就無感,反正這篇文章不像我。喔,原來原來您還知道是在給我穿小鞋呀!我破碎的心,我失去的兩年,您能補給我嗎?

果然,我畢竟還是人,不是沒有感情的「對抗神經網路」,還是受不了這種違心的優化。那年中考題目叫「答案」。正好那時在聽齊豫,非常喜歡她的《答案》。「天上的星星,為何像人群一般的擁擠呢?地上的人們,為何又像星星一樣的疏遠?」標準什麼的,我直接不管了,就當是一篇《答案》歌詞同人文了。小學校園,朋友,旅行⋯⋯嗖嗖嗖颼颼颼就意識流地寫完。不久後得知,我中考語文考出了我初中三年的最低分,我卻感到酣暢淋灕,真正有種解放的感覺——果然,寫出自己的文字,還是最舒服呀。

Da an

齊豫 - 《答案》

已經七年了呀。慢慢的,我也開始出於興趣寫東西了⋯⋯完蛋,這夢魘又來了!這裡不昇華一下,總感覺缺了點什麼?寫到這裡也沒什麼特別想發散的東西。就祝自己因為能夠寫些東西,做個好夢吧☆:.。. o(≧▽≦)o .。.: