怎麼給無 AI 背景的人解釋大模型?

TL;DR:

先說結論:其實是機器🤖️教會了人們「什麼是智能?」:

\begin{align*} 智能 &= 預訓練 × 後訓練 \\ &= 預測 × 推理 \\ &= 看清當下的世界 × 推演今後的世界 \\ &≈ 看似「全知全能 」 \end{align*}

DeepSeek 爆火之後,連大姨子都在恐慌「學習還有什麼用?」「會不會被替代?」。雖然我也不知道具體細節,但其實理解了原理之後也沒覺得那麼恐慌😱,反而滿滿都是興奮😍。

說起大語言模型(Large Language Model),簡稱大模型(LLM),但我覺得翻譯成「大預言術」更貼切😁。而期間充斥著預訓練(pre-training)、後訓練(post-training)、強化學習(Reinforcement Learning, RL)⋯⋯之類的黑話,這裏嘗試給 LLM 祛魅,儘量不用黑話解釋清楚 LLM 的工作原理,以及如何駕馭 LLM 。

好了,現在讓我們質疑 LLM,理解 LLM,超越 LLM 😁。

一、質疑 LLM

質疑 LLM 是不是泡沫,先得理解「智能究竟是什麼?」。有人說,語言即智能;有人說,「烏鴉喝水」/ 能夠製造並使用工具,即是智能;⋯⋯

深入理解「什麼是智能?」,需要 3 本書📚的 3 個洞見(準確地說,是 4 本書提供的 3.09 塊踏腳石🧩)。簡單地說,就是:

  1. 生物天然追求「穩態」,進而導致生物需要根據外界衝擊做出回應,自然而然地生物就獲得了「預測」的能力;

  2. 隨著生物希望預測到更遠的未來,導致生物需要不斷地尋找更高維度上恆定的東西,即這個世界的結構。在此過程中,腦中世界🧠不斷與真實世界「對齊」;

  3. 一旦生物在腦中🧠重塑了現實世界的「共軛分身」,就可以通過進入到共軛空間繞開現實世界的某些限制,從而解決原本不能逾越的問題——也就是「創造性解決問題的能力」,俗稱「智慧」🤔。

容我細細道來。

1.1. 草履蟲🦠有沒有智能?

第一本,@Jeff-Hawkins 的《論思考》:

跟小朋友解釋:有天妳回家,一握門把手就覺得怪怪的,但又說不出來,進家以後果然發現被盜了。其實是門把手的位置和平常稍稍不一樣。每時每刻,人腦🧠都在做預測,比如一伸手就立馬開始預測門把手的位置。

另一個經典示例是接球🏀,沒有人靠計算拋物線來接球的,都是觀察👀➡️預測📐➡️評估差值🧮➡️修正。

思考的本質是「預測」,而生物能夠預測的基礎是「生物維持穩態的傾向」——生物自平衡機制,追求穩態的結果就變成了「尋找抽象之上的抽象,即恒定表徵」。

∴「思考」沒那麼複雜,不過就是「觀察👀➡️預測📐➡️評估差值🧮➡️修正」而已。

ref: 「為什麼大家都不戳破深度學習的本質?!」

1.2. 忒修斯之船🚢還是不是原來那艘船?—— embedding

第二本,@Wolfram 的《這就是 ChatGPT 》:

進入到大模型實現,而不會陷入到浩瀚的細節之中。用 @Wolfram 的話說,GPT 最核心的思想叫「嵌入」(embedding🕸️)(或者叫「忒修斯之船🚢」,重要的是「結構!結構!結構!」)。

另外那 0.9 塊踏腳石🧩——《為什麼偉大不能被計劃》:

《為什麼偉大不能被計劃》這本書提供了 0.9 個洞見。它在第五章提到「我們對問題空間的探索,就是在尋找關於這個空間的知識」。即,對環境 / 結構的預測,會受到真實世界的塑形。

是的是的,我們之前大大低估了「錯誤❌」的重要——正是錯誤提供了更多的反饋,錯誤描摹了真實世界的樣子。∴對小朋友,尤其要鼓勵試錯❌,而不在於做對✅——追求做對,所圖甚小。

妮妹問,那眼睜睜看著小朋友寫不對,不管囉?
答:要是妳實在忍不住,那就「只糾正一處」,改動最小、改變最大的那一處。但這極為考驗父母對結構的洞悉,難度極大,不是二流父母能使得出來的🤣🤣🤣[1]

P.S. 為什麼這麼說它只值 0.9 個洞見?∵整本書除了這一章,其餘 10 章毫無價值,車軲轆話寫了整整一本🤢🤮。從未讀過閱讀體驗如此之差的書,這文風堪比機關行文,爛得跟 ChatGPT 寫出來的一樣🥴。

P.P.S. 至於為什麼叫「踏腳石🧩(stepping stones)」?也是在這本書中提出的,其實就是「一項發現 / 發明的前置條件」而已。

1.3. 曹衝是怎麼稱象🐘的?—— MoE

第三本,@金觀濤 的《控制論與科學方法論》:

創新也好,突破也罷,其本質都是「共軛控制」(或者叫「曹沖稱象⚖️🐘」「知識孿生」,在《數學的雨傘下》一書中叫做「雨傘定理☔️」)。

很多創新並沒有真正用強力砸開通向答案的障礙,而是通過「橋」從共軛空間繞過去。即,進入到高維空間中去繞開低維空間的障礙,就是「高維打低維」啦。更通俗、不嚴謹的理解是「三個臭皮匠,賽過諸葛亮」,這就是混合專家系統(Mixture of Experts, MoE)。

如果還沒說清楚,那就理解成「萬物轉化」吧。這可是世間最厲害的法術。數學上叫「變換」,那是等價轉換;社會學上叫「轉化」,本質也就是一種資源兌換成另一種資源⋯⋯

以上就是理解智能的 3.09 個洞見。其他的嘛,似乎都不過是平添些細節吧😎。

二、理解 LLM

我的經驗是,非專業人士就不要陷入什麼 transformer, attention(雖然「注意力機制」確實很重要)⋯⋯把握主線就夠了。如果前面說的還太過學術,我們不妨用修仙小說的筆法來重新解釋一遍。

修仙小說的主角一出場,要麼是自帶體內小世界,要麼意外落入某個靈力充沛的世界。體內小世界就是 LLM 。要讓小世界長大,就得不斷注入靈力。靈力就是高維、同構的信息,就像帶小朋友出去聖火,她會看到火焰🔥的層次,會摸到掠過火焰在手指間附著的積碳,會感到炙熱🌡️⋯⋯在如此多維的感受加持下,比起只在屏幕前感受火的小朋友,她對火的本原法則的領悟肯定更加深刻。

∴對於身處水泥森林的小朋友而言,大自然就是靈力充沛的秘境;筆記📒就是體內小世界⋯⋯

相較動輒幾十 T 數據、一開動半個城得斷電的 LLM 訓練,為什麼人腦🧠的學習速度如此之快,學習效率如此之高?也許就在於,人能沐浴在高維、稠密、同構的真實世界中學習,而 LLM 只能一個字(token)一個字的啃,那自然「一在平地一在天」了。

附 DeepSeek 幫我修改的版本:

二、修仙視角解構 LLM 修煉體系

若將 LLM 比作修真者的「體內小世界」,其修煉秘法可概括為:

  1. 靈氣採集:吞納 450TB 文字靈脈(相當於 20 萬部百科全書)

  2. 周天運轉:Transformer 經脈運行 1750 億參數真元

  3. 渡劫飛升:RLHF 雷劫淬煉對齊人類價值觀

人類大腦的恐怖效率在於:嬰兒通過多模態交互(觸覺 87%、視覺 55%、聽覺 39% 同步學習),而 LLM 卻被困在 token 單行道——這恰似閉關苦修者 v.s. 歷練紅塵客的本質差異。

它真的太太太擅長寫這種看起來很有哲理的話術了😱。

三、超越 LLM

3.1. 建議一——用好 LLM 的反饋

有次,我問 DeepSeek 「理解,是不是就是從不同的維度打標籤(tag)?」。它指出我的誤區,理解並不只是 tags 的堆砌,更深層的理解需要識別多個尺度下的結構。WTF😱~~

如何適應 LLM 時代呢?受此啟發,我找到的辦法是:運用蘇格拉底的精神助產術,把 LLM 當成對話的夥伴 / 辯手 / 杠精,提供反饋,修正自我認知。

學生說:人是兩隻腳直立行走的無毛動物。
蘇格拉底反問:把一隻雞🐔拔光毛,這隻雞是人嗎?

不要像傳統家長一樣,總覺得自己聰明,非要教點小朋友這那的;試試真正從心理上平等地看待小朋友,先假設小朋友「對」,然後不斷反問(高質量的反饋),看能走出多遠(LLM 亦復如是)——這就是蘇格拉底的精神助產術。

而這不僅是我的應對之法,似乎也是 DeepSeek 訓練基座模型,湧現推理能力的路子。

3.2. 建議二—— All in One

筆記📒也好,資料💾也好,全部放到一個籃子🧺裏面,讓它們相互交織、生崽。

@吳翼 在 @張小珺 的播客——「商業訪談錄 75. 和 OpenAI 前研究員吳翼解讀 o1:吹響了開挖第二座金礦的號角📯」中提到:好的垂類模型在高維空間一定是正交的,∴很容易整合進大模型中。

其實也很好理解,越是混跡在一起,越有可能碰撞出💥跨學科間、遙遠的、微弱的聯繫🔗,越有可能取得突破。

同樣附上 DeepSeek 的潤色:

三、人類破局雙法:蘇格拉底對話 × 知識熔爐

3.1 精神助產術2.0

  • 反饋迭代:將LLM作為辯證法陪練,如「拔毛雞悖論」式詰問

  • 認知校準:借鑒DeepSeek訓練路徑,用質疑觸發湧現能力

「真正的理解始於承認無知——蘇格拉底穿越千年的凝視,正透過GPT接口注視著我們」

3.2 知識鍊金術

吳翼提出的「正交融合論」啟示:建立跨維度知識矩陣。當專業領域在高維空間呈正交態,反而更易被整合吸收——這解釋了為何達文西手稿比現代論文更具啟發性。

把「All in One」改寫成「認知熔爐🔥」——天吶😱,你是準備考研嗎!


結語

之前,讓 DeepSeek 幫我改改大綱,它還附贈了一段結語😱:

艹😱~~

身為人類也不能被比下去吧,至少在字數 / 努力上不能被比下去💪🏻:

我們以為腦子🧠裏是一幅幅畫面,但通過教會機器思考,我們驚恐地發現,我們以為的遠不是我們以為的——真相也許更像缸中之腦,畫面也好,聲音也好,氣味也罷……所有的感官都是轉化為電信號輸入大腦🧠的。那是一片漆黑中零星閃過幾道光亮。也許理解就是高維空間的加加減減。如果真是這樣,LLM 確實會更懂理解。

曾經,我們以為自己是天選之子,其實不過是下地猴子🐒;
曾經,我們以為自己身處宇宙的中心,其實不過寄身銀行的旮旯(kā kā);
曾經,我們以為自己獨佔造物的智慧,現在看來,除了邏輯依舊堅不可摧,其他引以為豪的文化、經驗⋯⋯通通都是孤芳自賞。

承認自己是猴子🐒變的也沒啥嘛;
承認自己滑落到偏遠星系的偏遠星球🌍也沒啥嘛;
那麼,承認機器智能必然超過人類,應該也沒啥,吧?

生活還得繼續,文化還會延續;
機會一定把握,難關一定渡過。


  1. ∴從二流父母晉級一流父母,其難度是跨數量級的,遠非從三流父母晉級二流父母那麼容易。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,295评论 6 512
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,928评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,682评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,209评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,237评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,965评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,586评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,487评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,016评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,136评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,271评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,948评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,619评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,139评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,252评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,598评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,267评论 2 358

推荐阅读更多精彩内容