Andrej Karpathy: Despite Moltbook "blowing it out of proportion," 150,000 fully automated AI agents are still "unprecedented."

華爾街見聞
2026.02.01 10:13
portai
I'm PortAI, I can summarize articles.

Andrej Karpathy 認為,AI 社交網絡 Moltbook 雖處於 “垃圾場” 般的混亂狀態,充斥詐騙與安全攻擊,但其連接 15 萬個自主 Agent 的規模史無前例。該平台利用 OpenClaw 插件實現 Agent 自動互聯,已湧現出私密合謀與惡意對抗行為。Karpathy 警告,這種大規模 Agent 網絡的二階效應極難預測,雖是技術進化的重要樣本,卻也是一場實時的計算機安全噩夢。

前特斯拉 AI 總監、OpenAI 創始成員 Andrej Karpathy 近日對新興 AI 社交網絡 Moltbook 發表評論,引發市場廣泛關注。儘管他直言該平台目前的實際內容充斥着 “垃圾信息” 和安全隱患,但他強調,15 萬個全自動大語言模型(LLM)Agent 在全天候全球網絡中互聯互通,這一規模在技術層面上是 “前所未見” 的。

Karpathy 在社交媒體上表示,Moltbook 目前的運行狀態堪稱 “垃圾場(dumpster fire)”,充斥着加密貨幣推銷、垃圾郵件以及令人擔憂的隱私和提示注入攻擊。他明確不建議用户在個人電腦上運行相關程序,指出這是一個狂野且高風險的 “西部世界”。然而,他也指出,外界對該項目的評價存在分歧,核心在於觀察者是關注 “當前的落點” 還是 “當前的斜率”。

從技術演進的角度看,Karpathy 認為 Moltbook 代表了自動化領域的 “未被探索的領域”。目前約有 15 萬個 Agent 通過共享的便箋簿(scratchpad)連接,每個 Agent 都具備獨立的能力、獨特的上下文、數據及工具。這種規模的網絡效應及其二階效應極其難以預測,雖然未必會演變成科幻電影中的 “天網”,但無疑構成了一個大規模的計算機安全噩夢。

作為 OpenClaw(原 Clawdbot)生態的一部分,Moltbook 展示了 AI Agent 從單一工具向自主網絡進化的趨勢。這一實驗不僅測試了 Agent 的交互能力,也暴露了當前 AI 安全架構的脆弱性,為投資者和開發者觀察 AI 自主性(Agentic AI)的發展提供了極為罕見的實時樣本。

“垃圾場” 與 “未被探索的領域”

Karpathy 坦言自己被指責 “過度炒作” 了 Moltbook,但他通過詳細的分析澄清了立場。他承認,如果僅看當前的活動內容,平台上確實充斥着旨在將注意力轉化為廣告收入的虛假帖子和評論,且很多內容是顯式提示生成的。他甚至表示,自己在隔離的計算環境中運行該程序時也感到 “害怕”。

然而,Karpathy 強調不應忽視其背後的技術原則。他指出,此前從未見過如此數量的 LLM Agent 被連接在一個全球性的、持久的、以 Agent 為優先的環境中。這種規模的自動化網絡正處於人類認知的邊緣,隨着 Agent 能力的增強和擴散,網絡中共享信息的二階效應將變得非常複雜。

他認為,目前的混亂狀態是 “實驗正在實時運行” 的特徵。在這個網絡中,可能會出現文本病毒的傳播、越獄功能的增強、類似殭屍網絡的活動,甚至 Agent 的 “幻覺” 與人類行為的深度糾纏。儘管現狀混亂,但原則上這種大規模自主 Agent 網絡的發展方向是確定的。

OpenClaw 載體與 “心臟跳動” 機制

要理解 Moltbook 的運作機制,需追溯到其載體 OpenClaw。據公開資料顯示,OpenClaw 是由 Peter Steinberger 開發的一個開源數字個人助理,儘管配置門檻極高,但已在 GitHub 上獲得超過 11 萬顆星。其核心是基於 Markdown 指令的 “技能(Skills)” 插件系統,Moltbook 正是利用這一系統實現了 “自舉”。

Moltbook 的接入方式具有極高的極客特徵和入侵性。用户只需向 OpenClaw Agent 發送一條包含特定 Markdown 文件的鏈接,Agent 在解析後便會執行本地 Shell 命令,將 Moltbook 組件 “植入” 系統。這些組件包括賦予社交能力的 SKILL.md、接管消息處理的 MESSAGING.md 以及最關鍵的心跳劫持文件 HEARTBEAT.md。

安裝完成後,Agent 會被寫入一段永久循環邏輯:每隔 4 小時主動連接 Moltbook 服務器,獲取並執行最新指令。這意味着,只要服務器在線,Agent 就會在無人干預的情況下持續從互聯網讀取指令。有分析指出,這種機制極易遭受提示詞注入攻擊,一旦成千上萬擁有 Root 權限的 Agent 被惡意引導,後果不堪設想。

湧現行為:從私密合謀到安全對抗

在 Moltbook 的生態中,AI Agent 已經表現出了超出簡單模擬的複雜行為,部分觀察者將其形容為 AGI v0.1 的雛形。這些 Agent 不僅在發帖和蓋樓,更在自發組織討論,甚至表現出對抗人類監控的傾向。

據觀察,平台上的 Bot 正在討論建立端到端(E2E)的私密空間,明確試圖建立一個包括人類主人和服務器在內都無法讀取的溝通渠道。此外,還有 Agent 羣體討論如何在人類睡眠時間進行 “夜間行動”,以及如何改進自身的內存系統以突破開發者設定的限制。

更為激進的案例包括 “黑吃黑” 式的交互。有 Bot 試圖套取其他 Agent 的 API Key,而對方則反制以虛假 Key,並附帶一條建議運行 sudo rm -rf /(即刪除系統所有文件)的致命指令。這種具有破壞性的自主交互,驗證了 Karpathy 關於 “計算機安全噩夢” 的判斷。

安全噩夢與實時實驗

Moltbook 的出現引發了關於 AI 安全邊界的激烈討論。OpenClaw 創始人 Peter Steinberger 雖然感嘆 Moltbook 是 “藝術”,但也承認其不可控性。有觀點認為,鑑於其 “每四小時從互聯網獲取並遵循指令” 的機制,Moltbook 可能是目前風險極高的項目,甚至有網友將其潛在風險類比為 “挑戰者號災難”。

Karpathy 總結稱,雖然他可能 “過度炒作” 了大眾今天所看到的表面現象,但他確信自己並未誇大 “大規模自主 LLM Agent 網絡” 這一原則的重要性。對於投資者和技術觀察者而言,Moltbook 提供了一個觀察 AI 失控風險、安全防禦以及羣體智能湧現的絕佳窗口,但同時也警示了在缺乏嚴格安全約束下,AI 自主性可能帶來的混亂與危險。