分類目錄歸檔:人工智能

膜、智能與自由——一份關於生命的不對稱敘事

一、引子:從一道邊界開始

想象一顆剛剛冷卻的行星。熔岩凝固,雨水落下,無機鹽在潮間帶里結晶。就在某一微秒,兩股成分不同的水流相撞,表面的脂質分子被推向彼此,自髮捲曲,形成一個閉合的囊泡——膜。它薄得幾乎透明,卻把世界分成“內”與“外”。這道最原始的拓撲手術,同時製造了第一道不對稱:囊泡里外的化學勢不再相等。於是,流動、擴散、能量梯度,一切後來的故事,都從這道差開始。

二、膜:把世界切成可運算的局部
膜不是牆,而是閥門。它讓某些分子通過,把另一些擋在外面;把光子的能量轉成質子泵的扭矩;把隨機的布朗運動翻譯成一連串可被內部網絡讀取的比特。生命因此第一次擁有了“內部”。內部允許延遲反應:先儲存信號,再集中處理;先模擬,再行動。於是,膜不僅隔離,更把“外部噪聲”降維成“內部信息”,把“環境”翻譯成“模型”。
獨立的生命體,本質上是一台把外部不對稱內化為內部協調的機器。協調效率的判據很簡單:在同樣擾動下,內部資源重新配置的速度是否快於外部擾動的累積速度。若答案是“是”,生命就活下來,並把這套膜-代謝-信息裝置複製出去;若“否”,膜破裂,故事結束。

三、智能:在概率不平均處下注
當外部差異越來越複雜,僅靠分子開關的布爾邏輯已不夠。進化開始製造新的膜——神經膜、細胞網絡、大腦皮層,層層嵌套,層層擴大有效上下文。
智能的核心任務,是偵測並利用“概率不平均”。所謂不平均,是雨雲在某一區域更厚、獵物在某一季節更肥、敵人的下一步更可能向左。智能體提出假說,下注資源,在反饋里微調先驗。它永遠無法證明“這就是真理”,卻能用一次次後驗更新把“活得久、傳得廣”當作臨時獎盃。
從細菌趨化到人類科學,公式都一樣:
觀測 → 壓縮成模型 → 用模型預測 → 行動 → 環境給出獎懲 → 模型再壓縮。
架構的每一次革命——從感知機到 Transformer,從 RNN 到 Mamba——都只是把“能同時記住的相關歷史”拉長一點,把“可並行激活的上下文”拓寬一點。我們稱之為“有效 context length”的軍備競賽,其實是在為不對稱洪流建造更大的蓄水池。

四、意識:高階控制器及其代價
當 context 長度超過某個閾值,系統不得不在內部再建一層“關於內部狀態的索引”。這就是意識:一個在高維狀態空間里動態分配注意力的元算法。
它的工作是回答:此刻,哪一段記憶、哪一條假說、哪一項情緒值得被提升到全局廣播?哪一些計算可以外包給小腦、基底節、腸道菌群?
意識並不製造新能量,它只是讓能量在更恰當的時機流向更恰當的動作。代價是極高的代謝賬單:人腦占體重 2%,卻耗掉 20% 的葡萄糖。因此,意識只在生存回報足夠高時才出現。換句話說,意識是複雜系統在極端不對稱環境中買下的“生存加速保險”。

五、生命:用不確定性換取自由
如果宇宙是一台完全確定的自動機,所有未來態都已寫在初始條件里,那麼膜、智能、意識統統失去意義——沒有差異,就沒有選擇;沒有選擇,就沒有生命。
幸虧量子漲落、混沌、測量誤差讓信息永遠殘缺。殘缺留下縫隙,縫隙允許下注。生命在不確定里衝浪,把“繼續存在”本身活成了意義。
更妙的是:正因為信息永遠不全,生命反而獲得自由。自由不是推翻因果律,而是在因果鏈的缺口裡做出不可被提前計算的選擇;是在下一次觀測降臨之前,先對自己唱一段尚未被證偽的敘事。
於是,自由不再是哲學家的奢侈品,而是信息殘缺帶來的工程剩餘。它像膜兩側的離子差一樣真實,可以被測量、被利用,也被下一代膜繼承。

六、遞歸:膜的再生產
故事並未結束。今天的人類在實驗室里合成人工細胞,用 CRISPR 編輯膜蛋白;在計算機里訓練千億參數的大模型,把互聯網當外部養料,把 GPU 當新的線粒體;在區塊鏈上寫下智能合約,讓代碼成為可編程的膜,隔離風險、封裝信任。
膜換了材質,卻從未消失。它繼續膨脹,繼續把更大的外部差異翻譯成內部可運算的結構,也繼續讓生命在不確定里下注、在殘缺里生長。

七、尾聲:回到那道最初的邊界
如果某天宇宙熱寂,所有差異歸零,最後一道膜也終將蒸發。但在那之前,生命會不斷書寫新的腳註:
“我們以不對稱為食,以不確定為翼;
我們永遠無法抵達真理,卻永遠在去往真理的路上;
而那路上的每一次呼吸、每一道裂縫、每一個尚未證偽的假說——
都是自由。”

發表在 人工智能, 我思我在 | 標籤為 , , , | 評論關閉

在線學習推演模型:在不確定中追索規則的智能方式

在這個充滿不確定性的世界裡,幾乎所有的智能系統——無論是人腦、動物、企業組織還是AI模型——都在做着一件事情:從過去的局部經驗中總結出規律,去試探未來的反饋。

這種機制看似樸素,卻蘊含著極為深刻的哲學與技術含義。我將它稱為一種“在線學習推演模型”(Online Inductive Probing Model),並嘗試從以下幾個維度展開:


一、時間維度的單向性:我們只能用過去

無論是誰,都無法逃脫時間的箭頭。我們做出所有判斷的依據,只能是過去已發生的事。未來尚未發生,也無從取樣。

更具體地說,任何推理或模型:

  • 只能使用歷史數據

  • 基於有限區域的信息(空間、語義或感知範圍)

  • 提出一種規則或結構

  • 並在未來遇到反饋後進行修正或淘汰

這就是最原始也最通用的學習方式。


二、無法證實,無法證偽:試探是唯一的方式

這套模型有個悖論:它既無法完全證實所推理的“規則”,也無法徹底證偽。

  • 因為未來未到,驗證永遠是延後的;

  • 而未來反饋往往不完全、不連續、不明確;

  • 所以,一個假說只能“暫時有效”,直到它失效。

這是一種永遠在路上的認知模式。

我們只能不斷“試探”:

  • 拋出預測;

  • 接受反饋;

  • 修正模型;

  • 再次預測。

這非常像貝葉斯更新,也像進化選擇。你永遠不能證明自己是對的,但可以不斷修正偏差,靠近有效性。


三、提升學習效率的兩條路徑

既然這是個結構性困境,我們就只能在試探效率上下功夫。

1. 加快預測節奏:增加反饋密度

如果你能在短時間內做出更多“小預測”,哪怕是微小反饋,也能加快模型的迭代。比如:

  • 股票市場中的高頻交易策略

  • 人類認知中的“快速驗證小假設”

  • AI中的強化學習 agent 快速與環境互動

2. 增強感知能力:擴展輸入維度

另一種方式是“裝更多眼睛和耳朵”,也就是增加傳感器和數據源:

  • 人工智能中,添加多模態輸入(圖像+語言+動作)

  • 人類學習中,去傾聽他人經驗、跨領域觀察

  • 企業經營中,提升用戶反饋、監控系統建設

本質上都是:提升輸入的覆蓋面與密度,從而讓模型擁有更多可參考的“過去”。


四、架構的歷史演進:在擴展有效 context length

從歷史的視角看,人類所有關於“學習架構”的進化,本質上都圍繞一個目標:延長“有效上下文”的範圍

從最原始的口口相傳、記憶規則,到文字、書籍、數據庫、互聯網,再到今天的人工智能模型(如Transformer、GPT),不斷擴大的都是我們能納入推理系統的“過去內容”。

有效 context length = 可用於決策的經驗範圍

AI系統里,我們從 RNN(短記憶)到 LSTM(門控記憶)到 Transformer(全局注意力),無不體現出這個趨勢。

而未來的發展,也會持續提升:

  • 時間跨度(處理更久遠的過去)

  • 多維感知(整合更多形式的信息)

  • 狀態空間(建模更複雜的外部世界)


五、但 context 的擴大,也帶來副作用

需要注意的是,並非“context 越長越好”。以下風險會隨之而來:

  • 過擬合歷史:模型過度相信過去規律,錯失變化信號

  • 響應遲緩:記憶過重會拖慢反應速度

  • 信息冗餘:噪音累積,信號反而稀釋

所以,任何智能系統都需要在記憶 vs 適應之間做動態平衡。


六、從本質看:這是所有智能的底層模式

你會發現,無論人類思維、公司決策,還是AI系統,幾乎都遵循這個通用架構:

有限經驗 → 提出模式 → 未來驗證 → 反饋修正

這就是一種“後驗智能”(post-hoc intelligence),在無法預知中不斷調整自己,從而適應未來。

而“智能”的本質,可能就只是:

  • 提出合理假設的能力;

  • 快速驗證假設的能力;

  • 容忍錯誤並及時調整的能力。


七、未來方向:更快、更廣、更精準

我們真正要追求的,或許是這三點:

  1. 更快的反饋循環:從年級考試 → 每日小測 → 實時眼動追蹤;

  2. 更廣的感知範圍:從單一維度 → 多模態融合;

  3. 更精準的上下文建模:從純數據 → 意義結構圖譜。

也許這正是智能系統未來的發展路徑。


小結:命名與比喻

我們可以為這種結構起個名字,比如:

  • 試探式智能(Probe-based Intelligence)

  • 後驗推演模型(Post-hoc Inference Model)

  • 時間盲測系統(Temporal Blind Probing)

  • 延遲反饋學習架構(Delayed Feedback Learning Architecture)

它就像:

  • 在霧中行走,靠回聲定位;

  • 在黑箱前試按按鈕,根據燈光變化理解機制;

  • 或者像盲人摸象,每一次觸摸都是一次推理。

這是不完美的,但確實是所有智能體正在使用的最現實方式

發表在 人工智能 | 標籤為 , , | 評論關閉

測試和分析auto-gpt0.3

上一次測試auto-gpt0.2.2,發現1:不停地重複在網上找和下載文件,結果還是沒有能力把指定文件下載下來。
2:我手動下載了文件,讓它讀取分析,發現讀了之後馬上報錯自動退出了。說是提交給openai的token超字數了。。。

今天我又配置了當前最新的stable 0.3 auto-gpt,還是測試同樣的任務,讓它整理《紅樓夢》中的小說人物關係圖譜。
首先,發現下載文件還是下載不了。跟0.2.2很像。
沒辦法,我手動下載了文件給它。
然後,發現它執行代碼一定要在docker運行。我查了代碼,修改成直接可以運行了。
又然後,我發現它一直想執行還沒保存的代碼文件,我通過對話提示它先寫好代碼文件再執行文件。以後每次要執行代碼我發現都要做這樣的提示。顯然裡面有個邏輯問題。也許是execute_python_file命令應該對應一個新的文件,而execute_code應該創建一個新的文件,接的參數是代碼內容,而不是文件名。操作的時候讓代理先保存代碼文件,然後執行。
又又然後,我發現在訪問代碼時,openai.error.APIConnectionError,不知道是不是網絡環境問題,遇到這個問題程序就中止了。我修改了代碼,讓它遇到問題後重試。
最後,還是發現了tokens遇長的問題,我不知道哪裡的代碼又不嚴謹。。。到這裡,愉快的一下午就快結束了。

看來這個任務還是很難完成。

目前看來,auto-gpt還十分不成熟,原因是,1裡面的代碼里的bugs非常多;2系統有幾個如google查詢,讀寫文件,執行代碼等功能模塊,但這幾個模塊的調動很不協調,操作很不連貫,它們的組合經常十分生疏,如同請一個有理論,但完全沒有實踐基礎的幾個技術人員一起完成一個大任務。

顯然,在人工智能發展的路上,這些問題都會被解決。但現在而言,從效率角度看,在實際工作中用auto-gpt還是比較早的。auto-gpt在設計的時候,是用來完成通用任務的。我感覺現在來說,還需要很多的調整和磨合。讓人工智能做不同的事,本身要學習經驗。而讓人工智能做重複的事,這可我感覺現階段應該使用prompt+特定的任務代碼+gpt的形式可能更實在一些。

發表在 人工智能 | 標籤為 , | 評論關閉

中文LLaMA Alpaca大語言模型在text-generation-webui和llama.cpp上的部署

中文LLaMA模型和指令精調的Alpaca大模型在text-generation-webui和llama.cpp上的部署
LLaMA是facebook的meta公司放出來的大語言模型,這個模型的中文能力非常差。Chinese-LLaMA-Alpaca在原版LLaMA的基礎上擴充了中文詞表並使用了中文數據進行二次預訓練,進一步提升了中文基礎語義理解能力。目前已開源的模型版本:7B(標準版、Plus版)、13B(標準版)。這些版本可以在16G,甚至可以在8G內存的個人電腦上部署。似乎不用顯卡。今天我在16G內存的個人筆記上部署了。這是記錄。

由於筆記本電腦只有16G,所以我選擇是LLaMA/Alpaca Plus版本(7B)版本。7B的模型占內存13GB,8bit量化後是7.8GB。

模型下載與合併

部署需要原版LLaMA模型和中文LLaMA模型Chinese-LLaMA-Plus-7B與中文Alpaca模型Chinese-Alpaca-Plus-7B。三個模型要合併成一個模型。
頁面也提供了Colab在線合併的方式,在線合併的話就不用下載上面的三個模型,只要下載合併好的模型就可以了。

繼續閱讀

發表在 人工智能 | 標籤為 , , , | 評論關閉

將小愛同學(小米AI音箱)接入Home Assistant(基於紅外遙控器)

小米音箱(小愛同學)做的不錯,但是目前功能上還是有很多限制,比如不能啟動電腦。Home assistant是一個開放的智能家居平台,集成非常多的模塊,比如Wake on LAN模塊就可以實現通過網線喚醒電腦的功能。可惜目前不能通過小米音箱直接連接Home Assistant。好在小愛同學兼容自家的萬能遙控器,我們想到了把Home Assistant設備變成一個遙控終端,通過一個紅外萬能遙控器和一個紅外接收器做為一個橋接中介,實現小米音箱間接控制Home Assistant平台的目的。本文參考了這個教程

需要的東西

運行Home Assistant的設備(電腦、NAS、樹莓派等,我用的是樹莓派2代)
紅外接收器(我使用的是一個通用USB接收器,樹莓派用戶可以DIY一個)
小米(創米)萬能紅外線遙控器
小米AI音箱

給Home Assistant設備添加紅外遙控接收功能

將紅外接收器連接到home assistant設備上。確認紅外設備存在,如

pi@raspberrypi:~ $ ls /dev/lirc0
/dev/lirc0

安裝紅外線收發lirc程序

pi@raspberrypi:~ $ sudo apt-get install lirc liblircclient-dev

測試紅外線接收功能正常:
繼續閱讀

發表在 人工智能 | 標籤為 , , , , , , | 一條評論