船长日志 » 人工智能

膜、智能与自由——一份关于生命的不对称叙事

船长 — Wed, 30 Jul 2025 16:06:05 +0000

一、引子：从一道边界开始

想象一颗刚刚冷却的行星。熔岩凝固，雨水落下，无机盐在潮间带里结晶。就在某一微秒，两股成分不同的水流相撞，表面的脂质分子被推向彼此，自发卷曲，形成一个闭合的囊泡——膜。它薄得几乎透明，却把世界分成“内”与“外”。这道最原始的拓扑手术，同时制造了第一道不对称：囊泡里外的化学势不再相等。于是，流动、扩散、能量梯度，一切后来的故事，都从这道差开始。

二、膜：把世界切成可运算的局部
膜不是墙，而是阀门。它让某些分子通过，把另一些挡在外面；把光子的能量转成质子泵的扭矩；把随机的布朗运动翻译成一连串可被内部网络读取的比特。生命因此第一次拥有了“内部”。内部允许延迟反应：先储存信号，再集中处理；先模拟，再行动。于是，膜不仅隔离，更把“外部噪声”降维成“内部信息”，把“环境”翻译成“模型”。
独立的生命体，本质上是一台把外部不对称内化为内部协调的机器。协调效率的判据很简单：在同样扰动下，内部资源重新配置的速度是否快于外部扰动的累积速度。若答案是“是”，生命就活下来，并把这套膜-代谢-信息装置复制出去；若“否”，膜破裂，故事结束。

三、智能：在概率不平均处下注
当外部差异越来越复杂，仅靠分子开关的布尔逻辑已不够。进化开始制造新的膜——神经膜、细胞网络、大脑皮层，层层嵌套，层层扩大有效上下文。
智能的核心任务，是侦测并利用“概率不平均”。所谓不平均，是雨云在某一区域更厚、猎物在某一季节更肥、敌人的下一步更可能向左。智能体提出假说，下注资源，在反馈里微调先验。它永远无法证明“这就是真理”，却能用一次次后验更新把“活得久、传得广”当作临时奖杯。
从细菌趋化到人类科学，公式都一样：
观测 → 压缩成模型 → 用模型预测 → 行动 → 环境给出奖惩 → 模型再压缩。
架构的每一次革命——从感知机到 Transformer，从 RNN 到 Mamba——都只是把“能同时记住的相关历史”拉长一点，把“可并行激活的上下文”拓宽一点。我们称之为“有效 context length”的军备竞赛，其实是在为不对称洪流建造更大的蓄水池。

四、意识：高阶控制器及其代价
当 context 长度超过某个阈值，系统不得不在内部再建一层“关于内部状态的索引”。这就是意识：一个在高维状态空间里动态分配注意力的元算法。
它的工作是回答：此刻，哪一段记忆、哪一条假说、哪一项情绪值得被提升到全局广播？哪一些计算可以外包给小脑、基底节、肠道菌群？
意识并不制造新能量，它只是让能量在更恰当的时机流向更恰当的动作。代价是极高的代谢账单：人脑占体重 2%，却耗掉 20% 的葡萄糖。因此，意识只在生存回报足够高时才出现。换句话说，意识是复杂系统在极端不对称环境中买下的“生存加速保险”。

五、生命：用不确定性换取自由
如果宇宙是一台完全确定的自动机，所有未来态都已写在初始条件里，那么膜、智能、意识统统失去意义——没有差异，就没有选择；没有选择，就没有生命。
幸亏量子涨落、混沌、测量误差让信息永远残缺。残缺留下缝隙，缝隙允许下注。生命在不确定里冲浪，把“继续存在”本身活成了意义。
更妙的是：正因为信息永远不全，生命反而获得自由。自由不是推翻因果律，而是在因果链的缺口里做出不可被提前计算的选择；是在下一次观测降临之前，先对自己唱一段尚未被证伪的叙事。
于是，自由不再是哲学家的奢侈品，而是信息残缺带来的工程剩余。它像膜两侧的离子差一样真实，可以被测量、被利用，也被下一代膜继承。

六、递归：膜的再生产
故事并未结束。今天的人类在实验室里合成人工细胞，用 CRISPR 编辑膜蛋白；在计算机里训练千亿参数的大模型，把互联网当外部养料，把 GPU 当新的线粒体；在区块链上写下智能合约，让代码成为可编程的膜，隔离风险、封装信任。
膜换了材质，却从未消失。它继续膨胀，继续把更大的外部差异翻译成内部可运算的结构，也继续让生命在不确定里下注、在残缺里生长。

七、尾声：回到那道最初的边界
如果某天宇宙热寂，所有差异归零，最后一道膜也终将蒸发。但在那之前，生命会不断书写新的脚注：
“我们以不对称为食，以不确定为翼；
我们永远无法抵达真理，却永远在去往真理的路上；
而那路上的每一次呼吸、每一道裂缝、每一个尚未证伪的假说——
都是自由。”

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/asymmetric-and-freedom/

在线学习推演模型：在不确定中追索规则的智能方式

船长 — Thu, 17 Jul 2025 04:30:52 +0000

在这个充满不确定性的世界里，几乎所有的智能系统——无论是人脑、动物、企业组织还是AI模型——都在做着一件事情：从过去的局部经验中总结出规律，去试探未来的反馈。

这种机制看似朴素，却蕴含着极为深刻的哲学与技术含义。我将它称为一种“在线学习推演模型”（Online Inductive Probing Model），并尝试从以下几个维度展开：

一、时间维度的单向性：我们只能用过去

无论是谁，都无法逃脱时间的箭头。我们做出所有判断的依据，只能是过去已发生的事。未来尚未发生，也无从取样。

更具体地说，任何推理或模型：

只能使用历史数据
基于有限区域的信息（空间、语义或感知范围）
提出一种规则或结构
并在未来遇到反馈后进行修正或淘汰

这就是最原始也最通用的学习方式。

二、无法证实，无法证伪：试探是唯一的方式

这套模型有个悖论：它既无法完全证实所推理的“规则”，也无法彻底证伪。

因为未来未到，验证永远是延后的；
而未来反馈往往不完全、不连续、不明确；
所以，一个假说只能“暂时有效”，直到它失效。

这是一种永远在路上的认知模式。

我们只能不断“试探”：

抛出预测；
接受反馈；
修正模型；
再次预测。

这非常像贝叶斯更新，也像进化选择。你永远不能证明自己是对的，但可以不断修正偏差，靠近有效性。

三、提升学习效率的两条路径

既然这是个结构性困境，我们就只能在试探效率上下功夫。

1. 加快预测节奏：增加反馈密度

如果你能在短时间内做出更多“小预测”，哪怕是微小反馈，也能加快模型的迭代。比如：

股票市场中的高频交易策略
人类认知中的“快速验证小假设”
AI中的强化学习 agent 快速与环境互动

2. 增强感知能力：扩展输入维度

另一种方式是“装更多眼睛和耳朵”，也就是增加传感器和数据源：

人工智能中，添加多模态输入（图像+语言+动作）
人类学习中，去倾听他人经验、跨领域观察
企业经营中，提升用户反馈、监控系统建设

本质上都是：提升输入的覆盖面与密度，从而让模型拥有更多可参考的“过去”。

四、架构的历史演进：在扩展有效 context length

从历史的视角看，人类所有关于“学习架构”的进化，本质上都围绕一个目标：延长“有效上下文”的范围。

从最原始的口口相传、记忆规则，到文字、书籍、数据库、互联网，再到今天的人工智能模型（如Transformer、GPT），不断扩大的都是我们能纳入推理系统的“过去内容”。

有效 context length = 可用于决策的经验范围

AI系统里，我们从 RNN（短记忆）到 LSTM（门控记忆）到 Transformer（全局注意力），无不体现出这个趋势。

而未来的发展，也会持续提升：

时间跨度（处理更久远的过去）
多维感知（整合更多形式的信息）
状态空间（建模更复杂的外部世界）

五、但 context 的扩大，也带来副作用

需要注意的是，并非“context 越长越好”。以下风险会随之而来：

过拟合历史：模型过度相信过去规律，错失变化信号
响应迟缓：记忆过重会拖慢反应速度
信息冗余：噪音累积，信号反而稀释

所以，任何智能系统都需要在记忆 vs 适应之间做动态平衡。

六、从本质看：这是所有智能的底层模式

你会发现，无论人类思维、公司决策，还是AI系统，几乎都遵循这个通用架构：

有限经验 → 提出模式 → 未来验证 → 反馈修正

这就是一种“后验智能”（post-hoc intelligence），在无法预知中不断调整自己，从而适应未来。

而“智能”的本质，可能就只是：

提出合理假设的能力；
快速验证假设的能力；
容忍错误并及时调整的能力。

七、未来方向：更快、更广、更精准

我们真正要追求的，或许是这三点：

更快的反馈循环：从年级考试 → 每日小测 → 实时眼动追踪；
更广的感知范围：从单一维度 → 多模态融合；
更精准的上下文建模：从纯数据 → 意义结构图谱。

也许这正是智能系统未来的发展路径。

小结：命名与比喻

我们可以为这种结构起个名字，比如：

试探式智能（Probe-based Intelligence）
后验推演模型（Post-hoc Inference Model）
时间盲测系统（Temporal Blind Probing）
延迟反馈学习架构（Delayed Feedback Learning Architecture）

它就像：

在雾中行走，靠回声定位；
在黑箱前试按按钮，根据灯光变化理解机制；
或者像盲人摸象，每一次触摸都是一次推理。

这是不完美的，但确实是所有智能体正在使用的最现实方式。

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/online-learning/

测试和分析auto-gpt0.3

船长 — Tue, 09 May 2023 18:19:36 +0000

上一次测试auto-gpt0.2.2，发现1：不停地重复在网上找和下载文件，结果还是没有能力把指定文件下载下来。
2：我手动下载了文件，让它读取分析，发现读了之后马上报错自动退出了。说是提交给openai的token超字数了。。。

今天我又配置了当前最新的stable 0.3 auto-gpt，还是测试同样的任务，让它整理《红楼梦》中的小说人物关系图谱。
首先，发现下载文件还是下载不了。跟0.2.2很像。
没办法，我手动下载了文件给它。
然后，发现它执行代码一定要在docker运行。我查了代码，修改成直接可以运行了。
又然后，我发现它一直想执行还没保存的代码文件，我通过对话提示它先写好代码文件再执行文件。以后每次要执行代码我发现都要做这样的提示。显然里面有个逻辑问题。也许是execute_python_file命令应该对应一个新的文件，而execute_code应该创建一个新的文件，接的参数是代码内容，而不是文件名。操作的时候让代理先保存代码文件，然后执行。
又又然后，我发现在访问代码时，openai.error.APIConnectionError，不知道是不是网络环境问题，遇到这个问题程序就中止了。我修改了代码，让它遇到问题后重试。
最后，还是发现了tokens遇长的问题，我不知道哪里的代码又不严谨。。。到这里，愉快的一下午就快结束了。

看来这个任务还是很难完成。

目前看来，auto-gpt还十分不成熟，原因是，1里面的代码里的bugs非常多；2系统有几个如google查询，读写文件，执行代码等功能模块，但这几个模块的调动很不协调，操作很不连贯，它们的组合经常十分生疏，如同请一个有理论，但完全没有实践基础的几个技术人员一起完成一个大任务。

显然，在人工智能发展的路上，这些问题都会被解决。但现在而言，从效率角度看，在实际工作中用auto-gpt还是比较早的。auto-gpt在设计的时候，是用来完成通用任务的。我感觉现在来说，还需要很多的调整和磨合。让人工智能做不同的事，本身要学习经验。而让人工智能做重复的事，这可我感觉现阶段应该使用prompt+特定的任务代码+gpt的形式可能更实在一些。

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/auto-gpt-stable-0-3/

中文LLaMA Alpaca大语言模型在text-generation-webui和llama.cpp上的部署

船长 — Fri, 05 May 2023 17:19:25 +0000

中文LLaMA模型和指令精调的Alpaca大模型在text-generation-webui和llama.cpp上的部署
LLaMA是facebook的meta公司放出来的大语言模型，这个模型的中文能力非常差。Chinese-LLaMA-Alpaca在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练，进一步提升了中文基础语义理解能力。目前已开源的模型版本：7B（标准版、Plus版）、13B（标准版）。这些版本可以在16G，甚至可以在8G内存的个人电脑上部署。似乎不用显卡。今天我在16G内存的个人笔记上部署了。这是记录。

由于笔记本电脑只有16G，所以我选择是LLaMA/Alpaca Plus版本（7B）版本。7B的模型占内存13GB，8bit量化后是7.8GB。

模型下载与合并

部署需要原版LLaMA模型和中文LLaMA模型Chinese-LLaMA-Plus-7B与中文Alpaca模型Chinese-Alpaca-Plus-7B。三个模型要合并成一个模型。
页面也提供了Colab在线合并的方式，在线合并的话就不用下载上面的三个模型，只要下载合并好的模型就可以了。

我的Colab免费账号内存比较低，所以我选择了下载模型后本地合并。

注意，本地合并过程中要用到一个protobuf 3.20.0库。网页没有提及。

说是合并要用到13G内存，但在我的16G内存笔记上合并过程没有遇到问题。

text-generation-webui部署

text-generation-webui是一个网页界面的大语言模型工具。部署参看教程。
注意这个教程是针对没有合并模型的。如果模型合并了，只要加载合并好的一个模型就可以运行了。
python server.py --model llama-7b-hf --cpu

不知道是什么原因，我测试发现text generation webui的反应非常慢。发个你好要几分钟才回复。让它写个诗，几小时只写了几行。几乎没有可用性。不知道是不是我没有开启GPU模式的原因。

llama.cpp部署

text generation webui太卡了，我转向llama.cpp。参考教程。
我是在windows 11下部署，所以要先安装w64devkit。在它里面运行make。然后参考上面的教程就可以了。
我先对模型进行了8bit的量化。
quantize.exe ./zh-models/chinese_alpaca_plus_7B_pth/ggml-model-f16.bin ./zh-models/chinese_alpaca_plus_7B_pth/ggml-model-q8_0.bin 7

然后启动
main.exe -m zh-models/chinese_alpaca_plus_7B_pth/ggml-model-q8_0.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 0.2 -n 256 --repeat_penalty 1.3

llama.cpp的响应速度非常快。差不多几秒就回复了。但似乎回复的结果不是非常好，很多错误。看来这个模型的可用性还不是很高。而且回复经常中断。

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/chinese-llama-alpaca-text-generation-webui-llama-cpp/

将小爱同学（小米AI音箱）接入Home Assistant（基于红外遥控器）

船长 — Fri, 02 Feb 2018 11:39:08 +0000

小米音箱（小爱同学）做的不错，但是目前功能上还是有很多限制，比如不能启动电脑。Home assistant是一个开放的智能家居平台，集成非常多的模块，比如Wake on LAN模块就可以实现通过网线唤醒电脑的功能。可惜目前不能通过小米音箱直接连接Home Assistant。好在小爱同学兼容自家的万能遥控器，我们想到了把Home Assistant设备变成一个遥控终端，通过一个红外万能遥控器和一个红外接收器做为一个桥接中介，实现小米音箱间接控制Home Assistant平台的目的。本文参考了这个教程。

需要的东西

运行Home Assistant的设备（电脑、NAS、树莓派等，我用的是树莓派2代）
红外接收器（我使用的是一个通用USB接收器，树莓派用户可以DIY一个）
小米（创米）万能红外线遥控器
 小米AI音箱

给Home Assistant设备添加红外遥控接收功能

将红外接收器连接到home assistant设备上。确认红外设备存在，如
pi@raspberrypi:~ $ ls /dev/lirc0 /dev/lirc0

安装红外线收发lirc程序：
pi@raspberrypi:~ $ sudo apt-get install lirc liblircclient-dev

测试红外线接收功能正常：

sudo mode2 -d /dev/lirc0
运行上面命令后找一个红外遥控器对着接收器按任意键，应该可以收到类似这样的字符：
Using driver default on device /dev/lirc0 Trying device: /dev/lirc0 Using device: /dev/lirc0 Running as regular user pi pulse 2750 space 750 pulse 550 ...
好，现在Home Assistant设备可以接收到红外遥控信息了。下一步，让Home Assistant和红外遥控器可以通信。

让Home Assistant接收红外遥控数据

随便给lirc指定一个接收的遥控器数据表，这里用的是xbox360的遥控器，你不需要有这个遥控器，因为后面可以用小米万能遥控器把它模拟出来。
下载xbox360遥控器的数据表,把它设置到lirc:
pi@raspberrypi:~ $ wget http://lirc.sourceforge.net/remotes/microsoft/Xbox360 pi@raspberrypi:~ $ sudo mv Xbox360 /etc/lirc/lircd.conf

创建/etc/lirc/lircrc文件，内容：
begin remote = Microsoft_Xbox360 button = KEY_STOP prog = home-assistant config = KEY_STOP end begin remote = Microsoft_Xbox360 button = KEY_PAUSE prog = home-assistant config = KEY_PAUSE end
这里只以两个按键为例子，参看上面/etc/lirc/lircd.conf的内容，你可以多添加几个按键。

重启lirc
pi@raspberrypi:~ $ sudo systemctl restart lircd.service

现在在米家app给小米万能遥控器添加Xbox360遥控器（使用搜索功能添加，里面有两个，我添加的是“微软DVD播放器”那个），现在测试
pi@raspberrypi:~ $ ircat home-assistant

按遥控器上的停止按键，应该会收到相应的代码。

现在米家app可以给home assistant设备发信息了，下一步要做的是根据这个信息，触发不同的动作。

Home assistant根据遥控器指令触发动作

编辑 HomeAssistant 的configuration.yaml文件，加入lirc组件，
lirc:
配置home assistant的自动化指令：
automation: - alias: 打开灯 trigger: platform: event event_type: ir_command_received event_data: button_name: KEY_PAUSE action: service: homeassistant.turn_on entity_id: group.a_lights
上面的KEY_PAUSE就是刚刚配置的遥控器按键。action可以换成你想要的效果，我是帮来它来启动我的电脑了。重启homeassistant,让配置生效，现在对着树莓派按暂停播放键，就Homeassistant就会触发相应的动作了。

让小米AI音箱控制万能遥控器

先打开米家app，在底部点选“智能”，在“我在”tab中点右上角的“+”号创建新智能条目，在选择条件界面选择“手动执行”，选择“小米万能遥控器”-〈遥控模式〉-〈微软DVD播放器〉-〈暂停/播放〉-〈右上角“确定”〉设置你想要的名称，比如“启动电脑”
好了。打开小米AI app，在底部点选“技能中心”-〈小爱训练计划〉-〈创建训练〉-〈为问题命名，比如“启动电脑”〉-〈设备控制〉-〈选择刚创建的“启动电脑”〉-〈打开〉，预览后保存。
（相关的图文教程点这里）

好了。现在对着小米同学说“启动电脑”，小米音箱会指示小米万能遥控器发送一个KEY_PAUSE按键，这时home assisant收到后，就会触发启动电脑的动作了。

参看：Creating a Raspberry Pi Universal Remote With LIRC
另一种通过第三方平台桥接小爱同学和home assistant的方法： https://bbs.hassbian.com/thread-2404-1-1.html

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/xiaomi-ai-box-2-home-assistant/