把大象塞进冰箱:"液态AI"背后藏着AIoT的第一性原理

作者 | 创始人2026-06-02

作者：彭昭（智次方创始人、云和资本联合创始合伙人）

物女皇：该省则省，方能智行

这是我的第419篇专栏文章。

5月28日，脱胎于MIT的Liquid AI（液态AI）悄悄上线了一个新模型：LFM2.5-8B-A1B。它的定位很明确：不卷云端，专为手机、PC、机器人以及轻量服务端等边缘场景而生。

在如今大模型满天飞的现状下，这则消息很容易被淹没。但引起我关注的，是它极其悬殊的“激活比”：总参数量8B，每次推理却只激活1.5B，实际动用的算力不到五分之一。

作为一家一直死磕端侧智能的公司，Liquid AI这次放出的，绝不只是“把模型做小了一号”，而是一个新信号。

过去两年，为了让大模型跑在物联网设备上，整个行业几乎都在做同一件事：量化、剪枝、蒸馏。打个比方，这就像是把一头为云端而生的“大象”拼命饿瘦，好硬塞进边缘设备这台算力、内存和电池都极其有限的“小冰箱”里。大家在比拼的，无非是谁的大象瘦得更巧、塞得更严丝合缝。

但一个本质的问题却被忽略了：就算大象真的被塞进去了，这台小冰箱那有限的电量，能日复一日供得起它的胃口吗？

液态AI的破局点就在这里。它不再纠结于怎么把大象“饿瘦”，而是去改变这头大象的“进食方式”，让它在处理简单任务时小口慢咽，只有遇到硬骨头时才大口快嚼。

换句话说，它把每一次推理消耗的能量，与输入任务的难易程度直接挂钩。8B的身量，只激活1.5B，正是这种思路的体现：模型底子依然厚实，但每次只唤醒最需要的那一小部分。

这让我愈发坚信一个判断：端侧智能真正的生死线，从来不是参数量的大小（大象瘦不瘦），而是每一次推理要烧掉多少能量（冰箱供不供得起）。

从“减体积”转向“改食量”，液态AI的这次试探，恰好揭开了端侧AI演进的真实逻辑。顺着这个思路，我们不妨重新审视一下：为什么硬塞进冰箱的大象注定活不久？而在端侧这片土壤上，到底什么样的新物种才能真正扎根？

衡量智能的标尺，从“算钱”换成了“算电”

要理解被塞进冰箱的大象为什么注定活不久，我们得先换一把衡量智能的尺子。

在云端，智能的成本归根结底是一本“经济账”：参数量、FLOPs（浮点运算次数），最后都会折算成真金白银的账单。算力不够就加卡，电不够就接更大的变电站，散热不行就建更大的数据中心。在云端，所有的物理约束，本质上都能用“钱”来大力出奇迹。

但在物联网的边缘端，这套“氪金”逻辑彻底失效了。一枚嵌在传感器、摄像头或可穿戴设备里的芯片，它面临的终极拷问不再是算钱，而是算电：每完成一次推理，到底要烧掉多少能量？

这是AIoT与云端AI最根本的差异，也是边缘智能第一性原理：边缘智能的成本，必须以“焦耳”计。

一旦确认了“焦耳预算”是极其有限且固定的，我们就会发现过去两年行业的解法出了偏差。量化、剪枝、蒸馏，这些手段确实把大象“饿瘦”了，但大象的“进食习惯”并没有改变。无论面对多么简单的任务，它依然逢食必倾尽全力，每一次推理都要把全身的参数跑一遍。在严苛的电池约束下，这种静态的全局消耗是致命的。

既然总能量花不起，可持续的工程路径其实只剩一条：让消耗的算力，随着输入任务的难易程度动态变化。简单的任务少花电，复杂的任务多花电，这被称为“输入自适应计算”。

液态AI的价值，正是把手术刀对准了“食量”而非“体重”。

这种思路并非凭空产生，而是源于自然界一种极不起眼的生物：秀丽隐杆线虫。这种线虫全身只有302个神经元，是科学史上第一个被完整绘制出神经连接图谱的动物。它结构简单到可以被人类彻底看清，却能游刃有余地完成觅食、避险等一系列复杂的生存行为。

研究者从中得到的巨大启发是：它的智能不靠堆砌规模，而是靠极致的动态灵活。其神经元之间突触连接的强度，会随着当下流过的信号实时发生变化。

从早期的液态神经网络到如今最新的LFM模型，液态AI其实一直在探索这种“动态智能”的工程化落地。

这次发布的LFM2.5采用了一种混合架构，在保留高效底层算子的同时，巧妙地叠加了MoE（混合专家模型）的稀疏激活机制。我们可以把MoE理解为一个庞大的智囊团，里面坐着许多各有所长的专家。面对一个具体的输入任务时，系统只唤醒最对口的那几个专家上场，剩下的继续“休眠”。

这就是8B的总量、每次却只激活约1.5B的底层逻辑。无论是早期的连续时间动态网络，还是如今的稀疏激活架构，技术路线虽在迭代，但它们共享着同一个硬核底色：让计算量随输入而动。

这才是边缘AI真正该走的路。

真正的门槛不在出厂，而在部署之后

假设我们费尽心机，终于把大象塞进了冰箱，故事就结束了吗？远还没有。

冰箱内部的环境不是一成不变的，温度会波动、湿度会改变、甚至会结霜。对应到现实世界，这就是AI模型部署后必然遭遇的“环境漂移”。那头在实验室“恒温恒湿”的标准数据集里训练出来的大象，一旦面对真实世界的风霜雨雪，往往会迅速失能。

更致命的是，那些靠量化、剪枝、蒸馏“硬饿瘦”的小模型，其实非常“脆”。压缩的本质，是削减掉模型应对未知意外的冗余度。这就导致了一个残酷的现实：出厂交付的那一天，往往是这些静态小模型此生性能的巅峰，此后可能便是一路下滑。

这就引出了一个在AI评估中被严重低估的维度。我们习惯于用跑分给模型排座次，但这衡量的是“出厂那一刻”的静态能力。对于AIoT而言，真正该问的是另一个问题：部署之后，在无人干预的荒野里，它还能撑多久？

为什么“保质期”在物联网场景中如此重要？因为边缘设备一旦部署，往往数年都不会有人去碰它。风电叶片上的巡检无人机、几百米深矿井里的机器人、撒在广袤农田里的传感节点……它们面对的光照、风速、粉尘、振动每天都在剧变。在环境的持续漂移下，静态模型的性能会悄无声息地衰减，直到某天彻底宕机。

在这一层物理约束之下，还隐藏着一个更深层的逻辑：当AI的输出从“生成内容”变成“在物理世界执行动作”，它的容错空间会断崖式收窄。

写错一行代码、画错一根手指，大不了让大模型重新生成一次；但在物理世界，一次误判可能意味着无人机坠毁、昂贵的产线停摆，甚至人员伤亡。在AIoT“万物智行”的语境下，鲁棒性绝非锦上添花的加分项，而是关乎安全与责任的生死底线。

液态AI这一技术流派的差异化壁垒，恰恰建立在这条底线之上。

不同于静态模型，液态神经网络通过连续时间方程和自适应的时间常数来建模。这意味着它的内部状态是“流动”的，能够根据输入信号的节奏实时调整。MIT CSAIL（麻省理工学院计算机科学与人工智能实验室）的多次演示已经证明，由这类网络驱动的智能体，即使被扔进从未见过的陌生环境中，依然能稳健导航，从容应对环境漂移。

当然，有人会反驳：环境变了，靠OTA远程升级推送新模型重训不就行了吗？

这种想法，本质上依然是云端思维的残留。

第一，在无网络、弱网络，或者出于极高安全考量做了物理隔离的工业现场（如核电站、深海探测），OTA本身就是一种奢望。

第二，更关键的逻辑在于：OTA重训永远是滞后的。它只能解决“已经发生并被识别”的已知漂移；而液态AI这种原生具备鲁棒性的架构，防御的是“尚未出现”的未知扰动。

寄希望于事后重训来兜底，在物理世界是极其危险的。真正的门槛，永远在部署之后。

价值高地不在芯片，也不在模型，而在两者之间的协同层

回看英伟达，它坚不可摧的护城河从来不是某一代算力逆天的GPU，而是CUDA。算力霸权可以靠硬件堆料被追赶，但长在硬件之上的生态却极难撼动。

同样的逻辑，正在AIoT领域重演。在液态AI（或更广泛的端侧智能）时代，真正的价值捕获点，或许既不在纯粹的模型层，也不在底层的芯片硬件，而在那个长期被忽视的夹层：模型与硬件的协同设计，以及承载它的编译部署栈与工具链。

回到“把大象装进冰箱”的比喻，这个协同层的定位就会变得异常清晰。

如果说自适应的小模型是为狭小冰箱量身定制的“新物种”，那么真正的商业壁垒，是与它配套的那间“厨房”，也就是那一整套能将模型精准适配，让它在各式各样、千奇百怪的冰箱都能高效运转的工具与流程。

芯片是冰箱，模型是新物种，而协同层，就是那间能把二者撮合到最佳状态的厨房。

液态AI的商业化动作，恰好印证了这一点。

他们推出的LFM在架构设计之初就被刻意优化，打破了硬件壁垒。官方宣称其可无缝运行于GPU、CPU或NPU之上，横跨从可穿戴设备、机器人到手机、PC乃至智能汽车等多种异构设备。今年1月，他们与AMD达成合作，仅用两周时间，就在后者的Ryzen AI处理器上完成了2.6B（26亿参数）模型的本地化定制与极致部署。

这种惊人效率的背后，最具护城河价值的，与其说是那26亿个模型参数本身，不如说是一种在极端硬件约束下，能够迅速逼近“最优算子组合”与“最低内存占用”的工程化能力。

产业的价值，正在从模型与芯片这两端，悄然向二者之间的“接缝处”迁移。

写在最后

审视边缘端这台“冰箱”，它本质上受制于两个绝对的物理硬约束：一个是“功耗”，对应着能耗与算力；另一个是“食材”，对应着数据与上下文。

这篇文章，我们主要探讨了“电力受限”的破局之道。当边缘设备的能量预算被死死封顶，云端那种“大力出奇迹”的暴力美学便走到了尽头。唯一可持续的路径，是让智能回归生物学的本能，学会按需耗能，该省则省，随境流转。

这是端侧智能第一性原理的一半。

至于另一半，“食材”（数据）受限的问题，我们下篇文章再谈。

IoT