作者:彭昭(智次方创始人、云和资本联合创始合伙人)
物女皇:该省则省,方能智行
这是我的第419篇专栏文章。
5月28日,脱胎于MIT的Liquid AI(液态AI)悄悄上线了一个新模型:LFM2.5-8B-A1B。它的定位很明确:不卷云端,专为手机、PC、机器人以及轻量服务端等边缘场景而生。
在如今大模型满天飞的现状下,这则消息很容易被淹没。但引起我关注的,是它极其悬殊的“激活比”:总参数量8B,每次推理却只激活1.5B,实际动用的算力不到五分之一。
作为一家一直死磕端侧智能的公司,Liquid AI这次放出的,绝不只是“把模型做小了一号”,而是一个新信号。
过去两年,为了让大模型跑在物联网设备上,整个行业几乎都在做同一件事:量化、剪枝、蒸馏。打个比方,这就像是把一头为云端而生的“大象”拼命饿瘦,好硬塞进边缘设备这台算力、内存和电池都极其有限的“小冰箱”里。大家在比拼的,无非是谁的大象瘦得更巧、塞得更严丝合缝。
但一个本质的问题却被忽略了:就算大象真的被塞进去了,这台小冰箱那有限的电量,能日复一日供得起它的胃口吗?
液态AI的破局点就在这里。它不再纠结于怎么把大象“饿瘦”,而是去改变这头大象的“进食方式”,让它在处理简单任务时小口慢咽,只有遇到硬骨头时才大口快嚼。
换句话说,它把每一次推理消耗的能量,与输入任务的难易程度直接挂钩。8B的身量,只激活1.5B,正是这种思路的体现:模型底子依然厚实,但每次只唤醒最需要的那一小部分。
这让我愈发坚信一个判断:端侧智能真正的生死线,从来不是参数量的大小(大象瘦不瘦),而是每一次推理要烧掉多少能量(冰箱供不供得起)。
从“减体积”转向“改食量”,液态AI的这次试探,恰好揭开了端侧AI演进的真实逻辑。顺着这个思路,我们不妨重新审视一下:为什么硬塞进冰箱的大象注定活不久?而在端侧这片土壤上,到底什么样的新物种才能真正扎根?
要理解被塞进冰箱的大象为什么注定活不久,我们得先换一把衡量智能的尺子。
在云端,智能的成本归根结底是一本“经济账”:参数量、FLOPs(浮点运算次数),最后都会折算成真金白银的账单。算力不够就加卡,电不够就接更大的变电站,散热不行就建更大的数据中心。在云端,所有的物理约束,本质上都能用“钱”来大力出奇迹。
但在物联网的边缘端,这套“氪金”逻辑彻底失效了。一枚嵌在传感器、摄像头或可穿戴设备里的芯片,它面临的终极拷问不再是算钱,而是算电:每完成一次推理,到底要烧掉多少能量?
这是AIoT与云端AI最根本的差异,也是边缘智能第一性原理:边缘智能的成本,必须以“焦耳”计。
一旦确认了“焦耳预算”是极其有限且固定的,我们就会发现过去两年行业的解法出了偏差。量化、剪枝、蒸馏,这些手段确实把大象“饿瘦”了,但大象的“进食习惯”并没有改变。无论面对多么简单的任务,它依然逢食必倾尽全力,每一次推理都要把全身的参数跑一遍。在严苛的电池约束下,这种静态的全局消耗是致命的。
既然总能量花不起,可持续的工程路径其实只剩一条:让消耗的算力,随着输入任务的难易程度动态变化。简单的任务少花电,复杂的任务多花电,这被称为“输入自适应计算”。
液态AI的价值,正是把手术刀对准了“食量”而非“体重”。
这种思路并非凭空产生,而是源于自然界一种极不起眼的生物:秀丽隐杆线虫。这种线虫全身只有302个神经元,是科学史上第一个被完整绘制出神经连接图谱的动物。它结构简单到可以被人类彻底看清,却能游刃有余地完成觅食、避险等一系列复杂的生存行为。
研究者从中得到的巨大启发是:它的智能不靠堆砌规模,而是靠极致的动态灵活。其神经元之间突触连接的强度,会随着当下流过的信号实时发生变化。
从早期的液态神经网络到如今最新的LFM模型,液态AI其实一直在探索这种“动态智能”的工程化落地。
这次发布的LFM2.5采用了一种混合架构,在保留高效底层算子的同时,巧妙地叠加了MoE(混合专家模型)的稀疏激活机制。我们可以把MoE理解为一个庞大的智囊团,里面坐着许多各有所长的专家。面对一个具体的输入任务时,系统只唤醒最对口的那几个专家上场,剩下的继续“休眠”。
这就是8B的总量、每次却只激活约1.5B的底层逻辑。无论是早期的连续时间动态网络,还是如今的稀疏激活架构,技术路线虽在迭代,但它们共享着同一个硬核底色:让计算量随输入而动。
这才是边缘AI真正该走的路。
假设我们费尽心机,终于把大象塞进了冰箱,故事就结束了吗?远还没有。
冰箱内部的环境不是一成不变的,温度会波动、湿度会改变、甚至会结霜。对应到现实世界,这就是AI模型部署后必然遭遇的“环境漂移”。那头在实验室“恒温恒湿”的标准数据集里训练出来的大象,一旦面对真实世界的风霜雨雪,往往会迅速失能。
更致命的是,那些靠量化、剪枝、蒸馏“硬饿瘦”的小模型,其实非常“脆”。压缩的本质,是削减掉模型应对未知意外的冗余度。这就导致了一个残酷的现实:出厂交付的那一天,往往是这些静态小模型此生性能的巅峰,此后可能便是一路下滑。
这就引出了一个在AI评估中被严重低估的维度。我们习惯于用跑分给模型排座次,但这衡量的是“出厂那一刻”的静态能力。对于AIoT而言,真正该问的是另一个问题:部署之后,在无人干预的荒野里,它还能撑多久?
为什么“保质期”在物联网场景中如此重要?因为边缘设备一旦部署,往往数年都不会有人去碰它。风电叶片上的巡检无人机、几百米深矿井里的机器人、撒在广袤农田里的传感节点……它们面对的光照、风速、粉尘、振动每天都在剧变。在环境的持续漂移下,静态模型的性能会悄无声息地衰减,直到某天彻底宕机。
在这一层物理约束之下,还隐藏着一个更深层的逻辑:当AI的输出从“生成内容”变成“在物理世界执行动作”,它的容错空间会断崖式收窄。
写错一行代码、画错一根手指,大不了让大模型重新生成一次;但在物理世界,一次误判可能意味着无人机坠毁、昂贵的产线停摆,甚至人员伤亡。在AIoT“万物智行”的语境下,鲁棒性绝非锦上添花的加分项,而是关乎安全与责任的生死底线。
液态AI这一技术流派的差异化壁垒,恰恰建立在这条底线之上。
不同于静态模型,液态神经网络通过连续时间方程和自适应的时间常数来建模。这意味着它的内部状态是“流动”的,能够根据输入信号的节奏实时调整。MIT CSAIL(麻省理工学院计算机科学与人工智能实验室)的多次演示已经证明,由这类网络驱动的智能体,即使被扔进从未见过的陌生环境中,依然能稳健导航,从容应对环境漂移。
当然,有人会反驳:环境变了,靠OTA远程升级推送新模型重训不就行了吗?
这种想法,本质上依然是云端思维的残留。
第一,在无网络、弱网络,或者出于极高安全考量做了物理隔离的工业现场(如核电站、深海探测),OTA本身就是一种奢望。
第二,更关键的逻辑在于:OTA重训永远是滞后的。它只能解决“已经发生并被识别”的已知漂移;而液态AI这种原生具备鲁棒性的架构,防御的是“尚未出现”的未知扰动。
寄希望于事后重训来兜底,在物理世界是极其危险的。真正的门槛,永远在部署之后。
回看英伟达,它坚不可摧的护城河从来不是某一代算力逆天的GPU,而是CUDA。算力霸权可以靠硬件堆料被追赶,但长在硬件之上的生态却极难撼动。
同样的逻辑,正在AIoT领域重演。在液态AI(或更广泛的端侧智能)时代,真正的价值捕获点,或许既不在纯粹的模型层,也不在底层的芯片硬件,而在那个长期被忽视的夹层:模型与硬件的协同设计,以及承载它的编译部署栈与工具链。
回到“把大象装进冰箱”的比喻,这个协同层的定位就会变得异常清晰。
如果说自适应的小模型是为狭小冰箱量身定制的“新物种”,那么真正的商业壁垒,是与它配套的那间“厨房”,也就是那一整套能将模型精准适配,让它在各式各样、千奇百怪的冰箱都能高效运转的工具与流程。
芯片是冰箱,模型是新物种,而协同层,就是那间能把二者撮合到最佳状态的厨房。
液态AI的商业化动作,恰好印证了这一点。
他们推出的LFM在架构设计之初就被刻意优化,打破了硬件壁垒。官方宣称其可无缝运行于GPU、CPU或NPU之上,横跨从可穿戴设备、机器人到手机、PC乃至智能汽车等多种异构设备。今年1月,他们与AMD达成合作,仅用两周时间,就在后者的Ryzen AI处理器上完成了2.6B(26亿参数)模型的本地化定制与极致部署。
这种惊人效率的背后,最具护城河价值的,与其说是那26亿个模型参数本身,不如说是一种在极端硬件约束下,能够迅速逼近“最优算子组合”与“最低内存占用”的工程化能力。
产业的价值,正在从模型与芯片这两端,悄然向二者之间的“接缝处”迁移。
审视边缘端这台“冰箱”,它本质上受制于两个绝对的物理硬约束:一个是“功耗”,对应着能耗与算力;另一个是“食材”,对应着数据与上下文。
这篇文章,我们主要探讨了“电力受限”的破局之道。当边缘设备的能量预算被死死封顶,云端那种“大力出奇迹”的暴力美学便走到了尽头。唯一可持续的路径,是让智能回归生物学的本能,学会按需耗能,该省则省,随境流转。
这是端侧智能第一性原理的一半。
至于另一半,“食材”(数据)受限的问题,我们下篇文章再谈。