近日,全国数据资源统计调查工作组发布了《全国数据资源调查报告(2024年)》,报告显示,2024年全国数据资源规模加速增长,数据生产总量达到41.06ZB,同比增长25%;人均年度数据生产量约为31.31TB,同比增长25.17%。其中,智能家居、智能网联汽车等智能设备数据增速位居前列,分别为51.43%、29.28%。
智能家居、智能网联汽车等设备是典型的物联网终端,在物联网终端连接数快速增长、人工智能技术应用渗透率提升的背景下,智能物联网(AIoT)成为主导,打破此前传统应用场景,给用户带来突破性的体验,同时产生的数据增速远远快于其他设备,成为海量数据资源增长的重要来源。
物联网已有数十年的发展历史,当前数据资源价值化的探索持续深入,物联网能够带来的海量数据得到高度重视。在很多场景中,单个物联网终端的功能相对于智能手机来说比较单一,因此能够产生的数据量小于智能手机。不过,物联网终端出货数量增速远远快于智能手机,同时人工智能技术的采用,对于数据的生成和使用大大超出原有的场景,使物联网成为数据资源的主力之一。
一是出货量规模持续快速增长,形成全方位数据来源触点
消费物联网是人们日常接触较多的物联网场景,预计2025年底,全球消费物联网设备数量将达到110亿台,每台设备每天都在产生不同规模的数据。目前,家庭生活中各类场景均有智能化设备的助力,智能设备的数据采集功能又让家庭生活几乎所有触点数据化,推动智能家居数据实现50%以上的增速。
当前,各类家庭智能化设备出货实现快速增长。工信部数据显示,2024年1-12月,全国家用电冰箱产量10395.7万台,同比增长8.3%;房间空气调节器产量26598.4万台,同比增长9.7%;家用洗衣机产量11736.5万台,同比增长8.8%。各家电厂商公开信息显示,家电类设备智能化比例较高,大部分家电具备了联网功能。
根据市场调研机构Statista统计数据,2022年美国智能家居在家庭中的渗透率已达到43.8%,到2028年这一渗透率将高达75.1%。中国市场方面,2022年智能家居在中国家庭的渗透率为16.6%,即有8000多万户家庭采用了智能家居产品,预计到2028年中国智能家居的活跃用户数将达到1.91亿户,这意味着有1.91亿户家庭在日常生活中都将高频率使用智能家居产品,占所有家庭户的比例接近4成。
有了物联网设备出货量的规模效应,能为数据资源提供丰富的输入。
二是人工智能应用加速,端边云多侧联动加速数据生成和流动
大模型的爆火,促进各行业加速进入人工智能时代,物联网也不例外,AIoT在扩展应用场景广度深度的同时,通过终端—边缘—平台多侧智能化协同,实现数据生成量快速增长,也推动数据的流动。
在没有人工智能加持的消费物联网场景,终端更多的功能是作为一个被动的感知和数据收集设备,给人们带来的体验相对单一,产生的数据量的规模和增速都不会太高。目前,相关厂商开发了能够进行端侧训练推理的芯片,实现大模型下沉至终端,不少物联网模组、终端厂商推出了具有端侧智能的产品,繁荣端侧人工智能生态。在这一过程中,终端能够适配的场景大大扩展,生成的数据量也大幅提升。
在边缘服务器上部署人工智能大模型,通过无线网络向用户提供即时服务以及更便利和可定制的体验,用户可以低延时和低资源消耗轻松地访问和享受大模型服务,也那成为当前物联网产业中一个重点布局的领域。在这种模式下,大模型服务提供商训练的模型托管在边缘服务器上,并持续维护和更新,以确保模型在生成高质量内容方面保持准确和有效,用户可以提交内容生成请求,并从供应商租用的边缘服务器接收生成的内容,边缘侧数据生成和流动相对以往更为丰富。
物联网平台作为终端设备接入、开发、管理的中枢大脑,是人工智能能力核心的载体,平台完善的功能、丰富的场景和数据显得非常重要。目前,消费物联网领域已形成了多个大型平台,如海尔、美的等家电厂商依托自身家电产品和产业链资源,建立起接入数千万设备的消费物联网平台;小米、涂鸦智能依托自身生态圈资源建立物联网平台,接入设备数量达到数亿级。各类消费物联网场景已引入了语音交互、手势交互、智能感知、图像识别、视觉定位等能力,大型消费物联网平台在这些方面有了长时间积累,相关能力不断迭代,大模型技术的应用则进一步提升客户体验,并促进数据量的增长。
AIoT形成的数据资源优势,为大模型的应用落地提供一个较好的实验场。此前,咨询机构IDC数据显示,到2025年全球数据总量将达到163ZB,而物联网设备生成的数据量预计将达到73.1ZB,已达到全球数据总量44%。其中智能汽车等强算力、大带宽终端产生的数据尤为惊人,一辆智能网联汽车每天就可能收集10TB的数据。海量的物联网连接,未来产生的数据量可能超过互联网,可以给人工智能大模型持续输入“养料”去训练。
物联网厂商也积极拥抱大模型,充分发挥物联网数据作用。以智能家居为例,此前,海尔发布了智慧家庭领域首个行业大模型HomeGPT,基于海尔智慧家庭、家电、家装等领域多维度的数据,进行了亿级家庭知识增强训练。美的已发布了“美言大模型”,该模型具备智能感知、自然交互、自主决策等能力,支持全屋空气、智慧烹饪、智慧洗护、智慧能源等 8 大业务系统,涵盖了生活的多个方面。涂鸦智能发布其首个AI大模型Cube Al,在空间智能化方向,通过将GenAI能力融入空间场景,用户能够获得生成式AI的设备功能与管理体验、AI 驱动的智能场景体验、或是场景分析与联动方案推荐。
随着DeepSeek的爆火,智能家居厂商也纷纷入局。今年以来,华为小艺助手、百度旗下小度、小米的“超级小爱”、居然智家等均搭载了DeepSeek模型,提升用户互动体验。
海外一家物联网平台负责人曾经撰文指出,生成式人工智能和物联网的结合有可能重塑未来的技术并推动前所未有的创新,这其中很多场景借助的是物联网形成的海量数据。主要表现在:
一是创造新的物联网设备:例如开发出新的具备更高自然语言处理能力的智能助理,这些设备将能够理解并响应人类的命令和查询,改变我们与技术互动的方式。
二是增强用户交互方式:虽然手势识别和语音命令已经在不少物联网场景中采用,但生成式人工智能可能驱动这些新的交互方式能力进一步强化,使交互更加直观和易用,从而改善用户体验。
三是提高安全性和可靠性:生成式人工智能可以协助开发物联网网络的高级安全措施,有效缓解网络威胁,确保数据隐私;同时,通过生成合成数据来训练异常检测模型,大模型可以帮助实时识别和防止安全漏洞。
四是推动物联网接入更普惠化:生成式人工智能有潜力通过使物联网设备更加实惠和更易于访问,帮助弥合数字鸿沟,并让更多人受益于智能物联网连接带来的红利。
《全国数据资源调查报告(2024年)》预测,预计2025年全国数据生产总量有望突破50ZB,AI计算机的普及应用与AI服务器性能的快速提升,推动数据资源结构持续优化,计算数据、合成数据将超过影音视听、监测摄像等数据,无人驾驶、具身智能、低空经济等战略性新兴产业和未来产业的数据资源规模将保持高速增长。这些领域也是广泛部署AIoT的领域,可以说AIoT终端将成为数据资源来源的另一主力。