MIT研究人员发明可以用声音模拟世界的人工智能系统

MIT研究人员发明可以用声音模拟世界的人工智能系统

作者 | cnBeta2022-11-01

计算机视觉是一个在过去几十年中被研究得相当多的领域，主要是因为它在建造自动驾驶汽车和其他可以像人类一样"看"世界的工具方面有着直接和明显的应用。然而，直到最近才看到这种水平的研究的一个领域是使用声音而不是视觉来模拟环境。现在，麻省理工学院（MIT）的研究人员已经撰写了一篇研究论文，涉及在这一领域训练的机器学习（ML）模型的构建。

麻省理工学院新闻网站上的一篇博文介绍说，MIT-IBM沃森人工智能实验室合作建立了一个ML模型，利用空间声学来观察和模拟环境。简单地说，这个模型通过弄清听众如何听到从某一点发出的声音并传播到不同的位置，实现了环境的映射。

这种技术有许多好处，因为它可以只用声音来确定环境物体的基本三维几何形状。然后，它可以呈现准确的视觉效果来重建环境。潜在的应用包括虚拟和增强现实，以及增强人工智能代理，使其能够利用声音和视觉来更好地可视化其环境。例如，与计算机视觉相比，水下探索机器人可以利用声学来更好地确定某些物体的位置。

图形显示的是房间的3D模型，下面是带有声音的热视图类型的概念

图形显示的是房间的3D模型，下面是带有声音的热视图类型的概念

研究人员强调，建立这种基于声音的ML模型要比基于计算机视觉的模型复杂得多。这是因为计算机视觉模型利用了一种叫做光度一致性的属性，这意味着一个物体从不同角度看时看起来大致相同。这不适用于声音，因为根据聆听方的位置和其他障碍物，从一个源头听到的东西可能非常不一样。

为了解决这个问题，研究人员使用了另外两个特征，即互易性和局部几何学。前者基本上意味着，即使交换了说话者和听众的位置，声音也会完全相同。同时，局部几何映射涉及在神经声场（NAF）中结合互易性来捕捉物体和其他建筑组件。

为了让ML模型在测试环境中工作，需要向它输入一些视觉信息和光谱图，其中包含基于发端者和听众的指定位置的音频听起来会是什么样子。根据这些输入，该模型可以准确地确定当听众在环境中移动时，声音将如何变化。

该研究论文的主要作者Andrew Luo指出：“如果你想象自己站在一个门口附近，对你听到的声音影响最强烈的是那个门口的存在，而不一定是房间另一边离你很远的几何特征，我们发现这些信息比简单的全连接网络能更好地概括。”

展望未来，研究人员希望进一步加强该模型，使其能够将更大、更复杂的环境可视化，如一栋建筑甚至整个城市。

您可能感兴趣

搞懂物联网产业链其实很简单！《2023年中国AIoT产业全景图谱》重磅发布！

2022挚物·AIoT产业领袖峰会【线上直播】

Teviso核辐射探测器BG500用于核辐射检测仪

中移物联携手中移国际与巴西议员共商城市物联网发展规划

观众如潮！AI+IoT行业顶级盛会，重磅开幕！

行业应用加速落地，5G+AI催化物联网蝶变

热门文章

1

31 亿美元！卫星互联网重磅收购案落地，产业格局加速洗牌

1天前

2

【2025数智产业系列榜单】中国数智产业创新产品榜发布！以产品创新驱动产业升级

2天前

3

【2025数智产业系列榜单】中国数智赋能领航企业榜发布！以创新科技驱动产业智能化跃升

2天前

4

【2025数智产业系列榜单】AI+工业场景创新领军企业榜发布！以创新引擎驱动产业智能

2天前

5

从谷歌的网络切片演示看5G网络切片的商业化进程

2天前

6

【2025数智产业系列榜单】AI+教育场景创新领军企业榜发布！以技术创新引领 AI+教育新未来

4天前

7

AIoT智能体崛起:物联网正塑造AI在实体世界的运行框架

4天前

8

《中国端侧 AI 全景图谱报告》已正式发布!助力端侧AI产业链上下游迈向发展新高度

5天前

9

存力觉醒、AI未来！2025全球闪存峰会在南京盛大召开

5天前

10

AI 潮涌东方处，数智星火已燎原——2025数智融合领袖峰会绘就产业落地新图景

1周前

11

倒计时1天｜2025数智融合领袖峰会即将开启！

1周前

12

Robrain AI打造机器人"闭环智能"引擎,加速具身智能机器人"灵魂觉醒"

1周前

13

AI智能体+AIoT:智能时代的关键联结,还是又一场幻觉与泡沫?

1周前

14

ISSE 国际智慧空间展览会9月杭州首秀！全球智慧生态×国家级数贸平台，共绘智慧空间新蓝图

1周前

15

消费物联网产品价格比非连接同类产品高44%,成为智能消费市场重要载体

1周前

16

过度炒作+虚假包装？Gartner预测2027年超40%的代理型AI项目将失败

2周前

17

TRUE大会"智慧通行"分论坛圆满落幕!解码未来通行,引领楼宇通行数智变革

2周前

18

构筑汽车网络安全“护城河”

2周前

19

万字回顾首届中国AI算力大会！15+位大咖主会场演讲精华爆棚，来没来都值得收藏

2周前

20

闪存普惠，一步到位 | 华为商业市场极简全闪数据中心Pro+重磅发布

2周前

腾讯首席科学家张正友终身科学影响力中国 Top10

11月1日，记者获悉美国斯坦福大学（StanfordUniversity）于10月10日发布了2022年度“全球前2%顶尖科学家榜单”(World'sTop2%Scientists2022)。

2022-11-01

智次方·物联网智库 —— 研究型智能产业服务平台

关于智次方

友情链接

ITES深圳工业展

极客邦科技

智联车智库

智吱屋小程序

本站由阿里云提供计算与安全服务违法和不良信息举报电话：010-88884220 举报邮箱：liuzong@zzw.com 网上有害信息举报

©2022 北京英维塔科技有限公司京ICP备16012223号-1

京ICP备16012223号

智次方·物联网智库 —— 研究型智能产业服务平台

X