输入“/”快速插入内容

麻省理工/ CETI 团队用机器学习技术分离出抹香鲸发音字母表!高度类似人类语言系统,信息承载能力更强!

2024年8月15日修改
作者:李姝 阅读原文
在海洋生态学研究中,生物声学是人们获取海洋生物信息的重要途径。顾名思义,生物声学主要是对动物声音的生成、传播与接收进行研究。随着技术的发展,科研人员目前已经能够通过解码动物发声,了解其物种、性别、个体标识或健康情况。
然而,传统的生物声学在进行种群监测时,需要耗费大量的人力来处理和分析现场录音,耗时且成本高。AI 在声音识别方面的突破为这一挑战提供了理想解决方案。机器学习凭借其自动化处理与自我学习能力,已经在生物声学领域大展拳脚。
如今,机器学习分析海洋生物发声已实现了成熟应用。而在一众海洋生物中,鲸鱼、海豚等鲸目动物具有复杂的社会行为特征与合作行为特征,与人类社会高度相似,具有极高的研究价值。
其中,抹香鲸由于与人类社会高度类似的语言系统而成为被研究的重点。
抹香鲸作为高度社会化的哺乳动物,以家庭为生活单位,社会结构错综复杂。为了进行群体决策,它们大部分时间通过发出连续的「咔嗒」声来进行交流,其交流的时间可能只有短短 10 秒,也可能持续半小时以上。虽然它们的交流系统看似简单,但却能实现一系列复杂的协调行为,这两者之间的反差成为科研人员想要破解的「谜题」。此前大量的研究已经证明抹香鲸的发声具有复杂性,但对于其尾声的具体特征和结构仍然是未知的。
针对于此,麻省理工学院 Pratyusha Sharma 以及 CETI 的研究者使用机器学习对抹香鲸的录音进行了分析,证实了抹香鲸发出的声音具有结构性,由不同特征组合形成,还通过机器学习技术分离出了抹香鲸发音字母表,发现其语言表达系统与人类高度类似,且信息承载更强。
相关研究以「Contextual and combinatorial structure in sperm whale vocalisations」为题,发表在 Nature Communications 上。
研究亮点:
本研究利用目前最大的抹香鲸数据库多米尼克抹香鲸项目 (DSWP) 中的数据,分析了来自东加勒比抹香鲸部族的约 60 头不同抹香鲸的 8,719 条尾声记录,定义了「抹香鲸发音字母表」
抹香鲸的语言具有组合结构性,即其可以组合和调节不同的「咔嗒」声与节奏,以创造出复杂的发声,与人类的语言具有高度类似性
关注公众号,后台回复「抹香鲸发声」获取完整 PDF
开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,并提供海量数据集与工具:
数据集:数据量大,时间跨度长
本研究所用的数据集来自多米尼克抹香鲸项目 (DSWP),这是当前最大的抹香鲸数据存储库。研究成员在分析中使用了来自东加勒比抹香鲸部族 (EC-1) 的 60 头不同抹香鲸的录音,这些录音共包括 8,719 个尾声数据。
值得一提的是,该数据集不仅包含了 2005-2018 年间,从各种平台和记录系统中手动标注的尾声数据;还包括 2014-2018 年间,从抹香鲸身上吸附的传感器 (DTags) 中记录的数据。
抹香鲸尾声具有丰富的组合特征
为了清晰地观察抹香鲸在交流过程中尾声的变化以及长期趋势,研究人员使用可视化的方式来描述这些声音。如下图所示:图 A 显示了 DSWP 数据集中,两只鲸鱼在 2 分钟内的交流尾声图,鲸鱼发出的尾声分别用蓝色和橙色表示。