如何让AI兼具“技术理性”与“艺术感性”?答案可能在语言音乐规律中

2025-11-07 14:31:19 科技

【导语】中国科学(xué)院(yuàn)院(yuàn)士(shì)管(guǎn)晓(xiǎo)宏(hóng)团(tuán)队(duì)研(yán)究(jiū)发(fā)现(xiàn),语(yǔ)言(yán)节(jié)奏(zòu)、音(yīn)乐(lè)旋(xuán)律(lǜ)中(zhōng)藏(cáng)着(zhe)相(xiāng)同(tóng)“数(shù)学(xué)规(guī)律(lǜ)”,这(zhè)一(yī)规(guī)律(lǜ)不(bù)仅(jǐn)解(jiě)释(shì)了(le)“何(hé)为悦耳旋律”,还可优化AI大模型训练数据,提升内容生成自然度,为通用人工智能发展提供新方向。

如何让AI兼具“技术理性”与“艺术感性”?答案可能在语言音乐规律中

你知道吗?不管是人们说话的节奏、用词习惯,还是歌曲的旋律变化,都藏着一种相同的“数学规律”。掌握这种规律,能让人工智能(AI)写文章更通顺、创作音乐更动听,为大模型技术发展提供新方向。

中国科学院院士、西安交通大学教授管晓宏介绍,这种“数学规律”在自然界和工程领域很常见,比如城市人口分布、网络节点连接等都遵循类似规则。他带领团队花了多年时间,分析了大量音乐作品——从巴赫、贝多芬的古典乐曲,到周杰伦等歌手的流行音乐,发现(xiàn)不(bù)管(guǎn)是(shì)哪(nǎ)种(zhǒng)风格、哪个时代的音乐,旋律的起伏变化都符合这一规律。

“这不是巧合,而是音乐本身的数学特性决定的。”管晓宏用通俗的语言解释,团队通过研究总结出音乐旋律的三个关键特点:一是不同音高之间的间隔分布相对稳定;二是旋律的走向像“平滑的曲线”,不会突然出现特别突兀的跳跃;三是旋律会追求“多样性”,避免长时间重复单一节奏或音高。基于这些特点,团队建立了数学模型,最终证实:好听的音乐,其旋律变化都能通过这种规律来解释,这也回答了“为什么大家觉得某些音乐更悦耳”的问题。

更让人意外的是,这种规律在语言领域同样适用。管晓宏举例说,人们日常说话时,句子的长短(duǎn)节(jié)奏(zòu)、常(cháng)用(yòng)词汇(huì)的(de)出(chū)现(xiàn)频(pín)率(lǜ),甚(shén)至(zhì)文章(zhāng)的(de)段(duàn)落(luò)安(ān)排(pái),都(dōu)能(néng)找(zhǎo)到(dào)这(zhè)一(yī)规(guī)律(lǜ)的(de)影(yǐng)子(zi)。而(ér)当(dāng)前(qián)AI大(dà)模(mó)型(xíng)的(de)性(xìng)能(néng)提(tí)升(shēng),也和训练数据量增长遵循类似规律。“这就意味着,我们可以用这种规律优化大模型的训练数据。”他表示,比如筛选更符合语言规律的文本数据,或按照音乐规律调整AI作曲的参数,就能让AI生成的内容更贴近人类习惯,自然度大幅提升。

针对“为什么人们能感觉到旋律好听”,管晓宏还提出一个猜想:符合这种规律的旋律,更容易让人产生愉悦感。目前,他的团队正联合清华大学脑科学研究团队、中央音乐学院音乐人工智能团队,通过脑机测量等实验方法验证这一想法。如果得到证实,不仅能帮AI更好地“理解”人类的音乐喜好,还能为AI音乐治疗、情感陪伴等新应用提供科学依据。

值得一提的是,管晓宏还是中央音乐学院音乐人工智能和信息科技团队成员,既懂科学又懂艺术。他表示,这次的研究成果恰恰说明,科学思维和艺术创作是相互促进的。“语言和音乐看似是两种不同的表达形式,底层却藏着相同的规律。”他认为,未来通过深挖这种跨领域的共性规律,能让AI大模型既具备“理性的技术能力”,又拥有“感性的艺术感知”,为通用人工智能发展开辟新赛道。

作者:宋雅娟

审核:管晓宏 中国科学院院士、西安交通大学教授