人工智能狂飙，厦企发力AI安全

频道：都市电视剧日期：2023-06-07 13:26:50 来源

不久前，厦企云知芯的母公司云知声就上线了“声音克隆”服务。据云知声介绍，其“声音克隆”可全面学习用户的音色和风格，仅需用户二十句左右的原始录音，就可以合成贴近真人的数字声音，且能做到“朗读的语气、语调、情感堪比真人”。

厦企快商通也将声音克隆技术应用于其研发的数字人软件中。“用户只需提供一段3~5分钟有真人出镜、包含人声的视频，通过我们的软件，就可以根据需求，自动生成一段全新的视频，这个数字人的声音跟真人几乎一模一样。”快商通联合创始人李稀敏说。

与此同时，快商通在其自主研发的数字人、声音复刻等AIGC（生成式AI）技术中，也引入独特的智能检测算法，用于AIGC内容的追踪溯源。李稀敏说:“我们在视频或者音频中隐藏了一个信道，这里头传输的信息有独特的标识，相当于身份名片。退一步说，哪怕信息丢失了，我们也能通过算法检测出声音真伪。”

厦门大学信息学院副教授洪青阳告诉记者，以“AI孙燕姿”为代表的AI虚拟歌手，由语音转换（Voice Conversion）技术打造，属于声音克隆的一种。所谓语音转换，简单理解，就是把A的音色转换成B的音色，与此同时，保留A说话或唱歌的内容以及语气、语调等细节。

洪青阳说，训练AI歌手的过程大致分为三步，以“AI孙燕姿”翻唱周杰伦的《发如雪》为例：先用专门的音频软件，把《发如雪》的伴奏和周杰伦的人声分离；再用处理好的孙燕姿的干声（去噪的无音乐纯人声）数据，向机器“投喂”，训练出一个具备孙燕姿音色的声学模型；最后用这一模型对《发如雪》歌曲文件进行音色转换，最终得到“AI孙燕姿”翻唱的《发如雪》。

“完成语音转换的前提是，需具备所模仿对象B的目标音频，所以它并不是无中生有的。”洪青阳说，除了语音转换以外，声音克隆还包括个性化语音合成技术（TTS），可以实现文本转语音，其优点是不需要被模仿对象B说过同样的话，内容定制更自由，比如，“写一首全新的歌让AI演唱，但这种情况下，因为没有‘依葫芦画瓢’的目标音频，AI唱得可能像孙燕姿的音色，但不像周杰伦的唱法。”

不过，AIGC仍处于发展的早期阶段，其相关法律法规、标准体系等尚不健全。有法律人士提醒，站在被翻唱歌曲权利人的角度，AI歌手存在侵权问题。当我们利用AI工具生产内容的同时，得紧绷知识产权这根弦。与此同时，我们也应提高防骗意识，毕竟，在AI狂飙的时代，眼见不一定为实，耳听也可能为虚。

在ChatGPT之后，基于各自算力，国内行业“大咖”百度、腾讯、阿里、华为等先后发布大模型。前不久，云知声山海大模型也在北京发布，展示了其在语言、逻辑、数学等领域的十大核心能力。这一大模型的背后，正是依托东南区域最强超算平台——厦门Atlas智算中心提供的高效稳定算力，近200P算力支撑千亿规模的模型训练，在两个月内完成。

云知声东南总部总经理陆阳向记者透露，为了满足山海大模型的需求，他们在厦门Atlas智算平台和DCML模型工厂基础上，扩充算力，攻关工程优化和数据优选。这期间，厦门区域完成了算力扩容、算法验证、并行加速、数据优选等，实现GPT为核心的架构升级。

关键词：狂飙

人工智能狂飙，厦企发力AI安全

相关文章