欢迎访问今日热搜榜

人工智能狂飙,厦企发力AI安全

频道:都市电视剧 日期: 来源

不久前,厦企云知芯的母公司云知声就上线了“声音克隆”服务。据云知声介绍,其“声音克隆”可全面学习用户的音色和风格,仅需用户二十句左右的原始录音,就可以合成贴近真人的数字声音,且能做到“朗读的语气、语调、情感堪比真人”。

厦企快商通也将声音克隆技术应用于其研发的数字人软件中。“用户只需提供一段3~5分钟有真人出镜、包含人声的视频,通过我们的软件,就可以根据需求,自动生成一段全新的视频,这个数字人的声音跟真人几乎一模一样。”快商通联合创始人李稀敏说。

与此同时,快商通在其自主研发的数字人、声音复刻等AIGC(生成式AI)技术中,也引入独特的智能检测算法,用于AIGC内容的追踪溯源。李稀敏说:“我们在视频或者音频中隐藏了一个信道,这里头传输的信息有独特的标识,相当于身份名片。退一步说,哪怕信息丢失了,我们也能通过算法检测出声音真伪。”

厦门大学信息学院副教授洪青阳告诉记者,以“AI孙燕姿”为代表的AI虚拟歌手,由语音转换(Voice Conversion)技术打造,属于声音克隆的一种。所谓语音转换,简单理解,就是把A的音色转换成B的音色,与此同时,保留A说话或唱歌的内容以及语气、语调等细节。

洪青阳说,训练AI歌手的过程大致分为三步,以“AI孙燕姿”翻唱周杰伦的《发如雪》为例:先用专门的音频软件,把《发如雪》的伴奏和周杰伦的人声分离;再用处理好的孙燕姿的干声(去噪的无音乐纯人声)数据,向机器“投喂”,训练出一个具备孙燕姿音色的声学模型;最后用这一模型对《发如雪》歌曲文件进行音色转换,最终得到“AI孙燕姿”翻唱的《发如雪》。

“完成语音转换的前提是,需具备所模仿对象B的目标音频,所以它并不是无中生有的。”洪青阳说,除了语音转换以外,声音克隆还包括个性化语音合成技术(TTS),可以实现文本转语音,其优点是不需要被模仿对象B说过同样的话,内容定制更自由,比如,“写一首全新的歌让AI演唱,但这种情况下,因为没有‘依葫芦画瓢’的目标音频,AI唱得可能像孙燕姿的音色,但不像周杰伦的唱法。”

不过,AIGC仍处于发展的早期阶段,其相关法律法规、标准体系等尚不健全。有法律人士提醒,站在被翻唱歌曲权利人的角度,AI歌手存在侵权问题。当我们利用AI工具生产内容的同时,得紧绷知识产权这根弦。与此同时,我们也应提高防骗意识,毕竟,在AI狂飙的时代,眼见不一定为实,耳听也可能为虚。

在ChatGPT之后,基于各自算力,国内行业“大咖”百度、腾讯、阿里、华为等先后发布大模型。前不久,云知声山海大模型也在北京发布,展示了其在语言、逻辑、数学等领域的十大核心能力。这一大模型的背后,正是依托东南区域最强超算平台——厦门Atlas智算中心提供的高效稳定算力,近200P算力支撑千亿规模的模型训练,在两个月内完成。

云知声东南总部总经理陆阳向记者透露,为了满足山海大模型的需求,他们在厦门Atlas智算平台和DCML模型工厂基础上,扩充算力,攻关工程优化和数据优选。这期间,厦门区域完成了算力扩容、算法验证、并行加速、数据优选等,实现GPT为核心的架构升级。

关键词:狂飙