金融界2024年1月9日消息,据国家知识产权局公告,华为云计算技术有限公司申请一项名为“一种语音克隆方法、装置及相关设备“,公开号CN117373432A,申请日期为2022年9月。
专利摘要显示,本申请提供了一种语音克隆方法,包括:确定目标场景,并根据该目标场景,确定属于目标场景的目标语料文本,然后根据该目标语料文本,确定目标对象的音频,该音频的语音内容与目标语料文本的内容相匹配,从而利用该目标语料文本以及目标对象的音频,训练目标场景对应的语音克隆模型,该语音克隆模型用于输出模拟目标对象在目标场景下发音的音频。由于语音克隆模型是基于目标对象针对目标场景下的语料文本的发音音频进行训练得到,这使得语音克隆模型根据文本所输出的新的语音,在音色、韵律和发音风格等方面的特征,能够更加符合目标对象在目标场景下的真实发音情况,以此可以有效提高语音克隆效果。此外,本申请还提供了对应的装置及相关设备。