全球数字财富领导者

腾讯公司申请音频处理专利,模型的计算复杂度可以根据输入音频信号的采样率而自适应调整

2024-01-06 14:26:46
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:金融界2024年1月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“音频处理方法、装置、设备和存储介质“,公开号CN117351943A,申请日期为2023年10月。专利摘要显示,本申请提供了一种音频处理方法、模型训练方法和装置,涉及人工智能领域、音视频编解码领域。该音频处理方法包括:将输入的第一音频信号采样至第一采样率,得到第二音频信号;沿频域维度对第二音频信号的时频数据进行频带切分,得到至少两个子带;对该至少两个子带的时频数据进行编码,得到至少两个子带的编码特征向量;对该至少两个子带的编码特征向量进行残差向量量化,得到至少两个子带的编码特征量化结果;根据该至少两个子带的编码特征量化结果,得到第一音频信号的码流。模型的计算复杂度可以根据输入音频信号的采样率而自适应调整,且能够通过单一神经网络模型对不同采样率的音频信号进行编解码,避免了额外的模型训练和存储开销。

金融界2024年1月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“音频处理方法、装置、设备和存储介质“,公开号CN117351943A,申请日期为2023年10月。

专利摘要显示,本申请提供了一种音频处理方法、模型训练方法和装置,涉及人工智能领域、音视频编解码领域。该音频处理方法包括:将输入的第一音频信号采样至第一采样率,得到第二音频信号;沿频域维度对第二音频信号的时频数据进行频带切分,得到至少两个子带;对该至少两个子带的时频数据进行编码,得到至少两个子带的编码特征向量;对该至少两个子带的编码特征向量进行残差向量量化,得到至少两个子带的编码特征量化结果;根据该至少两个子带的编码特征量化结果,得到第一音频信号的码流。模型的计算复杂度可以根据输入音频信号的采样率而自适应调整,且能够通过单一神经网络模型对不同采样率的音频信号进行编解码,避免了额外的模型训练和存储开销。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go