金融界2024年1月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“音频处理方法、装置、设备和存储介质“,公开号CN117351943A,申请日期为2023年10月。
专利摘要显示,本申请提供了一种音频处理方法、模型训练方法和装置,涉及人工智能领域、音视频编解码领域。该音频处理方法包括:将输入的第一音频信号采样至第一采样率,得到第二音频信号;沿频域维度对第二音频信号的时频数据进行频带切分,得到至少两个子带;对该至少两个子带的时频数据进行编码,得到至少两个子带的编码特征向量;对该至少两个子带的编码特征向量进行残差向量量化,得到至少两个子带的编码特征量化结果;根据该至少两个子带的编码特征量化结果,得到第一音频信号的码流。模型的计算复杂度可以根据输入音频信号的采样率而自适应调整,且能够通过单一神经网络模型对不同采样率的音频信号进行编解码,避免了额外的模型训练和存储开销。