全球数字财富领导者

腾讯公司取得模型训练专利,使预训练模型更好地适应于各种舞蹈类型的下游任务

2024-02-23 13:00:05
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:金融界2024年2月22日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种模型训练方法、装置、设备和存储介质“,授权公告号CN114528762B,申请日期为2022年2月。专利摘要显示,本申请公开一种模型训练方法、装置、设备和存储介质,可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。获取舞蹈视频中的视觉信息和音频信息,提取音频信息的起始点特征,起始点特征用于表征舞蹈视频中音频的乐理要素点,并且利用初始模型预测视觉信息的乐理要素点,从而根据视觉信息的乐理要素点和音频信息的起始点特征,对初始模型进行优化,以使视觉信息的乐理要素点与音频的乐理要素点对齐,得到预训练模型。本申请将视觉信息和音频的乐理要素点对齐作为代理任务实现模型预训练,考虑到了舞蹈视频中的一些独特特征,从而在无需数据标注的情况下,使得预训练模型更好地适应于各种舞蹈类型的下游任务,并且性能表现理想。

金融界2024年2月22日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种模型训练方法、装置、设备和存储介质“,授权公告号CN114528762B,申请日期为2022年2月。

专利摘要显示,本申请公开一种模型训练方法、装置、设备和存储介质,可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。获取舞蹈视频中的视觉信息和音频信息,提取音频信息的起始点特征,起始点特征用于表征舞蹈视频中音频的乐理要素点,并且利用初始模型预测视觉信息的乐理要素点,从而根据视觉信息的乐理要素点和音频信息的起始点特征,对初始模型进行优化,以使视觉信息的乐理要素点与音频的乐理要素点对齐,得到预训练模型。本申请将视觉信息和音频的乐理要素点对齐作为代理任务实现模型预训练,考虑到了舞蹈视频中的一些独特特征,从而在无需数据标注的情况下,使得预训练模型更好地适应于各种舞蹈类型的下游任务,并且性能表现理想。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go