您的位置: 首页 > 农业专利 > 详情页

音频提取方法、装置、计算机设备和存储介质
专利权人:
深圳市大数据研究院
发明人:
刘清华,葛檬,武执政,李海洲
申请号:
CN202311010670.7
公开号:
CN117174106A
申请日:
20230811
申请国别(地区):
CN
年份:
2023
代理人:
夏冰
摘要:
本申请涉及音频提取方法、装置、计算机设备和存储介质。所述方法包括:获取训练好的目标音频提取网络模型、待处理音频和目标对象对应的待处理视频;分别对基于目标音频提取网络模型对待处理视频做姿态标准化操作得的姿态标准视频和待处理视频做视觉特征提取得第一视觉特征和第二视觉特征,将第一视觉特征和第二视觉特征融合得目标视觉特征;基于目标音频提取网络模型对待处理音频做音频特征提取得初始音频特征,目标视觉特征和初始音频特征融合得目标对象对应的目标掩蔽特征;将基于目标音频提取网络模型将初始音频特征和目标掩蔽特征融合得的目标融合特征输入音频解码器得目标对象对应的目标音频。采用本方法能提高提取特定说话者声音的准确性①
来源网站:
中国工程科技知识中心
来源网址:
http://www.ckcest.cn/home/

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充