您的位置:
首页
>
农业专利
>
详情页
音频提取方法、装置、计算机设备和存储介质
- 专利权人:
- 深圳市大数据研究院
- 发明人:
- 刘清华,葛檬,武执政,李海洲
- 申请号:
- CN202311010670.7
- 公开号:
- CN117174106A
- 申请日:
- 20230811
- 申请国别(地区):
- CN
- 年份:
- 2023
- 代理人:
- 夏冰
- 摘要:
- 本申请涉及音频提取方法、装置、计算机设备和存储介质。所述方法包括:获取训练好的目标音频提取网络模型、待处理音频和目标对象对应的待处理视频;分别对基于目标音频提取网络模型对待处理视频做姿态标准化操作得的姿态标准视频和待处理视频做视觉特征提取得第一视觉特征和第二视觉特征,将第一视觉特征和第二视觉特征融合得目标视觉特征;基于目标音频提取网络模型对待处理音频做音频特征提取得初始音频特征,目标视觉特征和初始音频特征融合得目标对象对应的目标掩蔽特征;将基于目标音频提取网络模型将初始音频特征和目标掩蔽特征融合得的目标融合特征输入音频解码器得目标对象对应的目标音频。采用本方法能提高提取特定说话者声音的准确性①
- 来源网站:
- 中国工程科技知识中心
- 来源网址:
- http://www.ckcest.cn/home/