金融界2023年12月20日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“语音识别方法、装置、计算机可读介质及电子设备“,授权公告号CN113421551B,申请日期为2020年11月。
专利摘要显示,本申请属于人工智能技术领域,具体涉及一种语音识别方法、装置、介质及电子设备。该方法包括:获取待识别语音数据以及与待识别语音数据相对应的语音参考文本;对待识别语音数据进行特征提取得到待识别语音数据的语音解码特征,并根据语音解码特征预测待识别语音数据的第一文本概率分布;对语音参考文本进行特征提取得到语音参考文本的文本编码特征,并根据文本编码特征与语音解码特征的相似度预测待识别语音数据的第二文本概率分布;对第一文本概率分布和第二文本概率分布进行融合处理得到待识别语音数据的综合文本概率分布;根据综合文本概率分布从候选文本中选取作为待识别语音数据的语音识别结果的目标文本。该方法可以提高语音识别准确性。
本文源自:金融界
作者:情报员