近日,阿里巴巴(bā)公开一项“语音识别方法及装置”相(xiàng)关(guān)专利(lì),该专利于2019年(nián)7月4日申请,2021年1月22日(rì)公开(kāi),公开号为CN112259089A。
根据专(zhuān)利摘(zhāi)要(yào),本申请实施例提供了一种语音识别方法及装(zhuāng)置,涉及人(rén)工智能领域。其中,所述(shù)方(fāng)法(fǎ)包括:获取第一音频样本的音频数据帧(zhēn)与第一音频样本对(duì)应(yīng)的文本(běn)标(biāo)注数据的上下(xià)文相(xiàng)关音(yīn)素的第(dì)一强制对齐结果;基于(yú)第一强制对(duì)齐结果,确定第一音频样本的(de)音频(pín)数据帧关于待训练的唤醒声学模型的音(yīn)素标(biāo)注数据;基于音素标注(zhù)数据,对待训练(liàn)的唤醒声学模型进(jìn)行训(xùn)练(liàn),其中,唤(huàn)醒声学模型的输出层中设(shè)置有(yǒu)针对唤醒词的唤醒(xǐng)词相关输出(chū)部(bù)分和唤(huàn)醒词无关输出部分(fèn)。
通过(guò)本申请实施例,使得训练后的唤醒声(shēng)学模型(xíng)在兼顾语音(yīn)唤醒性(xìng)能的(de)同(tóng)时,能够有效降低对设(shè)备端(duān)的计算资源的使用。
阿里(lǐ)巴巴的这项专(zhuān)利很有可(kě)能用在(zài)智能设备(bèi)上,如(rú)智能(néng)音响。2017年7月5日,阿里(lǐ)巴巴集团阿(ā)里(lǐ)云智(zhì)能事业(yè)群推出AI智(zhì)能终(zhōng)端品牌——天(tiān)猫精灵,让用(yòng)户以自(zì)然语言对话的交互方式,实(shí)现影音娱乐、购物(wù)、信息查询(xún)、生活服(fú)务等功(gōng)能操作,成为作为(wéi)消费者的家庭助手。
去年5月,在天猫精灵发布会上,提(tí)出了“双百计划”,即将投入 100亿元进行生(shēng)态建设,与合作伙(huǒ)伴共同推出 100 款千万级智(zhì)能产品。