[发明专利]基于人工智能分类语音输入文本的方法和装置在审
申请号: | 201710728382.3 | 申请日: | 2017-08-23 |
公开(公告)号: | CN107506434A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 梁一川;凌光;林英展;王文敏;谢泽颖;张寅;徐威;周超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G10L15/26 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 分类 语音 输入 文本 方法 装置 | ||
技术领域
本申请涉及计算机技术领域,具体涉及计算机网络技术领域,尤其涉及基于人工智能分类语音输入文本的方法和装置。
背景技术
人工智能(Artificial Intelligence,简称AI)技术的快速发展为人们的日常工作和生活提供了便利。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能越来越多地融入到应用中,结合人工智能的应用可以准确地确定出信息的种类,并按照不同用户的需求将不同种类的信息推送给相应的用户。
随着人工智能的飞速发展,如何让机器能拥有和人类一样的智能,成了无数企业希望做到的事情。在这个背景下,我们希望机器能够与用户进行语音智能交互。在语音智能交互服务的初期,收集的用户文本语料通常不完善,如何对这些文本语料进行分类的冷启动,是语音智能交互服务需要面对的问题。目前的语音智能交互服务,在面对文本分类冷启动这一类问题时,都需要收集大量的文本语料,完成对文本语料的人工标注后,才能进行分类训练。
然而,目前的语音智能交互服务,无法在服务初期通过有效方式较快进行文本分类。此外,进行人工标注需要投入大量的标注人力,标注效率较低。
发明内容
本申请的目的在于提出一种改进的基于人工智能分类语音输入文本的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种基于人工智能分类语音输入文本的方法,方法包括:获取用户语音查询的当前交互文本;采用词法分析器,分析当前交互文本,得到当前词法结构;判断当前词法结构是否命中分类器中各类别的模板;若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在一些实施例中,各类别的模板经由以下步骤确定:对于预定交互场景,获取预设的类别;获取各类别中出现频率高于预定频率的待泛化交互文本;接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在一些实施例中,方法还包括:若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在一些实施例中,方法还包括:获取待分类类别中出现频率高于预设频率的待处理交互文本;接收人工对待处理交互文本的分类操作;将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,将待处理交互文本分类至分类器中对应分类操作的类别中包括:若分类器中存在对应分类操作的类别,则直接将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,将待处理交互文本分类至分类器中对应分类操作的类别中包括:若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别;将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,方法还包括:接收人工对分类至分类器中各类别的待处理交互文本的泛化;根据泛化结果,更新分类器中各类别的模板。
第二方面,本申请实施例还提供了一种基于人工智能分类语音输入文本的装置,装置包括:当前文本获取单元,用于获取用户语音查询的当前交互文本;当前文本分析单元,用于采用词法分析器,分析当前交互文本,得到当前词法结构;命中模板判断单元,用于判断当前词法结构是否命中分类器中各类别的模板;当前文本分类单元,用于若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在一些实施例中,命中模板判断单元中各类别的模板经由以下单元确定:预设类别获取单元,用于对于预定交互场景,获取预设的类别;预定文本获取单元,用于获取各类别中出现频率高于预定频率的待泛化交互文本;预定文本泛化单元,用于接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在一些实施例中,装置还包括:当前文本待分类单元,用于若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在一些实施例中,装置还包括:待处理文本获取单元,用于获取待分类类别中出现频率高于预设频率的待处理交互文本;分类操作接收单元,用于接收人工对待处理交互文本的分类操作;待处理文本分类单元,用于将待处理交互文本分类至分类器中对应分类操作的类别中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710728382.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:城市发展空间格局情景模拟系统
- 下一篇:一种基于价格预测的特价机票查询方法