[发明专利]一种基于深度学习的中文自然语言处理方法在审
申请号: | 201911315276.8 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111104499A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 赵良军 | 申请(专利权)人: | 四川轻化工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G10L15/26 |
代理公司: | 北京彭丽芳知识产权代理有限公司 11407 | 代理人: | 胡若玲 |
地址: | 643000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 中文 自然语言 处理 方法 | ||
本申请涉及一种基于深度学习的中文自然语言处理方法,所述方法包括:语义处理系统接收语句数据,得到语句文字数据;提取语句文字数据中的固定语信息和泛化对象信息;判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;呈现信息或命令的执行结果。本发明具有高效、智能、准确的学习特点。
技术领域
本发明涉及数据处理技术领域,,具体涉及一种基于深度学习的中文自然语言处理方法。
背景技术
随着自然语言理解技术的普及,不同的行业都会面临一个共同的问题,深度学习需要特定领域庞大的语料作驱动。对于不同的应用领域来说,如何获取有效的数据,成为问题的核心。大部分任务在创建之初并没有可供使用的特定语料,因此很难在特定的领域实现不同人机的对话;同时对于自然语言的处理,也无法准确确定自然语言处理结果,向终端等设备呈现的结果也不准确,导致在人机沟通的过程中降低用户的体验感。
发明内容
为解决上述问题,本发明提供了一种基于深度学习的中文自然语言处理方法。
为实现上述目的,本发明采取的技术方案为:
一种基于深度学习的中文自然语言处理方法,包括:
语义处理系统接收语句数据,得到语句文字数据;
提取语句文字数据中的固定语信息和泛化对象信息;
判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;
提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;
呈现信息或命令的执行结果。
具体的,提取所述第一语句的一个或多个关键词包括:
对所述第一语句进行分词得到多个词语;
使用所述多个词语与预先配置的多个模板进行匹配,其中,所述模板是指由多个语义元组成的连贯语义模式,每个所述语义元有预先设定的与所述模板对应的语义贡献度,所述语义元是指具有相同或近似语义的关键词集合;
从所述多个模板中获取第一模板,所述第一模板是指与所述多个词语部分或全部语义关联度最高的模板;
具体的,当所述骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将所述骨干结构存储至所述知识库中。
具体的,语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,得到语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。
本发明具有以下有益效果:本发明具有高效、智能、准确的学习特点。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川轻化工大学,未经四川轻化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911315276.8/2.html,转载请声明来源钻瓜专利网。