[发明专利]一种文本分析方法及装置有效
申请号: | 201710642370.9 | 申请日: | 2017-07-31 |
公开(公告)号: | CN107391489B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 向彪;张家兴;吴庚水;黄诗南;温祖杰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G10L15/26 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 周莉娜 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 分析 方法 装置 | ||
本说明书实施例公开了一种文本分析方法及装置。若待分析文本不符合预设的文本规则,则根据待分析文本中每个字符的先验概率和后验概率,对待分析文本进行修改,并对修改后的待分析文本进行分析。
技术领域
本申请涉及信息技术领域,尤其涉及一种文本分析方法及装置。
背景技术
自然语言处理技术常应用于诸多业务场景。例如,智能客服获取用户提供的文本,再利用自然语言处理技术分析该文本,最后根据分析结果为用户查询相应的解决方案。
众所周知,文本中语句表述的清楚程度直接影响针对文本的分析结果的准确性。基于现有技术,需要更为准确的文本分析方法。
发明内容
本说明书实施例提供一种文本分析方法及装置,以解决现有的文本分析方法准确性较差的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种文本分析方法,包括:
获取待分析文本;
判断所述待分析文本是否符合预设的文本规则;
若是,则对所述待分析文本进行分析;
否则,根据所述待分析文本中每个字符的先验概率和后验概率,修改所述待分析文本,并对修改后的待分析文本进行分析。
本说明书实施例提供的一种文本分析装置,包括:
获取模块,获取待分析文本;
判断处理模块,判断所述待分析文本是否符合预设的文本规则;若是,则对所述待分析文本进行分析;否则,根据所述待分析文本中每个字符的先验概率和后验概率,修改所述待分析文本,并对修改后的待分析文本进行分析。
本说明书实施例提供的一种文本分析设备,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
获取待分析文本;
判断所述待分析文本是否符合预设的文本规则;
若是,则对所述待分析文本进行分析;
否则,根据所述待分析文本中每个字符的先验概率和后验概率,修改所述待分析文本,并对修改后的待分析文本进行分析。
由以上本说明书实施例提供的技术方案可见,在本说明书实施例中,若待分析文本不符合预设的文本规则,则根据待分析文本中每个字符的先验概率和后验概率,对待分析文本进行修改,并对修改后的待分析文本进行分析。修改后的待分析文本符合所述文本规则,即修改后的待分析文本中的语句是清楚的,提升了分析结果的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种文本分析方法流程图;
图2是本说明书实施例提供的文本的规范性概率分布示意图;
图3本说明书实施例提供的修改待分析文本的示意图;
图4是本说明书实施例提供的一种文本分析装置示意图;
图5是本说明书实施例提供的一种文本分析设备示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710642370.9/2.html,转载请声明来源钻瓜专利网。