[发明专利]一种分析行为政策匹配性的方法有效
申请号: | 202010211001.6 | 申请日: | 2020-03-24 |
公开(公告)号: | CN111428037B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 王成飞;李德朋 | 申请(专利权)人: | 合肥科捷通科技信息服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N20/00;G06Q40/00;G06Q50/26 |
代理公司: | 安徽顺超知识产权代理事务所(特殊普通合伙) 34120 | 代理人: | 陈波;徐文恭 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分析 行为 政策 匹配 方法 | ||
1.一种分析行为政策匹配性的方法,其特征在于,包括:
步骤S102,从预先配置的网站获取政策文本;
步骤S104,对该政策文本进行分类,得到所述政策文本所属的类别;其中,统计政策正文中的词频,选择关键词词频高的类别作为该政策的类型;或者,在政策的标题未匹配成功的情况下,正文的匹配使用机器学习来进行;其中,使用多组训练数据来进行训练,每一组训练数据均包括政策文本以及该政策文本所属的类别;在训练结束之后,训练得到的模型可以用来机器识别,该模型的输入为政策文本,输出的内容就是该政策的类别;
步骤S106,获取所述类别对应的提取方式,其中,所述提取方式用于指示从所述政策文本提取关键词和/或句子的方式,所述关键词和/或所述句子用于描述符合所述政策文本的行为,所述类别对应的提取方式是预先配置的;
步骤S108,使用上述提取方式从所述政策文本中提取关键词和/或句子,保存所述关键词和/或句子;
接收来自用户的获取请求,其中,获取请求用于获取政策文本,
响应于获取请求,向用户返回政策文本以及关键词和/或句子;
在接收到用户的所述获取请求之后,如果没有找到该请求对应的政策文本,则先执行如下政策查询步骤,执行所述政策查询步骤找到上述政策之后,再执行步骤S102到步骤S108中的步骤,得到关键词和/或句子之后,再向用户返回;其中,所述政策查询步骤包括:
步骤S204,对所述获取请求中的文本进行分词处理,得到多个词语;其中,分词的方式使用机器学习的方式来进行,训练一个模型,该模型使用多组训练数据训练得到,每一组训练数据包括一段文本以及人工对该文本进行分词之后得到的词语列表,该人工分词结果中仅仅包括关键的名词,所述关键的名词是人工提取的能够体现该文本中心思想并且在该文本中出现过的词语,通过使用这些训练数据训练得到的模型其输入为一段文本,输入的结果就是分词得到后的多个词语;
步骤S206,从多个词语中确定至少一个关键词,所述关键词作为检索使用的关键词;其中,选择关键词时,从多个关键词中与预先配置的无意义词表相匹配,其中,所述无意义词表预先保存了虚拟、助词和代词对文本含义理解无帮助的词,无意义词表用来过滤词语;匹配后的所有剩余的词语均作为关键词使用;多个词语被无意义词表匹配后还剩余N个词语,首先使用N个词语均作为关键词来进行检索,如果检索到的结果小于预定数量,则去掉一个关键词,再使用N-1个关键词来进行检索,如果检索结果仍然小于预定数据,则继续去掉关键词进行检索,直到检索结果的数量大于或等于所述预定数量,并且小于第二预定数量,其中,所述第二预定数量小于所述预定数量;
步骤S208,将检索使用的关键词在预先配置的多个网站内进行检索,得到该关键词对应的检索结果,将该检索结果中的内容作为步骤S102中的从预先配置的网站获取的政策文本,所述多个网站是被认证认可的网站。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥科捷通科技信息服务有限公司,未经合肥科捷通科技信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010211001.6/1.html,转载请声明来源钻瓜专利网。