[发明专利]一种在保险指南文章内查看文中保险产品的方法在审
申请号: | 202010306070.5 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111651553A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨喆;詹添淇;高帆;裴晋 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06Q40/08 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 保险 指南 文章 查看 文中 保险产品 方法 | ||
1.一种在保险指南文章内查看文中保险产品的方法,其特征在于包括:
第一步骤:对保险指南文章的文本进行预处理;
第二步骤:将预处理得到的词语进行特征提取以得到特征词;
第三步骤:将特征词与保险产品库中的商品属性做匹配,根据匹配度确定商品与保险指南文章的相关度;
第四步骤:将相关度最高的预定数量的商品呈现在前端。
2.根据权利要求1所述的在保险指南文章内查看文中保险产品的方法,其特征在于,预处理包括:将保险指南文章的文本中的字符串切分成合理的词语序列以及过滤词语序列中的虚词。
3.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,预处理还包括:将过滤后的词语序列中的未登录词录入语料库。
4.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,第二步骤包括:针对预处理得到的词语,根据词语在保险指南文章的出现的频率,通过TF-IDF算法计算词语的TF-IDF值,作为词语的权重值。
5.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,第二步骤还包括:针对预处理得到的词语,将保险指南文章标题、文本的首句和尾句中的词语的权重值增大。
6.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,第二步骤还包括:针对预处理得到的词语,对预定词语增大权重值。
7.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,在第二步骤,在对预处理得到的词语进行权重值赋值之后,将权重值最大的预定数量的词语提取为特征词。
8.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,在第三步骤,在每款保险商品在保险产品库入库时设置与之相关的标签,将特征词与标签进行匹配,而且在特征词与标签匹配时将匹配的标签所对应的商品的权值与特征词的权重值相加作为匹配的标签所对应的商品的新权值。
9.根据权利要求1或2所述的在保险指南文章内查看文中保险产品的方法,其特征在于,在第三步骤,根据商品的权值确定商品与保险指南文章的相关度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010306070.5/1.html,转载请声明来源钻瓜专利网。