[发明专利]文本高亮显示方法、装置、设备及存储介质在审
申请号: | 202210255864.2 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114637839A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 陈凡 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F16/31;G06F16/33;G06F40/289 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 严林;钟良 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 显示 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能技术,提供一种文本高亮显示方法、装置、设备及存储介质。该方法根据搜索语句中的语句分词构建语句前缀树,基于语句前缀树将待匹配文本中每个文本语句与语句分词进行匹配处理,得到匹配语句及匹配索引信息,根据匹配索引信息从匹配语句中筛选目标语句,根据目标语句在待匹配文本中所处的文本位置对匹配索引信息进行调整,得到高亮位置,获取展示框的展示框长度,根据目标语句的语句长度、展示框长度及高亮位置对目标语句进行展示,提高检索效率及能够避免在查看文本时高亮信息不显示的问题。此外,本发明还涉及区块链技术,所述目标语句可存储于区块链中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种文本高亮显示方法、装置、设备及存储介质。
背景技术
在拥有高亮显示的检索系统中,可以很直观的查看到资源中有多少内容与搜索信息匹配,从而能够辅助用户快速的定位出想要查看的具体资源。
在目前的高亮显示方案中,通常是利用正则匹配算法从资源文本中匹配出与搜索文本相匹配的信息进行展示,然而,这种方式存在检索时间长及查看文本时高亮信息不显示等问题。
发明内容
鉴于以上内容,有必要提供一种文本高亮显示方法、装置、设备及存储介质,不仅能够提高检索效率,还能够避免在查看文本时高亮信息不显示的问题。
一方面,本发明提出一种文本高亮显示方法,所述文本高亮显示方法包括:
获取搜索语句,并获取待匹配文本;
根据所述搜索语句中的语句分词构建语句前缀树;
基于所述语句前缀树将所述待匹配文本中每个文本语句与所述语句分词进行匹配处理,得到所述待匹配文本中与所述语句分词相匹配的匹配语句及所述匹配语句的匹配索引信息;
根据所述匹配索引信息从所述匹配语句中筛选目标语句;
根据所述目标语句在所述待匹配文本中所处的文本位置对所述匹配索引信息进行调整,得到高亮位置;
获取展示框的展示框长度;
根据所述目标语句的语句长度、所述展示框长度及所述高亮位置对所述目标语句进行展示。
根据本发明优选实施例,所述根据所述搜索语句中的语句分词构建语句前缀树包括:
基于预设词典对所述搜索语句进行分词处理,得到多个所述语句分词;
将每个语法分词作为根结点的结点链路,并将每个语法分词中的每个分词字符依次作为所述结点链路中的子结点构建初始前缀树;
检测所述初始前缀树中处于同一层级的结点中是否存在重复分词字符,并将包含有所述重复分词字符的连续层级确定为层级链路;
将所述根结点的子结点所处的层级确定为目标层级,并将包含有所述目标层级的层级链路中与重复分词字符对应的结点进行合并,得到中间前缀树;
基于所述语句分词生成所述中间前缀树中每个结点的结点状态;
将所述结点状态写入所述中间前缀树,得到所述语句前缀树。
根据本发明优选实施例,所述基于所述语句前缀树将所述待匹配文本中每个文本语句与所述语句分词进行匹配处理,得到所述待匹配文本中与所述语句分词相匹配的匹配语句及所述匹配语句的匹配索引信息包括:
基于预设符号对所述待匹配文本进行切分,得到多个所述文本语句;
根据所述多个文本语句中每个文本字符在所述待匹配文本中的位置生成字符索引值;
对于每个文本语句,根据所述字符索引值从小至大的顺序从该文本语句中筛选出第一字符,并将所述第一字符与所述语句前缀树中的每个结点进行比较;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210255864.2/2.html,转载请声明来源钻瓜专利网。