[发明专利]项目查重方法、装置、设备及存储介质在审
申请号: | 201910539972.0 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110377886A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 崔德冠 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F16/35;G06K9/62 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及人工智能,公开一种项目查重方法、装置、设备及存储介质,该方法包括:获取项目文本,将项目文本划分为待测短文本集和待测长文本集;查找待测短文本集对应的基准短文本,并获取其与待测短文本集之间的第一相似度;若第一相似度低于预设相似度阈值,则查找待测长文本集对应的基准长文本并获取其与待测长文本集之间的第二相似度;根据第二相似度获取查重结果,由于是先根据短文本集对应的基准短文本对短文本集进行相似度检测,在获取到的相似度不能判定项目的查重情况时,再通过计算长文本集和基准长文本之间的相似度对待查重项目进行查重结果判定,相较于现有的文本查重方式,使得查重结果更加准确、真实,也提高了文本查重的效率。 | ||
搜索关键词: | 长文本 相似度 短文本集 重结果 存储介质 项目文本 短文本 判定 文本 相似度获取 相似度检测 人工智能 查找 预设 | ||
【主权项】:
1.一种项目查重方法,其特征在于,所述方法包括:获取待查重项目对应的项目文本,按预设文本维度将所述项目文本划分为待测短文本集和待测长文本集;从预设查重语料库中查找所述待测短文本集对应的基准短文本,并获取所述待测短文本集与所述基准短文本之间的第一相似度;若所述第一相似度低于预设相似度阈值,则从所述预设查重语料库中查找所述待测长文本集对应的基准长文本,并获取所述待测长文本集与所述基准长文本之间的第二相似度;根据所述第二相似度获取所述待查重项目对应的查重结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910539972.0/,转载请声明来源钻瓜专利网。