[发明专利]法规文件花脸稿的生成方法、生成系统及相关设备有效
申请号: | 202310401971.6 | 申请日: | 2023-04-17 |
公开(公告)号: | CN116136839B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 刘跃华;杨帆;刘梓韵 | 申请(专利权)人: | 湖南正宇软件技术开发有限公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F40/166;G06F40/194;G06F40/216;G06F40/284;G06Q50/18;G06F16/16 |
代理公司: | 深圳市特讯知识产权代理事务所(普通合伙) 44653 | 代理人: | 孟智广 |
地址: | 410000 湖南省长沙市长沙高新开发区*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法规 文件 花脸 生成 方法 系统 相关 设备 | ||
1.一种法规文件花脸稿的生成方法,其特征在于,所述法规文件花脸稿的生成方法包括以下步骤:
接收用户上传的版本一法规文件和版本二法规文件;
对所述版本一法规文件和所述版本二法规文件进行层级拆分,分别获得版本一层级文本集合和版本二层级文本集合;
基于余弦相似度对所述版本一层级文本集合和所述版本二层级文本集合进行逐层文本比对,找出所述版本一层级文本集合和所述版本二层级文本集合之间的文本映射关系;
基于尼德曼-翁施算法对所述版本一层级文本集合和所述版本二层级文本集合各层级的文本进行比对,记录每个字符的状态、位置以及出现的次数;
基于所述版本一层级文本集合和所述版本二层级文本集合各层级文本中每个所述字符的状态、位置以及出现的次数生成各层级的组合文本;
对各层级的所述组合文本按照所述版本一法规文件和所述版本二法规文件中更新日期最新的版本进行排序操作,获得底稿文本;
利用文本编辑器将所述底稿文本中的各个所述字符渲染成适配的状态样式,得到花脸稿;
所述基于余弦相似度对所述版本一层级文本集合和所述版本二层级文本集合进行逐层文本比对,找出所述版本一层级文本集合和所述版本二层级文本集合之间的文本映射关系包括:
对于所述版本一层级文本集合和所述版本二层级文本集合的同层级文本,从所述版本一层级文本集合中获取得到待对比文本一,从所述版本二层级文本集合中获取得到待对比文本二;
对于所述待对比文本一进行分词处理,获得待对比文本一词集以及所述待对比文本一词集中各词的词频,并基于所述待对比文本一词集中各词的词频构建得到所述待对比文本一的词向量表示;
对于所述待对比文本二进行分词处理,获得待对比文本二词集以及所述待对比文本二词集中各词的词频,并基于所述待对比文本二词集中各词的词频构建得到所述待对比文本二的词向量表示;
基于所述待对比文本一的词向量表示和所述待对比文本二的词向量表示并通过余弦相似度计算公式获得所述待对比文本一和所述待对比文本二的相似度;
基于所述相似度找出所述版本一层级文本集合和所述版本二层级文本集合中的对应文本组合和独立文本,建立所述对应文本组合之间的映射关系;
所述基于尼德曼-翁施算法对所述版本一层级文本集合和所述版本二层级文本集合各层级的文本进行比对,记录每个字符的状态、位置以及出现的次数包括:
依序获取所述版本一层级文本集合和所述版本二层级文本集合各层级中的所述对应文本组合和所述独立文本;
当获取到所述对应文本组合,建立所述对应文本组合中对应文本一和对应文本二的LCS矩阵表格;
利用LCS公式计算得到所述LCS矩阵表格中各行的数值;
从所述LCS矩阵表格的右下角开始按照尼德曼-翁施算法的回溯法则获得所述LCS矩阵表格的回溯路径;
基于所述回溯路径获得所述对应文本组合的匹配字符串;
基于所述匹配字符串和所述对应文本组合,逻辑分析出所述对应文本组合中每个所述字符的状态,并记录下所述对应文本组合中每个所述字符的状态、位置以及出现的次数;
当获取到所述独立文本,判断所述独立文本是属于新增内容还是删除内容,基于所述独立文本是属于新增内容还是删除内容获得所述独立文本中每个所述字符的状态,并记录下所述独立文本中每个所述字符的状态、位置以及出现的次数。
2.根据权利要求1所述的法规文件花脸稿的生成方法,其特征在于,所述基于所述版本一层级文本集合和所述版本二层级文本集合各层级文本中每个所述字符的状态、位置以及出现的次数生成各层级的组合文本包括:
依序获取每一层级的所述对应文本组合和所述独立文本;
对于所述对应文本组合,获取所述对应文本组合中所述对应文本一和所述待对比文本二包括的所有所述字符组成的字符集;
基于记录的所述对应文本组合中每个所述字符的状态、位置以及出现的次数对所述字符集进行去重处理,获得筛选字符集;
利用所述筛选字符集生成所述对应文本组合的组合文本;
对于所述独立文本,直接将所述独立文本并入到所述对应文本组合的所述组合文本中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南正宇软件技术开发有限公司,未经湖南正宇软件技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310401971.6/1.html,转载请声明来源钻瓜专利网。