[发明专利]同义词典的优化方法、装置、设备及存储介质在审
申请号: | 202011141162.9 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112269858A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 高预皓;彭晶 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/247;G06F40/30 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518033 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同义 词典 优化 方法 装置 设备 存储 介质 | ||
1.一种同义词典的优化方法,其特征在于,所述同义词典的优化方法包括:
利用同义词识别算法提取同义词典中的所有同义词集和同义词集之间的附属关系,并基于所述附属关系创建所述同义词典的连接关系图,其中所述连接关系图包括同义词集之间的连接关系和同义词与同义词之间的连接关系;
通过networkx将所述连接关系图转换为网络结构;
利用所述networkx中的探测算法探测所述网络结构中连接于两个同义词集之间的两节点,并计算两个节点之间的最短路径和介数;
判断所述介数是否满足同义词组的构建条件;
若不满足,则从所述网络结构中识别出与所述介数对应的第一同义词组,并将所述第一同义词组中的连接关系进行拆分,生成两个相互独立的同义词集,得到新的同义词典。
2.根据权利要求1所述的同义词典的优化方法,其特征在于,所述通过networkx将所述连接关系图转换为网络结构包括:
通过调用所述networkx中的python networkx模块,以所有同义词集作为网络节点,根据所述附属关系构建连接所述网络节点的链接网络,得到所述网络结构。
3.根据权利要求2所述的同义词典的优化方法,其特征在于,所述通过调用所述networkx中的python networkx模块,以所有同义词集作为网络节点,根据所述附属关系构建连接所述网络节点的连接网络,得到所述网络结构包括:
从所述连接关系图中随机选择一个节点,以所述节点为中心点,从剩余的节点中选择若干个节点添加至所述中心点上,并建立连接路径;
计算所述中心点与若干个节点之间的边介数,并判断是否满足预设介数阈值;
若不满足,则继续添加节点,并计算所述中心点的总节点数和其与每个节点的最短路径,基于最短路径建立所述网络结构。
4.根据权利要求1-3中任一项所述的同义词典的优化方法,其特征在于,所述利用networkx模块的探测算法探测所述网络结构中连接于两个同义词集之间的两节点,并计算两个节点之间的最短路径和介数包括:
利用探测算法探测所述网络结构中任意两个同义词集之间的所有连接节点;
计算所有连接节点中两两连接节点之间的连接路径;
计算所述连接路径的路径长度,基于路径长度选择最短的一条作为两个同义词集之间的最佳连接路径,并删除其他的连接路径;
通过python networkx模块,计算所述最佳路径上的两个节点之间的边的介数。
5.根据权利要求1-3中任一项所述的同义词典的优化方法,其特征在于,所述从所述网络结构中识别出与所述介数对应的第一同义词组,并将所述第一同义词组中的连接关系进行拆分,生成两个相互独立的同义词集,得到新的同义词典包括:
确定所述介数对应的同义词,并标记所述同义词以及所述同义词所在的路径;
根据所述标记,调用路径切割算法,以所述同义词所在的路径为优化对象,对其进行分解处理,形成两个游离状态的同义词集,直到分解完所述网络结构中的所有不满足所述构建条件的同义词组后,得到新的同义词典。
6.一种同义词典的优化装置,其特征在于,所述同义词典的优化装置包括:
提取模块,用于利用同义词识别算法提取同义词典中的所有同义词集和同义词集之间的附属关系,并基于所述附属关系创建所述同义词典的连接关系图,其中所述连接关系图包括同义词集之间的连接关系和同义词与同义词之间的连接关系;
转换模块,用于通过networkx将所述连接关系图转换为网络结构;
探测模块,用于利用所述networkx中的探测算法探测所述网络结构中连接于两个同义词集之间的两节点,并计算两个节点之间的最短路径和介数;
判断模块,用于判断所述介数是否满足同义词组的构建条件;
优化模块,用于在所述判断模块判断不满足构建条件时,从所述网络结构中识别出与所述介数对应的第一同义词组,并将所述第一同义词组中的连接关系进行拆分,生成两个相互独立的同义词集,得到新的同义词典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011141162.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种环保型园林施工方法
- 下一篇:仓储管控系统