[发明专利]一种基于引文、图与结构的科技文献差异生成方法在审
申请号: | 202210973133.1 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115329065A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 蔡超翔;陈景强;王凯 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06F16/36;G06F16/901;G06K9/62 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 姜梦翔 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 引文 结构 科技 文献 差异 生成 方法 | ||
1.一种基于引文、图与结构的科技文献差异生成方法,其特征在于,所述方法步骤为:
步骤1:整合引文功能标注方法,设计针对对比引文敏感的引文功能标注方法,对文献中的引文进行功能标注;
步骤2:从所标注的引文中筛选出对比引文,并收集与之对应的文献;
步骤3:构建文献集合的对比图,并对文献中的句子关系得分进行计算;
步骤4:结合结构理论对文献中的句子结构得分进行计算;
步骤5:综合考虑文献中的句子关系得分和句子结构得分来对句子进行排序和抽取,最终构成目标差异内容。
2.根据权利要求1所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,步骤1中,整合经典的引文功能标注方法,将功能类别重新分类、映射与定义,并将原属于其他功能类别中的有一定程度对比线索的引文重新划分到对比类别中,进而提出了对捕捉对比引文敏感的引文功能标注方法。
3.根据权利要求1所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,步骤2中,仅从标注的引文集合中收集对比引文,并收集与所述对比引文对应的施引文献和被引文献,构成可比较的文献集合。
4.根据权利要求1所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,步骤3中,构建文献集合的对比图,并对文献中的句子关系得分进行计算的具体步骤为:
步骤3-1:构建文献集合的对比图,该对比图包含了文献或引文的子图、句子的节点以及三种句子间关系的边,其中文献或引文的子图表示文献或引文内容本身,句子的节点表示文献或引文中的句子,三种句子间关系的边表示三种句子间的关系:文献内句子关系、文献间句子关系和引文相关句子关系;文献内句子关系考虑文献内的句子来捕捉文献内的突出性;文献间句子关系考虑文献间的句子来捕捉文献间的差异性;引文相关句子关系考虑文献句子与引文的相似性来捕捉文献间的相关性。
步骤3-2:基于构建的文献集合的对比图,采用图方法计算句子关系得分;句子包含三种关系得分,获取句子向量,再计算相似度用以衡量不同关系得分;
文献内得分:文献中的句子用SS表示,下标s表示在文献中的位置;记位于其前面的句子集合为Pre,Spre表示集合Pre中的句子,下标pre表示在Pre中的位置;记位于其后面的句子集合为Aft,Saft表示集合Aft中的句子,下标aft表示在Aft中的位置;用α与β两个系数表示计算与后、前句子相似度时的系数,且α,β∈[0,1];句子SS的文献内突出性得分如下式子所示;
文献间得分:施引文献是引文出现的文献,被引文献是引文引用的文献;施引文献CP中的句子用Scp表示,下标cp表示句子在施引文献中的位置;被引文献集合RPs中的句子用Srp表示,下标rp表示句子在被引文献集合中的位置;句子Scp的文献间差异性得分如下式子所示;
引文相关得分:文献中的句子用Sp表示,下标p表示在文献中的位置;引文CIT中的句子用Scit表示,下标cit表示在引文中的位置;句子Sp的引文相关共同性得分如下式子所示;
5.根据权利要求1所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,步骤4中,引入了跨文档与修辞两种结构理论,将句子语义结构拓展至多个维度进行分析;其中跨文档结构理论针对文献间的句子结构关系,修辞结构理论针对文献内的句子结构关系;首先为每种结构关系进行分值预设,对比的跨文档或修辞结构关系是本发明重点关注的句子结构类型,则给予高分;之后分别对文献中句子的跨文档结构类型与修辞结构类型进行分类,根据所得结构关系类别并参照其对应的预设分值得到每个句子的两种结构理论得分。
6.根据权利要求1所述的一种基于引文、图与结构的科技文献差异生成方法,其特征在于,在步骤5中,综合考虑各文献中句子的关系得分和结构得分,并按分值由高到低依次对句子进行排序,之后从各文献中按照预设的句子数以及分值依次从上往下选择句子最终构成差异内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210973133.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:反应腔室和晶圆对准方法
- 下一篇:一种高回油能力的硅油离合器