[发明专利]一种会计术语共现网络图构建的方法在审
申请号: | 202111096537.9 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113919342A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 潘定;梁倬骞;叶迪 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/36;G06F40/30 |
代理公司: | 深圳科湾知识产权代理事务所(普通合伙) 44585 | 代理人: | 杨艳霞 |
地址: | 510630 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会计 术语 网络图 构建 方法 | ||
1.一种会计术语共现网络图构建的方法,其特征在于,所述方法包括对会计领域的语义基元进行提取,通过对会计领域重要专业语料的会计词典构建有向网络图,利用改进后的PageRank算法进行语义基元的提取和领域知识的描述,再基于同义词林合并,最终得到语义基元的候选集合。
2.根据权利要求1所述的会计术语共现网络图构建的方法,其特征在于,具体所述方法包括:
S1手工提取、整理会计术语的定义文本,并汇总于Excel中;
S2对步骤S1中的汇总Excel进行文本切词、去停用词、去重处理;
S3构建会计术语有向网络图;
S4基于步骤S3的会计词典构建网络图后,利用MATLAB R2016a计算出各节点的PageRank值,作为语义基元提取的依据;
S5计算出PageRank值较高的词语后,对其进行基于同义词林的语义基元合并后,得到最终语义基元的候选集合。
3.根据权利要求2所述的会计术语共现网络图构建的方法,其特征在于,所述步骤S2中,利用Python自带的jieba包进行切词,值得注意的是,为了保证会计术语的完备性,需要将会计词典中的会计术语导入自定义词典,并建立停用词表对每个术语的定义文本中的词语进行去重处理。
4.根据权利要求2所述的会计术语共现网络图构建的方法,其特征在于,所述步骤S3中,依据切词结果,对文本进行有向环路图的构建;其中,以词汇及切词后的定义文本词汇为节点,词汇和定义文本词汇间有一条有向边,具体是词汇指向若干个定义文本词汇,并且,若某一词汇A的定义文本中如果出现另一个词汇B,那么词汇A、词汇B之间就存在一条有向边,具体是词汇A指向词汇B的一条有向边。
5.根据权利要求2所述的会计术语共现网络图构建的方法,其特征在于,所述步骤S5中,提取出的语义基元集中在非会计术语集合中,而基于会计词典在编撰过程中语言表达的多样式,提取出的语义基元存在着定义相近形式不同的词汇,因此需要对该类词汇予以合并,较大程度的保证语义基元的表达效率。
6.根据权利要求2所述的会计术语共现网络图构建的方法,其特征在于,所述步骤S4中的核心程序为:
pr=centrality(G,‘pagerank’,‘Followprobability’,0.85)
G.Nodes.PageRank=pr
G.Nodes.InDegree=indegree(G)
G.Nodes.OutDegree=outdegree(G)
G.Nodes%查看每个节点的PR得分和级别信息
plot(G,‘NodeLabel’,{},‘NodeColor’,[0.93 0.78 0],‘Layout’,‘force’)
title(‘PageRank’)%使用强制布局绘制图表
pr=centrality(G,‘pagerank’,‘MaxIterations’,200,‘FollowProbability’,0.85)
%使用200次迭代和阻尼因子0.85计算G的PageRank得分,将得分和级别信息添加到图形的节点表中
G.Nodes=sortrows(G.Nodes,‘PageRank’,‘descend’)
%按PR值降虚排列
H=subgraph(G,find(G.Nodes.PageRank0.005))
plot(H,‘NodeLabel’,{},‘NodeCData’,H.Nodes.PageRank,‘Layout’,‘force’)
title(‘PageRank’)
colorbar
%提取并绘制包含得分大于0.005的所有节点的子图,根据图形节点的PageRank得分为它们着色。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096537.9/1.html,转载请声明来源钻瓜专利网。