[发明专利]一种会计术语共现网络图构建的方法在审
申请号: | 202111096537.9 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113919342A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 潘定;梁倬骞;叶迪 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/36;G06F40/30 |
代理公司: | 深圳科湾知识产权代理事务所(普通合伙) 44585 | 代理人: | 杨艳霞 |
地址: | 510630 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会计 术语 网络图 构建 方法 | ||
本发明公开了一种会计术语共现网络图构建的方法,所述方法包括对会计领域的语义基元进行提取,即对会计词典中的词汇构建有向网络图,利用改进后的PageRank算法进行语义基元的提取和领域知识的描述,再基于同义词林合并,最终得到会计术语的语义基元的候选集合。本发明利用会计领域知识的特点,针对会计词典语料设计了基于图论的语义基元抽取方法。会计词典作为会计领域重要专业语料和权威规范文本,系统全面地涵盖了会计领域有关术语及其定义。如果能借助从会计词典中抽取的语义基元,让计算机“读懂”会计文本,那么会计领域的大量信息将被得以有效利用,因此基于会计词典的术语研究有效突破了在语义基元抽取中的主观分析和小样本数据局限。
技术领域
本发明涉及计算机对于财务信息的可读取性的技术领域,尤其涉及一种会计术语共现网络图构建的方法。
技术背景
目前会计领域中网络财务报告缺少标准化的知识描述,因此在解决计算机对财务信息可读性方面遇到了困难,阻碍了XBRL等网络财务报告的使用广度和发展前景。目前少数学者基于当前流行的机器学习算法试图解决语义基元提取难点,这些方法虽然有效地减少了人工以及时间成本,但抽取出的术语存在大量噪声、领域特性不突出且无法验证其有效性。本发明的研究弥补了网络财务报告的研究空白,针对面向XBRL财务报告中“核心语言的提取”的关键问题予以研究,引入语义基元的概念,旨在增强会计领域知识表达的语义特性,有助于增强机器识别信息的准确性和效率性。
语义基元的成功提取有助于推动会计通用分类标准的质量水平,增强计算机对于财务信息的可读取性,提高利益相关者对于财务信息获取的准确性和效率性,减少网络财务报告应用和推广的技术壁垒,从而促进企业采纳网络财务报告的主动性。从更加长远和宏观的角度来看,本发明的研究可以提高信息披露的精准度和真实性,在一定程度上可以避免企业进行财务造假,有助于保护利益相关者的合法权益,维护市场的信息质量,具备一定的现实意义。
从现有的技术表明,少数人基于当前流行的机器学习算法试图解决本体构建难点,这些方法虽然有效的减少了人工以及时间成本,但抽取出的术语存在大量噪声、领域特性不突出且缺乏实务性。一般而言,语义基元的提取分为基于语言学、统计学、机器学习和图论等提取方法,但是这些方法都具有一定的局限性,具体的说:
1、目前的研究仅停留在词汇层面,没有深入到语义层面。
从相关研究中可以看出,目前针对该问题的研究大多停留在词汇层面,即用于构建本体的语义材料被认为是本体所需概念和冗余信息的集合,作者所采取的研究方法是对信息进行一定程度上的清洗和筛选,最终得到符合指标体系的关键词作为本体所需概念。但这种研究方法受限于所选的语义材料,其中基于语言学的提取方法处理的语义材料规模较小,而基于统计学、机器学习的方法虽然可以处理大规模文本,但是提取出的术语存在大量噪声、领域特性不突出且缺乏语义特性。
2、与领域知识的贴合度不够。
从语义基元提取方法的相关研究可以看出,提取语义基元所用的文本材料缺乏专业权威性,或者缺少领域专家的参与,使得提取出的语义基元和领域知识的贴合度不够。而本发明选取了会计词典作为财务报告领域权威且全面的文本材料,并且在分析本方法的有效性和优越性时,邀请了领域专家参与,旨在最大限度上保证提取出的语义基元和领域知识之间较高的匹配度。
3、研究视角单一,跨领域研究成果较少。
在已有的研究中,更多的概念提取是来自于文本材料的关键词,研究过程是对文本材料去除冗余信息,使得研究视角较为单一,且跨领域研究成果较少。
发明内容
针对现有技术的不足,本发明公开了一种会计术语共现网络图构建的方法,本发明利用会计领域知识的特点,运用会计词典选取了基于图论的语义基元抽取方法。词典作为会计领域权威规范文本,系统全面地涵盖了会计领域有关术语及其定义,如果能让计算机“读懂”会计词典,那么会计领域的大量信息将被得以有效利用,因此基于会计词典的研究有效突破了在语义基元抽取中主观分析和小样本数据的局限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096537.9/2.html,转载请声明来源钻瓜专利网。