[发明专利]软件自动化方法与系统以及构建自然语言理解库的方法在审
申请号: | 201710013071.9 | 申请日: | 2017-01-09 |
公开(公告)号: | CN107340999A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 黄培红;汪湛清 | 申请(专利权)人: | 北京理工大学;黄培红 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;G06F9/45;G06F17/27 |
代理公司: | 北京理工大学专利中心11120 | 代理人: | 仇蕾安 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 软件 自动化 方法 系统 以及 构建 自然语言 理解 | ||
1.一种软件自动化方法与系统,其特征在于,该方法或系统包括步骤A、将接收的描述信息进行理解处理,获得描述信息的语法语义结构;该描述信息包括多个句子的语法语义结构,即语法语义结构集;此为理解模块(自然语言理解系统);B、根据描述信息的语法语义结构集提取确定难解性元素;难解性元素即初始问题串。C、利用难解性元素推演公式展开问题串,直到该问题串没有难解性元素为止,BC为推演模块;D、根据最终的问题串整理出动作序列,并对该动作序列形式化,输出与该描述信息对应的程序语句序列集,此为形式化模块。
2.根据权利要求1所述的方法或系统,其特征在于,所述步骤A之前进一步包括A’、采集格式化或非格式化的词汇信息记录,预先实施结构化处理后,生成词汇语义知识库(常识库),此为构建自然语言理解库的方法与构建模块。所述步骤A’包括A’1、判断所述词汇定义方法是否是格式化方法,如果是,则执行步骤Α’2、采集格式化的词汇信息,生成词汇语义知识库,否则,执行步骤A’3、采集非格式化的词汇信息,生成词汇语义知识库。
3.根据权利要求2所述的方法,其特征在于,所述步骤A’2所述采集格式化的词汇信息,生成词汇语义知识库,包括A’21、确定需自动采集的词汇点,为所述需采集的词汇点分配词汇ID;A’22、根据所述需自动采集的词汇点,对词汇信息记录进行采集,根据格式化标志获得与所述需自动采集的词汇点对应的词汇语义信息与相关知识,为所述词汇信息包含的词汇语义分配语义点ID;A’23、将所述词汇信息以五元组的形式进行存储;任一所述词汇点的五元组包含词语ID(词汇)、知觉语义、语义点ID、例子及相关知识。
4.根据权利要求2所述的方法,其特征在于,上述方法中,步骤A’3所述采集非格式化的词汇信息记录,生成词汇语义知识库包括A’31、确定需自动采集的词汇点,为所述需采集的词汇点分配词汇ID;A’32、对确定进行采集的词汇信息实施词法分析与语法分析等格式化步骤;A’33、识别该已格式化的所述自动采集的词汇信息点包含的词汇,获得词汇点;确定词语的语义与相应知识,并分配词语语义点ID;Α’34、从意思描述记录中选择包含的语义点信息并理解输出对应的知觉语义结构集;Α’35、通过例子(知识)理解获得精细化的语义点信息。A’36、将所确定的词汇信息以五元组的形式进行存储;任一所述词汇点的五元组包含词语ID(词汇)、知觉语义、语义点ID、例子及相关结构化知识,这些五元组形式保存的词汇点信息集合组成该系统的词汇语义知识库(自然语言语义理解库)。
5.根据权利要求2-4所述的方法,其特征在于,步骤A’2与A’3所述的语义与知识,其储存形式都是结构化的。所述步骤Α’35通过例子理解获得精细化的语义点信息,这些信息包括词性知觉,并使得词汇定义的知觉语义集落到实处。
6.根据权利要求4与权利要求1所述的方法与系统,其特征在于,所述步骤A’32与步骤A的词汇理解,包括对词汇库的匹配,即将接收到的描述信息逐次对词汇库执行匹配,并根据what-why理解效应与知觉集理解的基础上,进行词汇对应的语义的理解判定,并把理解结果输出到语法分析单元,此为所述理解模块的词语(词汇)理解单元。所述步骤A’32与步骤A的语法分析,包括词语序集对知识库的知识或语义模板进行匹配,对应的知识语义的理解是基于what-why理解效应与知觉集理解的基础上,对词汇搭配对应的知识语义进行理解判定的,即通过理解从而对搭配进行语义层面的why因素约束(语义层面的真值性约束),此为所述理解模块的语法分析单元;根据基于理解的语法分析,对词法切分(词法分析)进行调整,此为所述理解模块的词法分析调整单元。所述的语义及语义知识为了理解目的,应用于理解基础上的词法分析与句法分析,根据语义的what-why理解效应来确定词法分析与句法分析的合理性。
7.根据权利要求1-6所述的方法与系统,其特征在于,所述步骤A’36与A’23将所述词汇信息以五元组的形式进行存储,其存储前要进行词汇归位、语义归位;词汇归位包括查询常识库,看该词汇是否已存在,若已存在则应判别语义异同,然后一致性地增加定义;语义归位包括查询常识库的语义部分,看该语义是否已存在,并一致性地增加语义链接。知识归位包括查询常识库,看该知识是否已存在,并一致性地增加该知识语义。所述步骤A’23与A’36所述的语义与知识,其储存形式都是结构化的;其中的语义是知觉语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学;黄培红,未经北京理工大学;黄培红许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710013071.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能袜
- 下一篇:一种可自动连接式USB读取设备