[发明专利]一种用于语言理解的层次语义树构建方法及系统有效
申请号: | 201410216929.8 | 申请日: | 2014-05-21 |
公开(公告)号: | CN104142917B | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 晋耀红;朱筠;刘小蝶 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三聚阳光知识产权代理有限公司11250 | 代理人: | 张秀民 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语言 理解 层次 语义 构建 方法 系统 | ||
1.一种用于语言理解的层次语义树构建方法,其特征在于,包括如下步骤:
S1、输入待处理语句,对待处理语句进行分词,并加载分词后词语的语义知识;
S2、根据分词结果,识别出该语句的语义节点,包括:对于分词后的词语,如果词语的语义知识中有逻辑概念,对该词语标记为L,如果词语的语义知识中有动态概念,标记为V;对所有标记为L或V的词语,进行LV排除处理;对所有L标记根据其概念类别进行标记,并判断其是否有后标记,如果有后标记,对后标记的词语标记为L1H,根据上述所有标记生成语义节点;
S3、利用语义知识和词语位置及搭配获得语义节点的层次;将所有L标记和V标记的默认层次都记为0,当出现两个上述标记相邻时,第二个标记的层次减小一层,包括:对第一序列中的所有语义节点,进行LV层次识别,所有L标记和V标记的默认层次都记为0;当两个L相邻时,即出现L1L2时,L2的层次减1;当L和V相邻时,即出现L1V2时,V2的层次减1;当L和V相邻时,即出现V1L2时,L2的层次减1;对句号标点符号,生成一个语义点,其标记为SST,记入第一序列;
S4、识别该语句中不同层次的语义边;
S5、根据各层次的语义边生成层次语义树。
2.根据权利要求1所述的层次语义树构建方法,其特征在于,包括:所述步骤S1中,对待处理语句进行分词时,按照领域词典和通用词典对待处理语句进行分词。
3.根据权利要求1或2所述的层次语义树构建方法,其特征在于,所述语义知识包括词语的广义概念类及其子类,所述词语的广义概念类包括动态、静态、物、人、属性、逻辑。
4.根据权利要求3所述的层次语义树构建方法,其特征在于,所述步骤S2中“根据分词结果,识别出该语句的语义节点”的过程,还包括:将句末标点生成语义节点作为根节点。
5.根据权利要求4所述的层次语义树构建方法,其特征在于,所述步骤S4中“识别该语句中不同层次的语义边”的过程,包括
对所有标记为V的语义节点,进行核心动词识别,生成语块;
对所有标记为L的语义节点,生成语块;
根据语块生成语义边。
6.根据权利要求5所述的层次语义树构建方法,其特征在于,所述进行核心动词识别的过程包括:
排除不能构成核心动词的词语;
其余的词语根据构成和词语本身所具有的特征赋予不同的权值,根据权值的排序结果和位置信息选择核心动词。
7.根据权利要求6所述的层次语义树构建方法,其特征在于,所述根据各层次的语义边生成层次语义树的过程,包括:
选择根节点;
把层次高的语块,按照该层次中的顺序,挂到根节点上,作为子节点;
遍历所有子节点,将每个子节点范围内的所有语块作为该子节点的子节点,直到没有新的子节点产生。
8.一种层次语义树构建系统,所述系统用于执行如权利要求1-7任一项所述的层次语义树构建方法,其特征在于,包括:
预处理单元:输入待处理语句,对待处理语句进行分词,并加载分词后词语的语义知识;
第一序列生成单元:根据分词结果,识别出该语句的语义节点;利用语义知识和词语位置及搭配获得语义节点的层次;
第二序列生成单元:识别该语句中不同层次的语义边;
层次语义树生成单元:根据各层次的语义边生成层次语义树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410216929.8/1.html,转载请声明来源钻瓜专利网。