[发明专利]基于目标语句的依存句法分析方法、装置及服务器有效
申请号: | 201410386389.8 | 申请日: | 2014-08-07 |
公开(公告)号: | CN105335348B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 吴胜兰;董凡 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 语句 依存 句法 分析 方法 装置 服务器 | ||
本申请提供了一种目标语句的依存句法分析方法、装置及服务器,所述方法包括:获取待分析的目标语句的目标词序列;将所述目标词序列中的前两个目标词作为当前目标词,判断当前目标词是否都是骨干词,如果都是,则采用预置的动作预测骨干模型确定两个目标词之间的依存关系,如果有一个不是或者两个都不是,则采用预置的动作预测完整模型确定两个目标词之间的依存关系;参考目标词序列组成语句的顺序和确定的依存关系获取下两个待处理的目标词作为当前目标词,并执行判断所述当前目标词是否都是骨干词的步骤,直至所述目标词序列中的所有目标词都分析完毕为止。在本申请实施例中,可以大大降低错误级联给准确率带来的影响,从而提升了依存句法分析结果的准确率。
技术领域
本申请涉及数据处理技术领域,特别涉及一种目标语句的依存句法分析方法、装置及服务器。
背景技术
在互联网越来越发达的今天,使用计算机进行语言识别和处理已经是非常成熟的技术。句法分析就是计算语言学(Computational Linguistics)的一项研究内容,它通过建立形式化的数学模型,设计有效的算法,利用计算机分析和处理句子,将其从词序列形式转换为句法树形式从而捕捉句子内部结构和词语之间的搭配关系。在自然语言处理(NLP,Natural Language Processing)领域,主要分析两种主流的句法体系,分别是短语结构句法体系(Phrase-structure Grammar)和依存结构句法体系(Dependency Grammar)。
依存句法是由法国语言学家L.Tesniere于1959年提出,用于分析语言单位内成分之间的依存关系,以揭示其句法结构,其主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。计算机进行依存句法分析,即是对给定输入句子的词序列,分析各个词之间的搭配关系和整个句子的结构,并得到一棵依存句法分析树。依存句法分析树就是依存句法分析结果的表示形式。在依存句法分析树中,句子的每个词看做一个节点,并在句首插入一个起辅助作用的虚拟节点(记为根节点ROOT),所有节点通过有向弧连接形成一棵树,且满足以下三个条件:第一,除了根节点外,任意节点都有且仅有一条入边;第二,除了叶子节点外,任意节点有至少一条出边,根节点仅有一条出边,对应的弧指向支配整个句子的核心词;第三,所有的弧不能交叉,如果a和b两个节点存在有向弧,则处于他们中间的任意两个节点间的弧在水平方向的投影一定落在a和b的弧的投影上。
在依存句法树中,一条弧代表一则依存关系,弧的方向代表支配顺序。有向弧总是从某个父节点出发,指向其孩子节点,这称作父节点支配孩子节点,而孩子节点依存于父节点。常见的依存关系有:定中关系(ATT),表示定语依存于中心语,状中关系(ADV),表示状语依存于中心语,并列关系(COO),表示名词支配(与之并列)名词,主谓关系(SBV),表示主语依存于谓语,动宾关系(VOB),表示谓语支配宾语,核心关系(HED),表示ROOT支配句子核心词,依存分句(DC),表示主句核心词支配分句核心词。依存句法分析树中的一条有向弧就叫依存弧。
为了方便计算机处理,还将每个词以及词的若干属性叫做词项,也叫Term。词的属性可以包括单词在句子中的位置、词性和分词粒度等。针对依存句法分析树,需要对词项增加以下额外信息:对Term序列编号,从0开始计数,其中,ROOT用-1表示;针对每个Term,增加一个parent属性和一个relate属性,parent表示当前节点的父节点编号,relate表示父节点指向当前节点的依存弧的类型;如果一个Term的内容是标点符号,则设置parent为-2,relate可以任意设置一个代表孤立节点的字符,例如WP,不参与到依存树的结构中;句子中的核心词的父节点是ROOT,parent为-1,relate为核心关系(HED)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410386389.8/2.html,转载请声明来源钻瓜专利网。