[发明专利]一种基于XML的情感词词性标注的方法无效

专利信息
申请号: 201210057091.3 申请日: 2012-03-06
公开(公告)号: CN102646128A 公开(公告)日: 2012-08-22
发明(设计)人: 毛峡;赵鹏飞 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 xml 情感 词性 标注 方法
【说明书】:

技术领域

发明涉及一种词语标注的方法,尤其是在XML架构下按词性对情感词进行标注的方法,属于自然语言处理与情感计算领域。

背景技术

汉语文本中蕴含着丰富的情感词汇,研究汉语文本情感,词汇的情感标注尤为重要。当前的分词系统能够有效的将汉语文本按照不同成分进行划分,如何将这些成分有效的分类标注,对后续的情感计算工作具有重要的意义。

XML是一种可拓展标记语言,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML是标准通用标记语言(SGML)的子集,非常适合Web传输与程序调用,另外,XML是一种跨平台的语言,而且所有的面向对象的程序语言都可以支持XML。XML Schema定义了XML文档的规范,可以视作XML的约束文档,使用XML Schema定义的规范也就是在XML文档中存储被标记的情感词的结构。

在当前的文本标注研究中,多以文本文档或者表格文档对分词后的文本成分进行存储,结构不清晰,不利于后续程序开发以及情感计算中的调用。因此使用XML对情感词词汇的标注方法具有很强的现实意义,利用XML Schema对XML的约束方法,增强了标注结构的扩展性和规范性。

发明内容

本发明提供了一种基于XML的情感词词性标注的方法。

包括以下步骤:

步骤一:根据汉语词汇词性的不同制定XML元素标签;

步骤二:根据制定的词性标签的逻辑关系编写Schema约束文档;

步骤三:设计表征词汇情感属性的参数维度;

步骤四:按照词汇的词性将情感词存储在所属标签下的XML文档中。

在步骤一中:按照分词后的词汇词性不同,将这些词汇根据词性的不同赋予不同的标签,例如:对于动词使用<v/>进行标注,名词使用<n/>进行标注。对于在一种词性中不同分类的二级词性,进行标注,例如在形容词标签<a/>中定义了<ad/>、<an/>、<ag/>和<al/>四种二级标签。特别的对于在汉语文本中常见的词语或者符号进行了单独的标注,例如<vshi/>和<vyou/>分别作为“是”和“有”的标签,<vand/>和<vbut/>分别作为两种连词并列关系和转折关系的标签,<ww/>和<wt/>分别作为“?”和“!”的标签。具体标注标签见说明书附图。

在步骤二中:用Schema语言编写XML的约束文档,定义XML的结构规则。根节点定义为<xs:element name=″情感词词性标注规范″/>,用<xs:complexType/>复杂类型定义所有的一级子节点,也就是一级词性的节点,用<xs:sequence/>约束节点的顺序模式,对于包含二级子节点的词性,用<xs:complexType/>定义二级子节点,节点元素定义格式为<xs:elementname=″″maxOccurs=″unbounded″>,其中″unbounded″表示可以存储无限个情感词汇,每一种词性的最低级词性标签的内容为情感词汇,因此在最低级词性节点处定义情感词汇的属性。

在步骤三中:在设计情感词属性形式中,采用三个参数定义一个词汇的,分别为<xs:attribute name=″h″/>、<xs:attribute name=″s″/>、<xs:attribute name=″v″/>。其中h取值范围0-360,s和v取值范围为0-100,每个情感词的情感值由这三个属性共同确定。

在步骤四中:根据Schema定义的约束,存储情感词汇,例如存储“高兴”,则为:<n h=20s=90 v=90>高兴</n>。

本发明的方法的优点在于,利用XML文档代替文本文档或者表格文档存储情感词汇,使情感词更容易被程序调用以及后续的增改;利用词性作为情感词分类的依据,更有效的联系了分词系统与标注系统的关系;设计情感词三维数值属性,更精确的描述情感词的情感属性。

附图说明

图1为XML Schema定义的节点结构图,其中长方形框内的内容极为节点元素名。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210057091.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top