[发明专利]一种基于XML的情感词词性标注的方法无效

专利信息
申请号: 201210057091.3 申请日: 2012-03-06
公开(公告)号: CN102646128A 公开(公告)日: 2012-08-22
发明(设计)人: 毛峡;赵鹏飞 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 xml 情感 词性 标注 方法
【权利要求书】:

1.为解决在情感计算中对分词后的词汇进行分类标注并存储的问题,本发明提供了一种基于XML的情感词词性标注的方法,包括以下步骤:

步骤一:根据汉语词汇词性的不同制定XML元素标签;

步骤二:根据制定的词性标签的逻辑关系编写Schema约束文档;

步骤三:设计表征词汇情感属性的参数维度;

步骤四:按照词汇的词性将情感词存储在所属标签下的XML文档中。

2.根据权利要求1所述,其步骤一中主要特征为:按照分词后的词汇词性不同,将这些词汇根据词性的不同赋予不同的标签,对于动词使用<v/>进行标注,名词使用<n/>进行标注;对于在一种词性中不同分类的二级词性,进行标注,例如在形容词标签<a/>中定义了<ad/>、<an/>、<ag/>和<al/>四种二级标签;特别的对于在汉语文本中常见的词语或者符号进行了单独的标注,<vshi/>和<vyou/>分别作为“是”和“有”的标签,<vand/>和<vbut/>分别作为两种连词并列关系和转折关系的标签,<ww/>和<wt/>分别作为“?”和“!”的标签。

3.根据权利要求1所述,其步骤二中主要特征为:用Schema语言编写XML的约束文档,定义XML的结构规则,根节点定义为<xs:element name=″情感词词性标注规范″/>,用<xs:complexType/>复杂类型定义所有的一级子节点,也就是一级词性的节点,对于包含二级子节点的词性,用<xs:complexType/>定义二级子节点,每一种词性的最低级词性标签的内容为情感词汇,因此在最低级词性节点处定义情感词汇的属性。

4.根据权利要求1所述,其步骤三中主要特征为:在设计情感词属性形式中,采用三个参数定义一个词汇的,分别为<xs:attribute name=″h″/>、<xs:attribute name=″s″/>、<xs:attribute name=″v″/>,其中h取值范围0-360,s和v取值范围为0-100,每个情感词的情感值由这三个属性共同确定。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210057091.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top