[发明专利]一种基于XML的情感词词性标注的方法无效
申请号: | 201210057091.3 | 申请日: | 2012-03-06 |
公开(公告)号: | CN102646128A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 毛峡;赵鹏飞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 xml 情感 词性 标注 方法 | ||
1.为解决在情感计算中对分词后的词汇进行分类标注并存储的问题,本发明提供了一种基于XML的情感词词性标注的方法,包括以下步骤:
步骤一:根据汉语词汇词性的不同制定XML元素标签;
步骤二:根据制定的词性标签的逻辑关系编写Schema约束文档;
步骤三:设计表征词汇情感属性的参数维度;
步骤四:按照词汇的词性将情感词存储在所属标签下的XML文档中。
2.根据权利要求1所述,其步骤一中主要特征为:按照分词后的词汇词性不同,将这些词汇根据词性的不同赋予不同的标签,对于动词使用<v/>进行标注,名词使用<n/>进行标注;对于在一种词性中不同分类的二级词性,进行标注,例如在形容词标签<a/>中定义了<ad/>、<an/>、<ag/>和<al/>四种二级标签;特别的对于在汉语文本中常见的词语或者符号进行了单独的标注,<vshi/>和<vyou/>分别作为“是”和“有”的标签,<vand/>和<vbut/>分别作为两种连词并列关系和转折关系的标签,<ww/>和<wt/>分别作为“?”和“!”的标签。
3.根据权利要求1所述,其步骤二中主要特征为:用Schema语言编写XML的约束文档,定义XML的结构规则,根节点定义为<xs:element name=″情感词词性标注规范″/>,用<xs:complexType/>复杂类型定义所有的一级子节点,也就是一级词性的节点,对于包含二级子节点的词性,用<xs:complexType/>定义二级子节点,每一种词性的最低级词性标签的内容为情感词汇,因此在最低级词性节点处定义情感词汇的属性。
4.根据权利要求1所述,其步骤三中主要特征为:在设计情感词属性形式中,采用三个参数定义一个词汇的,分别为<xs:attribute name=″h″/>、<xs:attribute name=″s″/>、<xs:attribute name=″v″/>,其中h取值范围0-360,s和v取值范围为0-100,每个情感词的情感值由这三个属性共同确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210057091.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种筛板萃取塔
- 下一篇:一种治疗艾滋病的中药组合物