[发明专利]个性情感知识图谱建立方法及装置在审
申请号: | 201711145598.3 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107895027A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 孙晓;裴正蒙;丁帅;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 王莹,余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个性 情感 知识 图谱 建立 方法 装置 | ||
技术领域
本发明涉及软件技术领域,具体涉及一种个性情感知识图谱建立方法及装置。
背景技术
知识图谱是实体和实体之间关系的一个图知识库,它的本质是一种解释实体知识之间的语义网络图。知识图谱的建立主要分为:文本分析,构造分析,链接集成。目前越来越多的研究人员开展了对于知识图谱的研究,尤其是对于个人的个性情感知识图谱的研究,从而可以根据个人的个性情感知识图谱了解该人物的不同喜好,并根据不同的喜好进行有针对性的措施,例如可以在互联网上平台进行有针对性的消息推送等等。
然而,在实施本发明实施例的过程中发明人发现,现有的一些知识图谱的建立方法仅能够根据单独的句子来进行构建,缺少上下文环境特征,对于大段的文本分析并不出色,构建出来的知识图谱模型无法准确全面地反映个人的情感。
发明内容
本发明实施例的目的在于提供一种个性情感知识图谱建立方法及装置。
第一方面,本发明实施例提供了一种个性情感知识图谱建立方法,
获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;
在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;
基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;
构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。
可选地,所述在所述用户数据中抽取情感对象词汇以及情感词汇,包括:
基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:
使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:
对给出的中文句子X=(x1,x2,x3…xn),通过维特比算法找到其词性标注结果序列Y=(y1,y2,y3….yn),并使得条件概率P=(y|x)最大,条件概率P=(y|x)如下式所示:
其中:
其中,tk和sl是特征函数,λk和μl是对应的权值,Z(x)是规范化因子;
根据预设的分词的词性规则将文本语料中的情感词和情感对象按照每句话进行统计集合。
可选地,所述基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,包括:
对从语料中收录的基准情感词汇进行向量化,并利用K-means进行聚类,得到每个词类在预设的坐标轴上的中心坐标;
确定抽取的情感词汇在预设的坐标轴上的坐标;
计算抽取的情感词汇的坐标与各个中心坐标之间的欧氏距离;
若所述抽取的情感词汇的坐标与第一中心坐标距离最近,则所述抽取的情感词汇与第一中心坐标所对应的基准情感词汇属于同类词。
可选地,所述方法还包括:
对抽取的多个情感对象词汇以及多个情感词汇进行同义词归类处理。
第二方面,本发明实施例又提供了一种个性情感知识图谱建立装置,包括:
获取单元,用于获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;
抽取单元,用于在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;
归类单元,用于基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;
图谱生成单元,用于构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。
可选地,所述抽取单元,进一步用于:
基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:
使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711145598.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种校园用户画像的实现方法
- 下一篇:采用深度学习的草图检索方法