[发明专利]信息处理装置、信息处理方法和程序无效
申请号: | 201210074244.5 | 申请日: | 2012-03-20 |
公开(公告)号: | CN102722518A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 高松慎吾 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张丽新 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种信息处理装置包括:文档分析单元,从文档数据中提取短语,该短语包括被赋予关联性标签的实体对;以及标签赋予单元,赋予指示实体对之间的关联性的关联性标签。标签赋予单元:获得在包括实体对的短语中包括的词汇语法模式,并从文档数据获得词汇语法模式在该文档数据中出现的出现次数;计数实体对的数量;设置从概率密度分布创建的概率模型,该概率密度分布包括所计数的实体对的数量、、指示赋予关联性标签的正当性的参数Z、以及指示正确赋予关联性标签的概率的参数a;计算在概率模型中使似然最大的参数Z和a;评价赋予关联性标签的正当性;以及基于评价结果赋予关联性标签。 | ||
搜索关键词: | 信息处理 装置 方法 程序 | ||
【主权项】:
一种信息处理装置,包括:文档分析单元,其从文档数据提取包括向其赋予关联性标签的实体对的短语;以及标签赋予单元,其赋予指示所述实体对之间的关联性的关联性标签,其中,所述标签赋予单元通过分析具有关于实体对和关联性标签的登记信息的现有关联性数据库中的登记信息和其中存在至少一个包括在关联性数据库中登记的实体对的短语的文档数据,来获得在包括实体对的短语中包括的词汇语法模式,并从所述文档数据获得所述词汇语法模式在该文档数据中出现的出现次数对于词汇语法模式对,计数在所述文档数据中与每对词汇语法模式的两方同时出现的实体对的数量,以及设置从概率密度分布创建的概率模型,该概率密度分布包括所计数的实体对的数量、指示赋予关联性标签的正当性的参数Z、以及指示正确赋予关联性标签的概率的参数a,计算在概率模型中使似然最大的参数Z和a,评价为从所述文档数据中提取的实体对赋予关联性标签的正当性,并基于评价结果赋予关联性标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210074244.5/,转载请声明来源钻瓜专利网。