[发明专利]词汇表管理装置、词汇表管理系统和词汇表管理方法有效
申请号: | 201510607171.5 | 申请日: | 2015-09-22 |
公开(公告)号: | CN105468581B | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 大林雄一;辻知佳;实克洋;中村刚;野村高志;高木淳平;吉田大辅 | 申请(专利权)人: | 京瓷办公信息系统株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;H04N1/00 |
代理公司: | 北京航忱知识产权代理事务所(普通合伙)11377 | 代理人: | 陈立航 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种词汇表管理装置、词汇表管理系统和词汇表管理方法。词汇表管理装置具备读取部和输出部中的至少一个、存储部、获得部、分析部、用语匹配部和注册部。所述读取部对文档进行读取。所述输出部对文档进行输出。所述存储部可存储根据从文档中抽取的字符串而构成的词汇表。所述获得部从文档中获得文本数据。所述分析部对记述获得部获得的文本数据的语言和构成文本数据的字符串的词性进行分析,并基于分析结果抽取字符串。所述用语匹配部将抽取出的字符串与注册了用语的公共词典进行匹配。所述注册部在抽取出的字符串与公共词典的关键词不一致时,将抽取出的字符串注册到词汇表中。 | ||
搜索关键词: | 词汇表 管理 装置 系统 方法 | ||
【主权项】:
一种词汇表管理装置,具备:读取部和输出部中的至少一个,所述读取部对文档进行读取,所述输出部对所述文档进行输出;存储部,可存储根据从所述文档中抽取出的字符串而构成的词汇表;获得部,从所述文档中获得文本数据;分析部,对记述所述获得部获得的所述文本数据的语言和构成所述文本数据的字符串的词性进行分析,并基于分析结果抽取所述字符串;用语匹配部,将所述抽取出的字符串与注册了用语的公共词典进行匹配;以及注册部,在所述抽取出的字符串与所述公共词典的关键词不一致时,将所述抽取出的字符串注册到所述词汇表中,在抽取出的所述字符串是只由西文字母构成且是固有名词以外的第一字符串的情况下,所述用语匹配部将所述第一字符串与所述公共词典进行匹配,在所述第一字符串与所述公共词典的关键词不一致时,所述注册部将所述第一字符串注册到所述词汇表中,在抽取出的所述字符串是只由西文字母构成且是固有名词的第二字符串的情况下,所述用语匹配部不将所述第二字符串与所述公共词典进行匹配,所述注册部将所述第二字符串注册到所述词汇表中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京瓷办公信息系统株式会社,未经京瓷办公信息系统株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510607171.5/,转载请声明来源钻瓜专利网。