[发明专利]专有表现抽取装置、方法以及程序有效
申请号: | 200580049664.6 | 申请日: | 2005-12-26 |
公开(公告)号: | CN101167075A | 公开(公告)日: | 2008-04-23 |
发明(设计)人: | 续木贵史;冲本纯幸;水谷研治;松浦聪;井上刚;九津见洋 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/28 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 黄剑锋 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专有 表现 抽取 装置 方法 以及 程序 | ||
技术领域
本发明涉及一种专有表现抽取装置,可以抽取适应用户的专有表现。
背景技术
以往,在已经公开的专有表现抽取方法中,为了对应多个不同任务,对一个输入文本来操作多个专有表现抽取模块工作,从而可以汇集被抽取的专有表现(例如,参照专利文献1)。
在此,专有表现是指特定的语言项目,根据任务作为一个单位被处理,例如:专有名词,公司名称,电子邮件地址,国名,城市名,产品名,时间,日期,金额表现以及比率表现等。
专利文献1:(日本)特开2003-248680号公报
然而,在以往的专有表现抽取方法中,通过使多个专有表现抽取模块工作,从而可以对应多个不同任务,但是由于不能使要抽取专有表现的种类或单位与用户或显示终端器相对应来存储它们,因此不能抽取适应用户或显示终端的专有表现。因此,尤其在专有表现中存在专有表现的专有表现的嵌套结构中,在向用户显示所抽取的专有表现的情况下,用户需要看如下专有表现,即,包含对用户冗长的字符串的专有表现,或因字符数太短而无法理解意思的专有表现。例如,用电视节目信息举个例子,针对由主题与副题构成节目名的节目,对于只根据主题可以识别节目的用户来说副题是冗长的信息。反而,对于只根据主题无法识别节目的用户来说副题是必要的信息,因此必要向用户示出主题与副题。
发明内容
于是,鉴于上述情况,本发明的目的在于提供一种专有表现抽取装置,可以抽取适应抽取条件的专有表现,该抽取条件以用户的输入履历或显示终端的显示能力等来表示。
为了实现上述目的,本发明涉及的专有表现抽取装置,依次使用一个以上的专有表现模式,从一个以上的输入文本中抽取专有表现,所述专有表现模式示出在文本中包含的专有表现部分的判断标准,其特征在于,包括:抽取顺序设定单元,决定抽取顺序,该抽取顺序示出按照抽取条件不同的专有表现模式的使用顺序;以及专有表现抽取单元,根据以所述决定的抽取顺序所示的顺序,使用专有表现模式,从所述一个以上的输入文本中抽取专有表现。
发明的效果:根据该结构,由于可以按照抽取条件设定专有表现的抽取顺序,因此,例如对于存在嵌套结构的专有表现,在从字符串长度短的、或字符串长度长的专有表现中依次进行抽取的情况下,在可以抽取对于用户字符串长度适当的专有表现的阶段可以停止专有表现抽取处理,从而可以抽取对用户或显示终端最合适的专有表现。
附图说明
图1是实施例1的专有表现抽取装置的结构图。
图2是示出用于实施例1的专有表现抽取装置的、由抽取顺序存储部存储的抽取顺序的一个例子的图。
图3是示出用于抽取的规则的一个例子的图。
图4是示出用于抽取的规则的另一个例子的图。
图5是还示出用于抽取的规则的另一个例子的图。
图6是示出使用抽取人名的规则进行抽取的一个具体例子的图。
图7是实施例1的工作的流程图。
图8是示出实施例1的专有表现抽取装置用于抽取的规则的一个例子的图。
图9是示出用于实施例1的专有表现抽取装置的、由抽取顺序存储部存储的抽取顺序的一个例子的图。
图10是示出用于实施例1的专有表现抽取装置的、由抽取顺序存储部存储的抽取顺序的一个例子的图。
图11是示出用于实施例1的专有表现抽取装置的、抽取顺序读取部的一个例子的图。
图12是示出实施例1的工作例的流程图。
图13是示出用于实施例1的专有表现抽取装置的、使用模式数据库的内容的一个例子的图。
图14是示出用于实施例1的专有表现抽取装置的、抽取顺序数据库的内容的一个例子的图。
图15是示出用于实施例1的专有表现抽取装置的、使用模式数据库的内容的一个例子的图。
图16是示出用于实施例1的专有表现抽取装置的、使用模式数据库的内容的一个例子的图。
图17是示出用于实施例1的专有表现抽取装置的、由抽取顺序存储部存储的抽取顺序的一个例子的图。
图18是示出用于实施例1的专有表现抽取装置的、由抽取顺序存储部存储的抽取顺序的一个例子的图。
图19是示出用于实施例1的专有表现抽取装置的、抽取结束判断部的一个例子的图。
图20是示出实施例1的工作例的流程图。
图21是示出用于实施例1的专有表现抽取装置的、由抽取次数存储部存储的内容的一个例子的图。
图22是示出用于实施例1的专有表现抽取装置的、由抽取次数存储部存储的内容的一个例子的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580049664.6/2.html,转载请声明来源钻瓜专利网。