[发明专利]文档概述装置、文档概述系统、文档概述方法及存储介质在审
申请号: | 202010239304.9 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111858910A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 万羽修 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/205 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 王娟 |
地址: | 日本国大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 概述 装置 系统 方法 存储 介质 | ||
本发明实现一种文档概述装置,所述文档概述装置对显示与输入文档的内容不同的事实这一情况进行抑制,即使是简短的概述句。文档概述装置包括:文档获取部,其获取输入文档;提取部,其从文档获取部获取的输入文档中提取一个或多个重要词和与该一个或多个重要词相关的一个或多个关联词;判断部,其参照通过对输入文档进行词素分析所获得的词素列表,对由一个或多个重要词和一个或多个关联词组成的概述句判断误解风险;以及输出信息生成部,当所述判断部判断误解风险在规定值以上时,使用通过对所述输入文档进行主题分析获得的主题词与所述一个或多个重要词生成概述句,并输出所生成的概述句,或者输出表示不能从所述输入文档生成概述句的信息。
技术领域
本发明涉及一种文档概述装置、文档概述系统、文档概述方法以及存储介质。
背景技术
近年来,开发了一种技术:为了缩短新闻报道的阅读时间以及整理新闻报道的信息,生成所输入的文档的概述句(专利文献1)。
专利文献1中公开了一种文档概述装置,其从输入的文档中提取重要的单词和重要单词之间的关系,并基于这些单词和关系生成文档的摘要。
现有技术文献
专利文献
专利文献1:特开平11-282881号公报(1999年10月15日公开)
发明内容
本发明所要解决的技术问题
然而,专利文献1的文档概述装置存在如下问题:为了生成输入文章的准确内容的概述句,概述句容易冗长。为了解决该问题,希望配置成输出尽可能短的概述句,但概述句越短,就越有可能将与输入文章不同的事实表示为概述句。
本发明的一个方面是鉴于上述问题而完成的,其目的是实现一种文档概述装置,所述文档概述装置对显示与输入文档的内容不同的事实这一情况进行抑制,即使是简短的概述句。
解决问题的手段
为了解决上述问题,本发明的一个方面涉及的文档概述装置,包括:文档获取部,其获取输入文档;提取部,其从所述文档获取部获取的输入文档中提取一个或多个重要词和与该一个或多个重要词相关的一个或多个关联词;判断部,其参照通过对所述输入文档进行词素分析而获得的词素列表,对由所述一个或多个重要词与所述一个或多个关联词组成的概述句判断误解风险;以及输出信息生成部,当所述判断部判断误解风险在规定值以上时,生成与判断结果对应的信息,并输出所生成的信息。
为了解决上述问题,本发明的一个方面涉及的文档概述方法,包括:文档获取步骤,获取输入文档;提取步骤,从所述文档获取步骤获取的输入文档中提取一个或多个重要词和与该一个或多个重要词相关的一个或多个关联词;判断步骤,参照通过对所述输入文档进行词素分析而获得的词素列表,对由所述一个或多个重要词与所述一个或多个关联词组成的概述句判断误解风险;以及输出信息生成步骤,当在所述判断步骤中判断误解风险在规定值以上时,生成与判断结果对应的信息,并输出所生成的信息。
发明效果
根据本发明的一个方面,能够实现一种文档概述装置,所述文档概述装置对显示与输入文档的内容不同的事实的这一情况进行抑制,即使是简短的概述句。
附图说明
图1是示出了本发明的实施方式1涉及的文档概述系统的框图。
图2是示出了本发明的实施方式1涉及的控制部的主要部分结构的框图。
图3示出了本发明的实施方式1涉及的词素分析部进行词素分析后的词素列表的示例。
图4示出了本发明的实施方式1涉及的存储在数据库中的判断模式的示例。
图5示出了本发明的实施方式1涉及的输出信息生成部生成的两词摘要的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010239304.9/2.html,转载请声明来源钻瓜专利网。