[发明专利]文档处理装置有效
申请号: | 200810006557.0 | 申请日: | 2008-03-06 |
公开(公告)号: | CN101526938A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 王婍犇;乐宁;朱奇;许晨;吴波 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 雒运朴;李 伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 装置 | ||
1.一种文档处理装置,其特征在于,
具有:
输入部,其输入文档;
预处理部,其将由上述输入部输入的文档分离成多个单词;
重要度算出部,其算出由上述预处理部分离的单词的基于频度的特征 值,并基于算出的上述基于频度的特征值来算出每一个由多个单词构成的 句子的重要度;
摘要生成部,其基于由上述重要度算出部算出的每一个句子的重要 度,并依照句子重要度从高到低的顺序来选择规定数量的句子,而生成所 输入的文档的摘要;
显示部,其显示由上述摘要生成部生成的摘要;
关键词输入部,作为关键词输入由用户输入的单词,或者作为关键词 输入由用户从通过上述预处理部分离的单词中选择的单词;
而且,在由上述显示部显示由上述摘要生成部生成的输入文档的摘要 后,
若由上述关键词输入部输入关键词,则上述重要度算出部算出基于所 输入的关键词的特征值,并根据上述基于频度的特征值以及算出的上述基 于关键词的特征值这两个特征值来重新算出每一个由多个单词构成的句 子的重要度,上述摘要生成部基于由上述重要度算出部重新算出的每一个 句子的重要度,依照句子重要度从高到低的顺序选择规定数量的句子,生 成所输入的文档的摘要,上述显示部重新显示由上述摘要生成部生成的摘 要。
2.根据权利要求1所述的文档处理装置,其特征在于,
上述文档由文档主体和标题构成,该文档主体由多个句子构成,
上述重要度算出部还算出基于上述标题中包含的单词的特征值,并基 于算出的特征值来算出句子的重要度。
3.根据权利要求1所述的文档处理装置,其特征在于,上述重要度算 出部还算出基于预先决定的线索词的特征值,并基于算出的特征值来算出 句子的重要度。
4.根据权利要求1所述的文档处理装置,其特征在于,若由上述关键 词输入部再次输入关键词,则上述重要度算出部再次算出基于输入的关键 词的特征值,并根据上述基于频度的特征值以及再次算出的上述基于关键 词的特征值这两个特征值来再次算出每一个由多个单词构成的句子的重 要度,上述摘要生成部基于由上述重要度算出部再次算出的每一个句子的 重要度,并依照句子重要度从高到低的顺序再次选择规定数量的句子,而 再次生成所输入的文档的摘要,上述显示部再次显示由上述摘要生成部生 成的摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810006557.0/1.html,转载请声明来源钻瓜专利网。