[发明专利]文本可理解性的度量方法无效
申请号: | 200910048310.X | 申请日: | 2009-03-26 |
公开(公告)号: | CN101520774A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 骆祥峰;方宁;徐炜民;刘方方 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海上大专利事务所(普通合伙) | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 可理解 度量 方法 | ||
1.一种文本可理解性的度量方法,其特征在于操作步骤如下:
(1)统计一篇文本中的关键词和句子,所述关键词就是该文本中具有重要含义的名词和动词;
(2)根据所述关键词是否在相应的句子上出现来计算每两个句子之间的关联关系权重;
(3)根据多个相连句子之间的逻辑结构来计算多个相连句子之间的关联关系权重,从而度量该文本的可理解性。
2.根据权利要求1所述的文本可理解性的度量方法,其特征在于所述步骤(2)中的两个句子之间的关联关系权重是用两个句子共同出现的所述关键词数目除以这两个句子所有关键词的数目。
3.根据权利要求1所述的文本可理解性的度量方法,其特征在于所述步骤(3)中的多个相连句子之间的逻辑结构定义为多个相连句子之间的三种逻辑结构:先总后分、先分后总、和一个连一个。
4.根据权利要求3所述的文本可理解性的度量方法,其特征在于所述步骤(3)中的计算多个相连句子之间的关联关系权重的步骤为:
(1)计算多个相连句子中的每两个句子之间的关联关系权重,这两个句子可能不相连;
(2)分别计算所述三种逻辑结构上的关联关系权重,此时用最小的两个句子的关联关系权重作为该结构上多个相连句子之间的关联关系权重;
(3)取有最大权值的逻辑结构作为最可能的逻辑结构,它的权重就是该多个相连句子之间的关联关系权重。
5.根据权利要求4所述的文本可理解性的度量方法,其特征在于由所述步骤(3)中所得的多个相连句子之间的关联关系权重,把不同数目的相连句子之间的所有关联关系权重相加就得到该文本的可理解性度量。
6.根据权利要求5所述的文本可理解性的度量方法,其特征在于所述不同数目的相连句子依据原有的句子排列,不同数目的句子是指前后连接的句子。
7.根据权利要求5所述的文本可理解性的度量方法,其特征在于依据原有的句子排列,所述不同数目的句子是指相前后连接的句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910048310.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息检索方法和系统
- 下一篇:一种用于多种软件形态的质量评估方法及系统