[发明专利]句子模板自动提取的方法无效
申请号: | 200810019527.3 | 申请日: | 2008-01-22 |
公开(公告)号: | CN101221558A | 公开(公告)日: | 2008-07-16 |
发明(设计)人: | 高毅;徐波;陈志刚;胡国平;赵志伟;严峻;吴晓如;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 模板 自动 提取 方法 | ||
1.句子模板自动提取的方法,其特征在于提取方法包括以下步骤:
(1)分句:按标点符号,将文本分成若干条句子;并按先后顺序在句子前标上序号;
(2)分词:运用分词技术,将分句所得的每条句子,切分成基于每个词的小块;
(3)模板提取:在分词结果的基础上,对句子应用LCS算法,得到最长公共子序列,即得到句子模板。
2.根据权利要求1所述的句子模板自动提取的方法,其特征在于所述分词完成后,按句子中词语个数由多到少或由少到多划分成若干组;将同一组的句子应用LCS算法,得到最长公共子序列。
3.根据权利要求1或2所述的句子模板自动提取的方法,其特征在于在得到所述最长公共子序列的同时,删除其内部活动部分长度为零的最长公共子序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810019527.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:移动通信终端来电显示方法
- 下一篇:一种易熔金属感温断路器