[发明专利]句子模板自动提取的方法无效
申请号: | 200810019527.3 | 申请日: | 2008-01-22 |
公开(公告)号: | CN101221558A | 公开(公告)日: | 2008-07-16 |
发明(设计)人: | 高毅;徐波;陈志刚;胡国平;赵志伟;严峻;吴晓如;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及句子模板自动提取的方法,包括以下步骤:分句:按标点符号,将文本分成若干条句子;并按先后顺序在句子前标上序号;分词:运用分词技术,将分句所得的每条句子,切分成基于每个词的小块;分词完成后,按句子中词语个数由多到少或由少到多划分成若干组;模板提取:将同一组的句子应用LCS算法,得到最长公共子序列,即得到句子模板。本发明可以从大量文本信息中,自动、高效的统计常用字词、句式。 | ||
搜索关键词: | 句子 模板 自动 提取 方法 | ||
【主权项】:
1.句子模板自动提取的方法,其特征在于提取方法包括以下步骤:(1)分句:按标点符号,将文本分成若干条句子;并按先后顺序在句子前标上序号;(2)分词:运用分词技术,将分句所得的每条句子,切分成基于每个词的小块;(3)模板提取:在分词结果的基础上,对句子应用LCS算法,得到最长公共子序列,即得到句子模板。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810019527.3/,转载请声明来源钻瓜专利网。
- 上一篇:移动通信终端来电显示方法
- 下一篇:一种易熔金属感温断路器