[发明专利]一种基于中文分词技术的畅想文书的方法及系统在审
申请号: | 201811337419.0 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109558589A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 崔佳庆;徐忠建;朱必亮;李俊;孙海峰 | 申请(专利权)人: | 速度时空信息科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210042 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于中文分词技术的畅想文书的方法,包括以下步骤:(1)对文本进行分词操作:导入文书内容,对文书内容进行分词;(2)对步骤(1)中的所有的分词结果进行排序并统计;(3)要素提取:设置要素提取条件,利用XML规则和Rete算法对文件中的要素进行提取;(4)执行检索命令并统计要素提取结果。通过对机械分词方法和统计分词方法的算法进行优化;利用词频概率大小对词语重新判定,并选择最优结果。在分词结束后,用户即可进行自定义的要素提取,我们利用规则引擎和XML规则文件实现了业务逻辑和处理逻辑分离的目的;最大程度的实现了自定义查询。 | ||
搜索关键词: | 要素提取 分词 中文分词 自定义 算法 词频 统计 处理逻辑 分词结果 规则引擎 机械分词 检索命令 业务逻辑 最优结果 排序 词语 判定 文本 查询 概率 优化 | ||
【主权项】:
1.一种基于中文分词技术的畅想文书的方法,其特征在于,包括以下步骤:(1)对文本进行分词操作:导入文书内容,对文书内容进行分词;(2)对步骤(1)中的所有的分词结果进行排序并统计;(3)要素提取:设置要素提取条件,利用XML规则和Rete算法对文件中的要素进行提取;(4)执行检索命令并统计要素提取结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于速度时空信息科技股份有限公司,未经速度时空信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811337419.0/,转载请声明来源钻瓜专利网。