[发明专利]一种文本信息处理方法、装置及存储介质有效
申请号: | 201711159103.2 | 申请日: | 2017-11-20 |
公开(公告)号: | CN108304442B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 彭思翔;钱淑钗 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种文本信息处理方法、装置及存储介质,其中该方法包括:接收待识别的文本信息,按照预设的切词规则对所述文本信息进行切词处理,生成至少一个词语;获取所述至少一个词语对应的参数,其中每个参数标识一个词语;根据所述参数及预置的训练模型确定所述文本信息的特征信息,所述训练模型由至少一个类型的模板化文本训练而成;根据所述特征信息确定所述文本信息所属的所述模板化文本的类型。由于该方案在整个过程中不需要进行词性分析,因此,可以使得识别结果不会受到词语变种、标点符号、和/或其他字符等干扰信息的干扰,从而提高了对文本信息进行识别的准确性。 | ||
搜索关键词: | 一种 文本 信息处理 方法 装置 存储 介质 | ||
【主权项】:
1.一种文本信息处理方法,其特征在于,包括:接收待识别的文本信息;按照预设的切词规则对所述文本信息进行切词处理,生成至少一个词语;获取所述至少一个词语对应的参数,其中每个参数标识一个词语;根据所述参数及预置的训练模型确定所述文本信息的特征信息,所述训练模型由至少一个类型的模板化文本训练而成;根据所述特征信息识别所述文本信息所属的模板化文本的类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711159103.2/,转载请声明来源钻瓜专利网。