[发明专利]一种文本处理方法及系统有效
申请号: | 201810678790.7 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110717010B | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 胡娟;陈欢;宋奇 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 100193 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种文本处理方法。所述文本处理方法包括:获取步骤:获取输入文本;分词步骤:对所述输入文本进行分词处理,获得分词序列;概率预测步骤:根据所述分词序列的位置顺序1,2,…,j,j+1,…,N,预测并获得在每个位置的一个或多个候选词语,及各候选词语的概率值;其中,j取1~N的任意整数,N为所述输入文本的分词总数;以及概率截断步骤:基于设定阈值,为所述分词序列中的每个位置保留概率值大于所述设定阈值的候选词语。 | ||
搜索关键词: | 一种 文本 处理 方法 系统 | ||
【主权项】:
1.一种文本处理方法,包括:/n获取步骤:获取输入文本;/n分词步骤:对所述输入文本进行分词处理,获得分词序列;/n概率预测步骤:根据所述分词序列的位置顺序1,2,…,j,j+1,…,N,预测并获/n得在每个位置的一个或多个候选词语,及各候选词语的概率值;其中,j取1~N的任意整数,N为所述输入文本的分词总数;以及/n概率截断步骤:基于设定阈值,为所述分词序列中的每个位置保留概率值大于所述设定阈值的候选词语。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810678790.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种法律咨询报告的生成方法及设备
- 下一篇:会话消息处理方法和装置