[发明专利]文本识别方法、设备、介质有效
申请号: | 202210887250.6 | 申请日: | 2022-07-26 |
公开(公告)号: | CN115248846B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 窦辰晓;邓勇;陈亮宇 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F18/214 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 设备 介质 | ||
1.一种文本识别方法,其特征在于,包括:
获取待识别文本;
根据预设情感类型对应的情感特征词,生成包括掩码的提示模板,所述提示模板用于提示所述待识别文本与所述情感特征词之间的二分类关系;
将所述待识别文本与所述提示模板按照预设格式拼接,得到拼接文本;
将所述拼接文本输入预测模型,经所述预测模型预测用于填入所述掩码的候选答案及所述候选答案的概率;其中,经所述预测模型预测用于填入所述掩码的候选答案及所述候选答案的概率,包括:从预设候选词表中选取多个候选词,所述多个候选词包括:用于表示所述二分类关系中的肯定关系的多个肯定候选词,或者用于表示所述二分类关系中的肯定关系的多个肯定候选词和用于表示所述二分类关系中的否定关系的多个否定候选词;利用所述预测模型,分别预测所述多个候选词中各候选词作为用于填入所述掩码的候选答案的概率;
基于所述候选答案及所述候选答案的概率,确定所述待识别文本是否属于所述预设情感类型。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别文本之后,还包括:
获取所述预设情感类型;
针对所述预设情感类型,从预设特征词表中选取对应于所述预设情感类型的特征词作为所述情感特征词;其中,所述预设特征词表包括一个以上情感类型中各情感类型分别对应的特征词。
3.根据权利要求1所述的方法,其特征在于,经所述预测模型预测用于填入所述掩码的候选答案及所述候选答案的概率,包括:
按照第一预设方式,从预设候选词表中选取K个肯定候选词作为K个候选答案;其中,所述肯定候选词用于表示所述二分类关系中的肯定关系,所述预设候选词表包括:用于表示所述二分类关系中的肯定关系的多个肯定候选词;K为大于0的整数;
利用所述预测模型,分别预测所述K个肯定候选词中各肯定候选词作为用于填入所述掩码的候选答案的概率。
4.根据权利要求3所述的方法,其特征在于,所述基于所述候选答案及所述候选答案的概率,确定所述待识别文本是否属于所述预设情感类型,包括:
基于所述K个肯定候选词作为用于填入所述掩码的候选答案的概率是否大于预设概率值,确定所述待识别文本是否属于所述预设情感类型。
5.根据权利要求1所述的方法,其特征在于,经所述预测模型预测用于填入所述掩码的候选答案及所述候选答案的概率,包括:
按照第二预设方式,分别从预设候选词表中选取M个肯定候选词和N个否定候选词作为候选答案;其中,所述肯定候选词用于表示所述二分类关系中的肯定关系,所述否定候选词用于表示所述二分类关系中的否定关系,所述预设候选词表包括:用于表示所述二分类关系中的肯定关系的多个肯定候选词,和用于表示所述二分类关系中的否定关系的多个否定候选词;M、N分别为大于0的整数;
利用所述预测模型,分别预测所述M个肯定候选词中各肯定候选词作为用于填入所述掩码的候选答案的概率;
利用所述预测模型,分别预测所述N个否定候选词中各否定候选词作为用于填入所述掩码的候选答案的概率。
6.根据权利要求1所述的方法,其特征在于,经所述预测模型预测用于填入所述掩码的候选答案及所述候选答案的概率,包括:
利用所述预测模型,分别预测预设候选词表中各候选词作为用于填入所述掩码的候选答案的概率;其中,所述预设候选词表包括:用于表示所述二分类关系中的肯定关系的多个肯定候选词,和用于表示所述二分类关系中的否定关系的多个否定候选词;
按照第三预设方式,从所述各候选词作为用于填入所述掩码的候选答案的概率中,选取M个肯定候选词作为用于填入所述掩码的候选答案的概率;其中,所述肯定候选词用于表示所述二分类关系中的肯定关系,M为大于0的整数;
按照所述第三预设方式,从所述各候选词作为用于填入所述掩码的候选答案的概率中,选取N个否定候选词作为用于填入所述掩码的候选答案的概率;其中,所述否定候选词用于表示所述二分类关系中的否定关系,N为大于0的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210887250.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微发泡耐磨型SPC贴彩膜
- 下一篇:一种传感器测试方法及相关装置