[发明专利]一种基于Albert模型的商机识别方法、装置及电子设备在审
申请号: | 202111373117.0 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114065772A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 候雪飞 | 申请(专利权)人: | 浙江百应科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/151;G06F16/35 |
代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 albert 模型 商机 识别 方法 装置 电子设备 | ||
1.一种基于Albert模型的商机识别方法,其特征是,所述方法包括:
获取私域场景下的对话文本进行预处理获得第一对话文本,其中,所述预
处理包括正则匹配和ID过滤;
将所述第一对话文本转化为第一对话文本特征后输入已训练的Albert模型获得第一分类结果,其中,所述已训练的Albert模型通过私域场景下的对话文本数据训练获得,所述第一分类结果用于判断所述第一对话文本为商机语句或非商机语句。
2.根据权利要求1所述的一种基于Albert模型的商机识别方法,其特征是,所
述已训练的Albert模型通过私域场景下的对话文本数据训练获得包括:
获取私域场景下的对话文本数据进行预处理获得多个对话文本;
将所述多个对话文本拆分成第一对话文本训练集和第一对话文本测试集;
对所述第一对话文本训练集和所述第一对话文本测试集中的商机语句进行标
注,并替换所述商机语句中的商品名称为通配符获得第二对话文本训练集和第二对话文本测试集;
将所述第二对话文本训练集、所述第二对话文本测试集中的每一对话文本转
换为文本特征后输入Albert模型进行训练、测试获得已训练的Albert模型。
3.根据权利要求2所述的一种基于Albert模型的商机识别方法,其特征是,将
所述商机语句中的商品名称为Goods通配符。
4.根据权利要求2所述的一种基于Albert模型的商机识别方法,其特征是,将
Albert模型的最后隐藏层作为每一对话文本的表示,使用全连接层映射到分类任务上获得所述第一分类结果。
5.一种基于Albert模型的商机识别装置,其特征是,所述装置包括:
第一获取单元,用于获取私域场景下的对话文本进行预处理获得第一对话文
本,其中,所述预处理包括正则匹配和ID过滤;
第二获取单元,用于将所述第一对话文本转化为第一对话文本特征后输入已训练的Albert模型获得第一分类结果,其中,所述已训练的Albert模型通过私域场景下的对话文本数据训练获得,所述第一分类结果用于判断所述第一对话文本为商机语句或非商机语句。
6.一种电子设备,其特征是,所述电子设备包括处理器和存储器,所述存储
器中存储有至少一条指令、至少一段程序、待码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器执行以实现如权利要求1-4任一项所述的基于Albert模型的商机识别方法。
7.一种计算机可读存储介质,其特征是,所述计算机可读存储介质中存储有
至少一条指令、至少一段程序、待码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器执行以实现如权利要求1-4任一项所述的基于Albert模型的商机识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111373117.0/1.html,转载请声明来源钻瓜专利网。