[发明专利]模型生成、语义识别的方法、系统、设备及存储介质在审
申请号: | 201810149170.4 | 申请日: | 2018-02-13 |
公开(公告)号: | CN110209831A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 王颖帅;李晓霞;苗诗雨 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/27;G06K9/62 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;邓忠红 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型生成 存储介质 语义识别 历史数据 特征提取 标注 标签 随机场模型 传统思路 基于条件 模板匹配 模型训练 确定条件 学习算法 用户体验 用户语义 中心词 迭代 品牌 机场 修饰 语音 灵活 询问 覆盖 学习 服务 | ||
1.一种模型生成的方法,其特征在于,包括以下步骤:
获取历史数据;
对每条所述历史数据进行特征提取及标注以得到对应的历史序列,每条所述历史序列包括特征提取后的特征和标注后的标签,所述标签包括物品的中心词、物品的修饰词、询问范围、物品的品牌及频道编号中的至少一种;
采用条件随机场学习算法对所述历史序列进行模型训练,以确定条件随机场模型的参数,所述参数包括迭代次数maxiter、步长stepsize和学习率learningrate。
2.如权利要求1所述的模型生成的方法,其特征在于,所述方法采用斯坦福CoreNLP对每条所述历史数据进行特征提取。
3.如权利要求2所述的模型生成的方法,其特征在于,所述特征包括分词特征、词性特征和品牌专有特征;
所述方法还包括预设品牌词库,所述品牌词库包括若干品牌;
所述采用斯坦福CoreNLP对每条所述历史数据进行特征提取包括:
采用斯坦福CoreNLP对每条所述历史数据进行分词以得到所述分词特征;
采用斯坦福CoreNLP对分词后的词语进行词性标注以得到所述词性特征;
根据分词后的词语是否为所述品牌词库中的品牌设置所述分词后的词语的所述品牌专有特征。
4.如权利要求3所述的模型生成的方法,其特征在于,所述方法还包括预设物品词库,所述方法采用斯坦福CoreNLP的正则匹配模板、所述物品词库及所述品牌词库对每条所述历史数据进行标注以得到所述标签。
5.如权利要求4所述的模型生成的方法,其特征在于,所述方法还包括设置所述条件随机场学习算法的特征模板,所述特征模板包括与所述品牌专有特征相对应的匹配规则。
6.如权利要求5所述的模型生成的方法,其特征在于,所述方法还包括利用N-gram模型调试所述特征模板。
7.如权利要求1至6任一项所述的模型生成的方法,其特征在于,所述条件随机场学习算法的优化实现算法采用拟牛顿法。
8.一种模型生成的系统,其特征在于,包括:
第一获取模块,用于获取历史数据;
处理模块,用于对每条所述历史数据进行特征提取及标注以得到对应的历史序列,每条所述历史序列包括特征提取后的特征和标注后的标签,所述标签包括物品的中心词、物品的修饰词、询问范围、物品的品牌及频道编号中的至少一种;
训练模块,用于采用条件随机场学习算法对所述历史序列进行模型训练,以确定条件随机场模型的参数,所述参数包括迭代次数maxiter、步长stepsize和学习率learningrate。
9.如权利要求8所述的模型生成的系统,其特征在于,所述处理模块采用斯坦福CoreNLP对每条所述历史数据进行特征提取。
10.如权利要求9所述的模型生成的系统,其特征在于,所述特征包括分词特征、词性特征和品牌专有特征;
所述系统还包括第一预设模块,所述第一预设模块用于预设品牌词库,所述品牌词库包括若干品牌;
所述处理模块采用斯坦福CoreNLP对每条所述历史数据进行特征提取包括:
所述处理模块采用斯坦福CoreNLP对每条所述历史数据进行分词以得到所述分词特征;
所述处理模块采用斯坦福CoreNLP对分词后的词语进行词性标注以得到所述词性特征;
所述处理模块根据分词后的词语是否为所述品牌词库中的品牌设置所述分词后的词语的所述品牌专有特征。
11.如权利要求10所述的模型生成的系统,其特征在于,所述系统还包括第二预设模块,所述第二预设模块用于预设物品词库,所述处理模块采用斯坦福CoreNLP的正则匹配模板、所述物品词库及所述品牌词库对每条所述历史数据进行标注以得到所述标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810149170.4/1.html,转载请声明来源钻瓜专利网。