[发明专利]一种5G移动业务产品名称识别方法及系统有效

专利信息
申请号: 202110654901.2 申请日: 2021-06-11
公开(公告)号: CN113255342B 公开(公告)日: 2022-09-30
发明(设计)人: 杜俊笙;段亮;李忠斌;岳昆 申请(专利权)人: 云南大学
主分类号: G06F40/279 分类号: G06F40/279;G06F40/242;G06N3/04;G06N3/08
代理公司: 北京高沃律师事务所 11569 代理人: 王爱涛
地址: 650091*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 移动 业务 产品名称 识别 方法 系统
【权利要求书】:

1.一种5G移动业务产品名称识别方法,其特征在于,包括:

S101:获取5G套餐办理类的通话文本;所述通话文本包括:通话内容、通话流水号以及文本类型;

S102:对所述通话内容进行预处理,构建单元化数据集;所述预处理包括:删除标记号以及数据分割;

S103:获取标准移动业务产品名称集;并对标准移动业务产品名称集进行口语化处理,构建最简移动业务产品集合;所述标准移动业务产品名称集为基于移动官方标准制定名称;

S104:根据所述最简移动业务产品集合确定过滤阈值;根据所述标准移动业务产品名称集确定单元切割阈值;该步骤具体包括:根据所述最简移动业务产品集合确定所有元素的最小长度;根据所述最小长度确定所述过滤阈值;根据标准移动业务产品名称集确定所有元素的最大长度;根据所述最大长度确定所述单元切割阈值,具体为:以α作为过滤阈值,β作为单元切割阈值,Q={。,?,!,……,,}作为单元切割符号集,基于最简移动业务产品集合M和标准移动业务产品名称集Y初始化α、β,计算得到M中所有元素的最小长度为l1、Y中所有元素的最大长度为l2,令α为2l1,β为2l2,其中α>0,β>0,α<β;对所述单元化数据集进行抽样,并利用抽样后的数据集对所述过滤阈值以及所述单元切割阈值进行校验和固定,具体为:在S'={S1',S2',S3'...}中,定义:条件一:len(Si')≤α;条件二:len(Si')>β;使得满足条件一的Si'不包含M中元素;满足条件二的Si'完成切割后,各部分长度都小于β,抽样校验步骤如下:(1)从1到n生成0.1*n个元素的随机数集合ξ,其中n由S'单元总数决定,并设置递增操作和递减操作的变化量为1;(2)读取S'中第i单元的数据为变量xi,xi长度为变量li,其中i∈ξ,1≤i≤n;(3)li与α,β判断:若li>β,则xi基于符号集Q切割,切割结果记录为变量其长度为变量若则β递增,执行步骤(1);若且包含M中元素,则α递减,执行步骤(1);若li≤α,且xi包含M中元素,则α递减,返回执行步骤(1);本步骤完成后,若α>0,输出α、β并执行步骤S105;否则跳过S105,并使得S”=S',其中,S”为处理后的数据集;

S105:利用所述过滤阈值、所述单元切割阈值对所述单元化数据集进行过滤以及切割,确定处理后的数据集,具体为:获取所述单元化数据集中第i单元的数据变量以及对应的变量长度;

判断所述第i单元的数据变量的变量长度与所述过滤阈值、所述单元切割阈值的大小关系,得到判断结果;

若所述判断结果为所述变量长度大于所述单元切割阈值,则基于符号集对所述第i单元的数据变量进行切割,确定切割后的数据变量以及切割后的变量长度;

若所述切割后的变量长度大于等于所述过滤阈值且小于等于所述单元切割阈值,则将切割后的数据变量加入处理后的数据集中;

若所述判断结果为所述变量长度大于等于所述过滤阈值且小于等于所述单元切割阈值,则将数据变量加入处理后的数据集中;

若所述判断结果为所述变量长度小于所述过滤阈值,则判断第i+1单元的数据变量;直至历遍所述单元化数据集中所有的数据变量;

S106:对所述处理后的数据集进行标注,并随机抽样,进而根据随机抽样的数据集确定训练集和测试集;

S107:利用所述训练集训练由双向长短期记忆神经网络模型与条件随机场模型组成的双向LSTM+CRF模型;

S108:根据所述处理后的数据集,利用训练后的双向LSTM+CRF模型,确定移动业务产品名称识别结果集;并根据所述移动业务产品名称识别结果集构建移动业务产品名称字典;所述构建移动业务产品名称字典的字典键为标准移动业务产品名称集中的元素,字典值为移动业务产品名称识别结果集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110654901.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top