[发明专利]一种话术文本的视角分层方法和装置在审
申请号: | 202011407449.1 | 申请日: | 2020-12-03 |
公开(公告)号: | CN113779207A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 袁斌;郭培伦;赵东浩;郑鑫;温程;戚依楠 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/335;G06F16/35;G06F40/211;G06F40/279;G06K9/62;G06Q30/06 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张效荣;王志远 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 视角 分层 方法 装置 | ||
1.一种话术文本的视角分层方法,其特征在于,包括:
获取话术文本,根据话术文本场景对所述话术文本进行筛选处理,得到目标话术文本;
根据所述目标话术文本的上下文语境序列,对所述目标话术文本进行基于话术文本视角的聚合处理,根据聚合处理结果构建语言场模型;
获取待分层话术文本,根据所述语言场模型对所述待分层话术文本进行视角分层。
2.根据权利要求1所述的话术文本的视角分层方法,其特征在于,在构建所述语言场模型的步骤之前,所述方法还包括:根据字间距对所述目标话术文本进行词语识别处理,根据词语识别处理结果确定特征词语;所述根据聚合处理结果构建语言场模型的步骤还包括:
根据所述特征词语和所述聚合处理结果构建语言场模型。
3.根据权利要求2所述的话术文本的视角分层方法,其特征在于,所述根据字间距对所述目标话术文本进行词语识别处理,还包括:
计算所述目标话术文本中任意两个字的字间距均方差和字间距均值;
根据所述字间距方差和所述字间距均值对所述目标话术文本进行词语识别处理。
4.根据权利要求1所述的话术文本的视角分层方法,其特征在于,所述根据所述目标话术文本的上下文语境序列,对所述目标话术文本进行基于话术文本视角的聚合处理,还包括:
计算所述目标话术文本的当前语境序列和平均语境序列;
根据所述当前语境序列和平均语境序列对所述目标话术文本进行基于话术文本视角的聚合处理。
5.根据权利要求1所述的话术文本的视角分层方法,其特征在于,所述根据所述语言场模型对所述待分层话术文本进行视角分层,还包括:
根据所述语言场模型对所述待分层话术文本进行识别处理,根据识别处理结果确定待分层话术文本对应的视角分层。
6.根据权利要求1所述的话术文本的视角分层方法,其特征在于,还包括:
根据所述语言场模型指示的话术文本视角构建目标词语,根据所述目标词语对所述语言场模型进行优化。
7.根据权利要求1所述的话术文本的视角分层方法,其特征在于,在得到所述目标话术文本的步骤之前,所述方法还包括:
对所述话术文本执行下列处理中的至少一种:去重处理、分词处理、转换处理。
8.一种话术文本的视角分层装置,其特征在于,包括:
筛选处理模块,用于获取话术文本,根据话术文本场景对所述话术文本进行筛选处理,得到目标话术文本;
语言场模型构建模块,用于根据所述目标话术文本的上下文语境序列,对所述目标话术文本进行基于话术文本视角的聚合处理,根据聚合处理结果构建语言场模型;
视角分层模块,用于获取待分层话术文本,根据所述语言场模型对所述待分层话术文本进行视角分层。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司,未经北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011407449.1/1.html,转载请声明来源钻瓜专利网。