[发明专利]一种话术文本的视角分层方法和装置在审
申请号: | 202011407449.1 | 申请日: | 2020-12-03 |
公开(公告)号: | CN113779207A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 袁斌;郭培伦;赵东浩;郑鑫;温程;戚依楠 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/335;G06F16/35;G06F40/211;G06F40/279;G06K9/62;G06Q30/06 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张效荣;王志远 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 视角 分层 方法 装置 | ||
本发明公开了一种话术文本的视角分层方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取话术文本,根据话术文本场景对话术文本进行筛选处理,得到目标话术文本;根据目标话术文本的上下文语境序列,对目标话术文本进行基于话术文本视角的聚合处理,根据聚合处理结果构建语言场模型;获取待分层话术文本,根据语言场模型对待分层话术文本进行视角分层。该实施方式实现了对话术文本视角进行分层,拓展了话术文本视角的覆盖面,降低了人力成本,提高了话术文本的挖掘价值。
技术领域
本发明涉及计算机技术领域,尤其涉及一种话术文本的视角分层方法和装置。
背景技术
话术文本的视角分层(即话题概念分层)是用户态度分析的核心内容之一。话术文本的视角分层是指从话术文本中挖掘用户观点的评价角度,判断用户是围绕何种事物的主题(即以什么视角)进行用户反馈的。话术文本视角存在层次关系,比如“电风扇”是商品视角,“吹风量”是商品的功能视角,而“风扇扇叶”是商品的构件视角等等。话术文本视角通过分层,体现不同的用户关注的不同商品角度。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有方法中主要通过构建特征词库来界定话术文本的视角,所需人力成本高,所界定的话术文本视角覆盖面窄,且只能界定同一层次的话术文本视角,并未实现对话术文本视角进行分层,降低了话术文本的挖掘价值。
发明内容
有鉴于此,本发明实施例提供一种话术文本的视角分层方法和装置,能够实现对话术文本视角进行分层,拓展话术文本视角的覆盖面,降低人力成本,提高话术文本的挖掘价值。
为实现上述目的,根据本发明实施例的第一方面,提供了一种话术文本的视角分层方法,包括:
获取话术文本,根据话术文本场景对话术文本进行筛选处理,得到目标话术文本;
根据目标话术文本的上下文语境序列,对目标话术文本进行基于话术文本视角的聚合处理,根据聚合处理结果构建语言场模型;
获取待分层话术文本,根据语言场模型对待分层话术文本进行视角分层。
进一步地,在构建语言场模型的步骤之前,方法还包括:根据字间距对目标话术文本进行词语识别处理,根据词语识别处理结果确定特征词语;根据聚合处理结果构建语言场模型的步骤还包括:
根据特征词语和聚合处理结果构建语言场模型。
进一步地,根据字间距对目标话术文本进行词语识别处理,还包括:
计算目标话术文本中任意两个字的字间距均方差和字间距均值;
根据字间距方差和字间距均值对目标话术文本进行词语识别处理。
进一步地,根据目标话术文本的上下文语境序列,对目标话术文本进行基于话术文本视角的聚合处理,还包括:
计算目标话术文本的当前语境序列和平均语境序列;
根据当前语境序列和平均语境序列对目标话术文本进行基于话术文本视角的聚合处理。
进一步地,根据语言场模型对待分层话术文本进行视角分层,还包括:
根据语言场模型对待分层话术文本进行识别处理,根据识别处理结果确定待分层话术文本对应的视角分层。
进一步地,还包括:
根据语言场模型指示的话术文本视角构建目标词语,根据目标词语对语言场模型进行优化。
进一步地,在得到目标话术文本的步骤之前,方法还包括:
对话术文本执行下列处理中的至少一种:去重处理、分词处理、转换处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司,未经北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011407449.1/2.html,转载请声明来源钻瓜专利网。