[发明专利]一种话术文本的视角分层方法和装置在审

申请号：	202011407449.1	申请日：	2020-12-03
公开（公告）号：	CN113779207A	公开（公告）日：	2021-12-10
发明（设计）人：	袁斌;郭培伦;赵东浩;郑鑫;温程;戚依楠	申请（专利权）人：	北京沃东天骏信息技术有限公司;北京京东尚科信息技术有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/335;G06F16/35;G06F40/211;G06F40/279;G06K9/62;G06Q30/06
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	张效荣;王志远
地址：	100176 北京市北京经济技术***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本视角分层方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种话术文本的视角分层方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：获取话术文本，根据话术文本场景对话术文本进行筛选处理，得到目标话术文本；根据目标话术文本的上下文语境序列，对目标话术文本进行基于话术文本视角的聚合处理，根据聚合处理结果构建语言场模型；获取待分层话术文本，根据语言场模型对待分层话术文本进行视角分层。该实施方式实现了对话术文本视角进行分层，拓展了话术文本视角的覆盖面，降低了人力成本，提高了话术文本的挖掘价值。

技术领域

本发明涉及计算机技术领域，尤其涉及一种话术文本的视角分层方法和装置。

背景技术

话术文本的视角分层(即话题概念分层)是用户态度分析的核心内容之一。话术文本的视角分层是指从话术文本中挖掘用户观点的评价角度，判断用户是围绕何种事物的主题(即以什么视角)进行用户反馈的。话术文本视角存在层次关系，比如“电风扇”是商品视角，“吹风量”是商品的功能视角，而“风扇扇叶”是商品的构件视角等等。话术文本视角通过分层，体现不同的用户关注的不同商品角度。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

现有方法中主要通过构建特征词库来界定话术文本的视角，所需人力成本高，所界定的话术文本视角覆盖面窄，且只能界定同一层次的话术文本视角，并未实现对话术文本视角进行分层，降低了话术文本的挖掘价值。

发明内容

有鉴于此，本发明实施例提供一种话术文本的视角分层方法和装置，能够实现对话术文本视角进行分层，拓展话术文本视角的覆盖面，降低人力成本，提高话术文本的挖掘价值。

为实现上述目的，根据本发明实施例的第一方面，提供了一种话术文本的视角分层方法，包括：

获取话术文本，根据话术文本场景对话术文本进行筛选处理，得到目标话术文本；

根据目标话术文本的上下文语境序列，对目标话术文本进行基于话术文本视角的聚合处理，根据聚合处理结果构建语言场模型；

获取待分层话术文本，根据语言场模型对待分层话术文本进行视角分层。

进一步地，在构建语言场模型的步骤之前，方法还包括：根据字间距对目标话术文本进行词语识别处理，根据词语识别处理结果确定特征词语；根据聚合处理结果构建语言场模型的步骤还包括：

根据特征词语和聚合处理结果构建语言场模型。

进一步地，根据字间距对目标话术文本进行词语识别处理，还包括：

计算目标话术文本中任意两个字的字间距均方差和字间距均值；