[发明专利]基于人工智能的话题识别方法、装置、服务器及介质在审
申请号: | 202111138884.3 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113850077A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 翟永青 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 姚泽鑫 |
地址: | 200000 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 话题 识别 方法 装置 服务器 介质 | ||
1.一种基于人工智能的话题识别方法,其特征在于,所述方法包括:
获取会话内容,根据所述会话内容的内容形式,将所述会话内容转换成会话文本,以及根据预设分词算法,对所述会话文本进行分词处理,得到多个切分词;
根据各预设关键词集中的、与各切分词相匹配的关键词的相关信息,确定所述多个切分词与各预设关键词集之间的匹配度,所述匹配度用于指示所述会话内容与相应预设关键词集对应的目标话题之间的相似程度,一个预设关键词集对应得到一个匹配度;
根据各预设关键词集对应的目标话题和所述多个切分词与各预设关键词集之间的匹配度,确定所述会话内容所属的话题。
2.根据权利要求1所述的基于人工智能的话题识别方法,其特征在于,所述方法还包括:
分别获取各目标话题对应的样本会话文本,根据所述预设分词算法对所述样本会话文本进行分词处理,以及将分词处理得到的切分词作为关键词存入相应目标话题的预设关键词集。
3.根据权利要求1所述的基于人工智能的话题识别方法,其特征在于,所述预设关键词集中的关键词的相关信息包括频率系数和区分度系数,以及所述方法还包括:
针对各目标话题对应的预设关键词集中的关键词,根据该关键词在相应目标话题中的出现频次和该关键词在除所述相应目标话题外的目标话题中的出现频次,确定该关键词的频率系数和区分度系数;
其中,频率系数用于指示关键词在该目标话题中的出现频率,区分度系数用于指示关键词区分该目标话题与其它目标话题的区分程度。
4.根据权利要求3所述的基于人工智能的话题识别方法,其特征在于,所述根据各预设关键词集中的、与各切分词相匹配的关键词的相关信息,确定所述多个切分词与各预设关键词集之间的匹配度,包括:
针对每个预设关键词集,从该预设关键词集中选取分别与各切分词匹配的关键词,得到多个关键词;
计算各关键词的频率系数和区分度系数的乘积,得到多个乘积值,将多个乘积值的和值,确定为该预设关键词集的权重系数;
将该预设关键词集的权重系数和其它各预设关键词集的权重系数进行归一化处理,将该预设关键词集的归一化后的权重系数,确定为所述多个切分词与该预设关键词集之间的匹配度。
5.根据权利要求1所述的基于人工智能的话题识别方法,其特征在于,所述根据各预设关键词集中的、与各切分词相匹配的关键词的相关信息,确定所述多个切分词与各预设关键词集之间的匹配度,包括:
针对每个预设关键词集,从该预设关键词集中选取分别与各切分词匹配的关键词,得到多个关键词;
根据所得到的关键词的数目和所述多个切分词的数目,确定该预设关键词集对所述多个切分词的覆盖率,以及将所述覆盖率确定为该预设关键词集与所述多个切分词之间的匹配度;
其中,所述覆盖率用于指示预设关键词集中选取得到的关键词在所述多个切分词中的占比。
6.根据权利要求3所述的基于人工智能的话题识别方法,其特征在于,所述区分度系数包括以下任一项:
关键词在该目标话题中的出现次数与在其它各目标话题中的总出现次数的比值,记作第一比值;
关键词在该目标话题中的出现频率与在其它各目标话题中的出现频率之和的比值,记作第二比值;
所述第一比值与所述第二比值的加权和。
7.根据权利要求1-6中任一项所述的基于人工智能的话题识别方法,其特征在于,所述根据所述会话内容的内容形式,将所述会话内容转换成会话文本,包括:
从所述会话内容中识别出对应不同内容形式的内容部分,所述内容形式包括以下至少一项:语音形式,图片形式,文本形式;
保留所述会话内容中的、对应内容形式为文本形式的内容部分,将所述会话内容中的、对应内容形式为语音形式的内容部分转换成文本,以及删除所述会话内容中的、对应内容形式为图片形式的内容部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138884.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于区块链的智慧工地监控系统
- 下一篇:液体化妆料保持·供给用垫