[发明专利]基于智能问答系统会话历史的新词发现方法及系统有效
申请号: | 201510959114.3 | 申请日: | 2015-12-18 |
公开(公告)号: | CN105630890B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 游世学;杜新凯 | 申请(专利权)人: | 北京中科汇联科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙)11417 | 代理人: | 李文军 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于智能问答系统会话历史的新词发现方法,分析了新词的四个重要特征,即含有多个字、在一定数量的文本中出现多次、具有较高的凝固度,具有较高的自由度,通过数学语言进行定义,使计算机可以直接计算给定文本中的给定的若干候选字是否满足新词的特征,从而对新词进行识别。本发明还提供了一种基于智能问答系统会话历史的新词发现系统,将新词发现系统融合到智能问答系统中,使得智能问答系统具备自动发现新词的功能,持续完善和提高了智能问答系统的性能。 | ||
搜索关键词: | 基于 智能 问答 系统 会话 历史 新词 发现 方法 | ||
【主权项】:
一种基于智能问答系统会话历史的新词发现方法,其特征在于,所述方法包括如下步骤:S1、对智能问答系统的会话历史建立索引,所述索引中包含新词的候选词;S2、依次遍历索引中的候选词,计算每个候选词在所述会话历史中的出现频度,如果候选词的出现频度低于预设的频度阈值,则判断该候选词不是新词,如果候选词的出现频度不低于所述频度阈值,则执行步骤S3;S3、计算候选词的凝固度,如果候选词的凝固度低于预设的凝固度阈值,则判断该候选词不是新词,如果候选词的凝固度不低于所述凝固度阈值,则执行步骤S4;S4、计算候选词的自由度,如果候选词的自由度低于预设的自由度阈值,则判断该候选词不是新词,如果候选词的自由度不低于所述自由度阈值,则判断该候选词为新词,所述对智能问答系统的会话历史建立索引,所述索引中包含新词的候选词包括:S11、建立索引;S12、提取会话历史中的词语,判断所述词语是否已经存在于所述智能问答系统的系统词表中,如果已经存在,则判断所述词语不是新词的候选词,否则,判断所述词语是新词的候选词,并将其加入索引中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科汇联科技股份有限公司,未经北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510959114.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种捻股生产工艺
- 下一篇:旅游信息处理方法和装置