[发明专利]一种用于智能交互的语义模型方法在审
申请号: | 201510603616.2 | 申请日: | 2015-09-21 |
公开(公告)号: | CN105205045A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 李波;曾永梅;姚贡之;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海大邦律师事务所 31252 | 代理人: | 袁洋 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 智能 交互 语义 模型 方法 | ||
技术领域
本发明涉及一种智能交互方法,更具体的说是涉及一种用于智能交互的语义模型方法。
背景技术
在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。
发明内容
本发明公开了一种用于智能交互的语义模型方法,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。
所述步骤A中的分词会基于特定领域的实例。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。
具体实施方式
下面对本方法进行具体说明:
A、对用户发出的信息进行分词;
分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”,
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
对于实体,是本体的实例化,
所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:
——具体的本体实例(对象Object)
——本体的属性
——所属的本体类别。
本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
对于语义标注分析,包括词性标注和词义标注两个部分:
对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;
对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。
本系统还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。
所述步骤A中的分词会基于特定领域的实例。
具体来说,本专利的分词会基于特定领域,因为相同的汉字或词组在不同领域其分词
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510603616.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据挖掘方法及装置
- 下一篇:数据采样点搜寻方法和装置