[发明专利]用户需求分析定位器和分析及定位方法有效
申请号: | 201210445804.3 | 申请日: | 2012-11-09 |
公开(公告)号: | CN102999569A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 蒋昌俊;陈闳中;闫春钢;丁志军;王鹏伟;孙海春;邓晓栋 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海天协和诚知识产权代理事务所 31216 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 需求 分析 定位器 定位 方法 | ||
1.一种用户需求分析及定位方法,其特征在于,具体包括如下步骤:
(1)利用现有的分词算法对用户的输入进行切词;
(2)根据已经建立的近义词库对关键词进行特征向量的扩展,使得在搜索结果中能够反映出与近义词相关的网页;
(3)根据形成的特征向量与网络信息服务系统中基础类的特征向量进行比对,取和该特征向量最相似的特征向量所属的类为该特征向量定位到的类。
2.如权利要求1所述的用户需求分析及定位方法,其特征在于,所述步骤(1),具体采用下方法实现:使用搜狗输入法的词库及现有的分词算法-最短路径匹配算法,来对用户的输入进行切词。
3.如权利要求1所述的用户需求分析及定位方法,其特征在于,所述步骤(2),其特征在于,具体采用下方法实现:
步骤一:将步骤(1)中产生的切词分量根据近义词库找出它们n个近义词集,其中近义词库建立方法为通过分析互联网上各个词典中对于近义词的描述,对每个词的近义词进行加权;
步骤二:步骤一中选取的近义词集中选取m个词作为本次用户输入的特征向量;选取的时候考虑用户输入的完整性;即当m>=n时,根据切词的结果产生的每个近义词集中至少有一个出现在特征向量中,其他词的选择则根据该词的权值占所有扩展成的近义词的比例来从高到低进行选择;当m<n时,则选择所有扩展成的近义词集中权值最高的词组成集合中的前m个作为用户输入的特征向量。
4.如权利要求1所述的用户需求分析及定位方法,其特征在于,所述步骤(3),其特征在于,具体采用下方法实现:
步骤一:让用户需求特征向量中的关键词与每个基础类的特征向量的关键词进行匹配,如果有相同的关键词,则加权为1,如果互相包含则加权为0.5,匹配完成后,每个基础类和用户的输入向量均有一个匹配值;
步骤二:根据用户的输入和每个定义的类的匹配权值,选择匹配到的类的集合;如果要定位到一个类中,则选择其中权值最高的类作为定位的结果输出;如果要选择定位的n个类中,则选择匹配中前n高权值的类作为结果输出。
5.一种用户行为需求分析定位器,其特征在于,它包括用户需求分析模块和用户需求定位模块,所述用户需求分析模块实现理解用户输入的信息,它包括分词处理器和特征向量扩展器,所述用户需求定位模块为需求定位器,将用户的输入信息定位到网络信息服务系统中的基础类中,每个类中都包含有和该类相关的网页,其中:
所述分词处理器利用现有的分词算法对用户的输入进行切词,从而更好的理解用户需求;
所述特征向量扩展器,根据已经建立的近义词库对关键词进行特征向量的扩展,使得在搜索结果中能够反映出与近义词相关的网页;
所述需求定位器,根据形成的特征向量与网络信息服务系统中基础类的特征向量进行比对,取和该特征向量最相似的特征向量所属的类为该特征向量定位到的类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210445804.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增益频率补偿方法及装置
- 下一篇:一种用于数码相机数据的快速质量检测方法