[发明专利]一种基于概率潜在语义分析的网络答案选择方法无效
申请号: | 200910155471.9 | 申请日: | 2009-12-12 |
公开(公告)号: | CN101751454A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 卜佳俊;陈纯;曲明成;仇光;吴昊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 概率 潜在 语义 分析 网络 答案 选择 方法 | ||
技术领域
本发明涉及一种用于网络上的问答社区的答案选择方法,特别是一种基于概率潜在语义分析的网络答案选择方法。
技术背景
近年来,旨在增进用户交流的问答社区日益受到研究人员的关注。在过去几年间出现了诸如新浪爱问、百度知道、Yahoo!Answers等问答社区。用户可以自由地提出问题、浏览问题、回答问题。然而随着问答社区参与用户的日益增多,候选答案数目随之增长,导致提问用户选择最佳答案的负担不断加大。因此,对候选答案的自动排序成为问答社区的一个迫切需要。
答案选择是一种将候选答案进行排序的技术。现有的答案选择方法针对传统问答系统预测答案,然而,这种方法未充分利用问答社区中丰富的用户信息,准确率低,适用性小。
发明内容
为克服现有技术的无法充分利用问答社区中丰富的用户信息,准确率低,适用性小的缺点,本发明提供了一种能充分利用问答社区中丰富的用户信息,准确率高,适用性广的基于概率潜在语义分析的网络答案选择方法。
一种基于概率潜在语义分析的网络答案选择方法,包括以下步骤:
1、提取问答社区中用户提出的问题q及问题q对应的答案a组成问题集C,C={{q1,a1},{q2,a2},...{qi,ai},...{qf,af}},其中,{qi,ai}为第i个问题及其对应的答案;抽取提出问题和回答问题的用户名组成用户集{u1,u2,...ui,...um},其中ui为第i个用户名;抽取组成每个问题q及其对应答案a的词语、构成词语集{w1,w2,...wi,...wn},其中wi为第i个词语;
2、以用户集u和词语集w作为变量构建概率潜在语义分析模型,利用所述的概率潜在语义分析模型挖掘各用户u的潜在主题信息;
3、获取问答社区中新提出的问题q,及组成该问题的词语w,利用步骤2)得出的潜在主题信息确定当前问题与候选答案的联合概率,以及计算当前问题与回答当前问题的用户的联合概率;
4、将当前问题与候选答案的联合概率以及问题与回答当前问题的用户的联合概率进行线性加权得到候选答案得分,对候选答案得分进行降序排列,将答案根据排列顺序推送给提问用户。
进一步,步骤2)中构建概率潜在语义分析模型的步骤包括:
2.1、采用二元组(u,w)表示用户在回答问题时输入词语的事件,u表示用户集,w表示组成该问题的词语;给出主题集{z1,z2,...zi,...zm};
2.2、计算给定用户、词语的情形下,主题的概率Pr(z|u,w),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910155471.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据录入方法及装置
- 下一篇:数据同步方法和数据同步系统