[发明专利]关键词汇实时扩展方法、系统及其计算机可擦写记录媒体无效
申请号: | 200910006748.1 | 申请日: | 2009-02-18 |
公开(公告)号: | CN101807183A | 公开(公告)日: | 2010-08-18 |
发明(设计)人: | 谢长泰;林卓彦;杨佳元;周世俊 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈亮 |
地址: | 中国台湾台北市1*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 词汇 实时 扩展 方法 系统 及其 计算机 擦写 记录 媒体 | ||
1.一种关键词汇实时扩展方法,包括:
接收一查询词汇;
根据该查询词汇,分别于多个搜寻引擎上进行一数据搜寻;
分别由每一该些搜寻引擎获得相关于该查询词汇的多笔文件片段,其中每一文件片段具有至少一文句;
分析每一该些文件片段以建立一相关词汇表,其中该相关词汇表中,对于每一该些文件片段列举出现在该文件片段中的多个关键词汇,其中每一该些关键词汇具有一语意;
根据该相关词汇表中的每一该些文件片段所相对应的每一该些关键词汇与该查询词汇在该文件片段中的一相对应位置关系,进行一关联计算步骤,以分别赋予每一该些文件片段的每一该些关键词汇一关联值;
进行一语意合并步骤,计算具有相同该语意的每一该些关键词汇在该些文件片段中的该些关联值成一关联指针;以及
根据每一该些关键词汇的该关联指针,决定部分该些关键词汇组成该查询词汇的一关键词汇集合。
2.如权利要求1所述的关键词汇实时扩展方法,其特征在于,该关联计算步骤根据一第一等式:
其中Query代表该查询词汇,Keytermj代表该关键词汇,score(Query,Keytermj)代表相关该查询词汇的该关键词汇的该关联值,NS(Query∩Keytermj)代表该查询词汇与该关键词汇同时出现在单一该文句中的次数,NS(Query)代表该查询词汇的在该文件片段中出现的次数,NS(Keytermj)代表该关键词汇的在该文件片段中出现的次数,NS(Query)∪NS(Keytermj)代表该查询字汇与该关键词汇的在该文件片段中出现的次数总合,dist(Query,Keytermj)代表该查询字汇与该关键词汇之间所间隔的一文句数量。
3.如权利要求1所述的关键词汇实时扩展方法,其特征在于,该语意合并步骤还包括:
进行一语意中心计算,计算具有相同该语意的每一该些关键词汇在该些文件片段中的相对应该些关联值成为一中心值;以及
进行一正规化步骤,以将该些关键词汇的相对应该些中心值正规化成该些关键指针,其中该些关键指针的一总和为一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910006748.1/1.html,转载请声明来源钻瓜专利网。