[发明专利]一种信息挖掘方法及装置有效
申请号: | 201611155819.0 | 申请日: | 2016-12-14 |
公开(公告)号: | CN106708808B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 王伟 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F40/40 | 分类号: | G06F40/40;G06F16/953 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 译文 检索 参考信息 检索结果 检索条目 引导作用 网络搜索 信息挖掘 参考 返回 引导式 | ||
1.一种信息挖掘方法,其特征在于,包括:
获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;
从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;
将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;
基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目;
所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:依据不同关键词对应的翻译译项的数量,以及依据采用同一关键词的每个翻译译项进行引导式检索时搜索引擎返回的检索条目的个数,从各个关键词对应的翻译译项中确定出引导作用较大的至少一个翻译译项作为译文引导词;
其中,对于不同关键词的翻译译项,关键词对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;对于同一关键词的翻译译项,翻译译项对应的所述检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。
2.根据权利要求1所述的方法,其特征在于,所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:
对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;
从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。
3.根据权利要求2所述的方法,其特征在于,所述对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,包括:
依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序;
当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;
依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序。
4.根据权利要求1所述的方法,其特征在于,所述将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果,包括:
将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。
5.根据权利要求4所述的方法,其特征在于,基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,包括:
对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;
依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各检索条目与所述待译对象的相关度数值;
基于相关度数值,对合并后所得的各个检索条目进行排序;
从排序后所得的条目序列的相应端获得相关度数值较高的至少一个检索条目,并返回所述至少一个检索条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611155819.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:手写笔迹校正方法和装置
- 下一篇:业务数据的处理方法和装置