[发明专利]专家库建立办法和装置有效
申请号: | 201611108848.1 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106776978B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 霍东云;崔星汉;方垚;李燕茜 | 申请(专利权)人: | 北京赛时科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06K9/62;G06Q50/00 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 孙海龙 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 专家库 建立 办法 装置 | ||
本发明涉及一种专家库建立方法和装置,该方法包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
技术领域
本发明涉及专家库的建立。
背景技术
专家是特定领域有卓越表现和高度专业能力的个人。一方面,专家可以在科技项目开发中起到重要的作用,另一方面,很多评审等活动需要专家的参与,例如招标等。实际上,2003年发改委还专门制定了《评标专家和评标专家库管理暂行办法》。但是目前所建立的专家数据库要么局限在人员手工的收集,要么是专家自己的报名。现有技术中,没有好的办法根据大量的信息(例如互联网信息)或大的总库中寻找特定专家的办法。
发明内容
本发明针对现有技术的以上缺点做出,用以克服现有技术的一个或更多个缺点,至少提供一种有益的选择。
根据本发明的一个方面,提供了一种专家库建立方法,包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家模型;直接专家识别步骤,利用所建立的专家模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于领域专家。
根据本发明的另一方面,提供了一种专家库建立装置,包括:专家样本收集装置,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立装置,根据训练库建立专家分类模型;直接专家识别装置,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别装置,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
根据本发明的实施方式,可以快速而准确地建立专家库。
附图说明
附图仅仅是示例性的,不是对本发明的保护范围的限制。
图1示出了依据本发明的一种实施方式的专家库建立方法的流程图。
图2示出了依据本发明的另一种实施方式的专家库建立方法的流程图。
图3示出了依据本发明的一种实施方式的专家库建立装置的示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,对本发明的以下描述仅仅是为了本领域技术人员能够实现本发明,不是对本发明的保护范围的限制。
图1示出了依据本发明的一种实施方式的专家库建立方法的流程图。如图1所示,首先在步骤101中进行专家样本收集。收集特定领域的专家的样本,包含该专家所作的论文、专利、项目。这些样本可被分为训练集和测试集。训练集用于建立专家模型,测试集用于测试和改进专家模型。根据本发明的一种实施方式,训练集中的样本数目是测试集中的样本数目的4.5倍到9倍。另外,根据本发明的一种实施方式,将训练集分为论文训练集、专利训练集和项目训练集。将测试集分为论文测试集、专利测试集和项目测试集。训练集中出现的样本被称为训练语料。测试集中的出现的样本被称为测试语料。
接着在步骤102,构建专家分类模型。该步骤可以分为专家分类模型构建步骤1021和专家分类模型修正步骤1022。在专家分类模型构建步骤中,利用训练集构建专利分类模型。在专家分类模型修正步骤中,利用测试集对专家分类模型进行测试,并调整参数,得到错判、漏判率都较低的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛时科技有限公司,未经北京赛时科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611108848.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索音乐的方法及装置
- 下一篇:基于遥感的矢量电子地图质量提升自动化方法