[发明专利]一种排序学习方法、系统、计算机可读存储介质及设备有效

申请号：	201811522537.9	申请日：	2018-12-13
公开（公告）号：	CN109815317B	公开（公告）日：	2023-08-22
发明（设计）人：	张瑾;万里;洪敏;王新日	申请（专利权）人：	重庆德塔蔓灵科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/35;G06N20/00
代理公司：	上海光华专利事务所(普通合伙) 31219	代理人：	尹丽云
地址：	402660 重庆市潼***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种排序学习方法系统计算机可读存储介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种排序学习方法，该学习方法包括：获取问答数据，并根据众包机制对所述问答数据进行标记；对标记后的所述问答数据进行文本特征提取，以得到训练样本；将所述训练样本作为分类器的输入对分类器进行训练；利用训练好的分类器对待分类的问答数据进行分类。使用本发明可以借助众包机制将主观评价引入模型训练过程中，相比以前提出的方法而言，本框架更关注答案的主观信息。通过构建答案对这样的方式，进一步简化了人工标注的难度，从针对每个答案标注相关性得分转化为比较两个答案之间的好坏。

技术领域

本发明涉及一种学习方法，具体涉及一种排序学习方法、系统及设备。

背景技术

现有答案质量评价方法中主要关注答案的客观特征，答案的主观评价无法得到很好的量化。针对单个答案进行相关度评分没有考虑答案之间的相对顺序。对于传统的排序模型，人工标注训练数据成本高，如果模型参数过多，会使得经验方法的调参非常困难。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种排序学习方法及系统，以解决现有技术中人工标注训练数据成本高的问题。

为实现上述目的及其他相关目的，本发明提供一种排序学习方法，该学习方法包括：

获取问答数据，并根据众包机制对所述问答数据进行标记；

对标记后的所述问答数据进行文本特征提取，以得到训练样本；

将所述训练样本作为分类器的输入对分类器进行训练；

利用训练好的分类器对待分类的问答数据进行分类；

利用打分函数将分类后的问答数据所属的类别对应的标签转换为相应的分数。