[发明专利]一种文章自动标签分类的方法及装置在审
申请号: | 201911131632.0 | 申请日: | 2019-11-19 |
公开(公告)号: | CN111177369A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 李梦平;庄良基;林溪;赵广亚 | 申请(专利权)人: | 厦门二五八网络科技集团股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门市思明区观音山宜兰路5号天瑞·99商务中心401、4*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文章 自动 标签 分类 方法 装置 | ||
1.一种文章自动标签分类的方法,其特征在于,包括:
文章标签端获取待执行标签,采用异步的方法,以多进程的方式将各待执行标签传输给索引端;
所述索引端接收所述文章标签端传输的待执行标签,根据所述待执行标签对已发布的文章全文检索,进行语义分析,得到语义分析结果,根据语义分析结果获取与待执行标签适应的文章,并将该文章传输给所述文章标签端;
所述文章标签端接收所述文章,并根据待执行标签对所述文章进行标签标记。
2.如权利要求1所述的方法,其特征在于,
所述获取待执行标签包括:读取启动属性值,根据所述启动属性值获取待执行标签。
3.如权利要求2所述的方法,其特征在于,
所述读取启动属性值,根据所述启动属性值获取待执行标签,包括:读取启动属性值,在所述启动属性值为启动时间的情形下,获取当前时间,在当前时间与所述启动时间时,获取待执行标签;在所述启动属性值为启动周期的情形下,开始定时,按照周期获取待执行标签。
4.如权利要求1所述的方法,其特征在于,
所述文章标签端获取待执行标签,采用异步的方法,以多进程的方式将各待执行标签传输给索引端,包括:
所述文章标签端在获取到待执行标签的情形下,发起若干个异步请求,生成与所述异步请求的数量相同的进程,交替执行,以读取所述待执行标签,将所述待执行标签传输给所述索引端。
5.如权利要求1所述的方法,其特征在于,
所述索引端接收所述文章标签端传输的待执行标签,根据所述待执行标签对已发布的文章全文检索,进行语义分析,得到语义分析结果,包括:
所述索引端接收所述文章标签端传输的待执行标签,采用全文检索引擎根据所述待执行标签对已发布的文章全文检索,进行语义分析,得到每篇已发布文章对应的语义分析结果。
6.如权利要求1所述的方法,其特征在于,
所述根据语义分析结果获取与待执行标签适应的文章,并将该文章传输给所述文章标签端,包括:
根据所述语义分析结果中的匹配权重获取文章唯一编码,获取与文章唯一编码对应的文章,将所述文章传输给所述文章标签端。
7.如权利要求6所述的方法,其特征在于,
所述根据所述语义分析结果中的匹配权重获取文章唯一编码的情形下,将所述文章唯一编码作为文章传输给所述文章标签端;
相应地,所述文章标签端接收所述文章唯一编码,并根据待执行标签对所述文章唯一编码进行标签标记,以完成对文章的标签标记。
8.一种文章自动标签分类的装置,其特征在于,包括:
文章标签模块和索引模块;
所述文章标签模块,用于获取待执行标签,采用异步的方法,以多进程的方式将各待执行标签传输给所述索引模块;还用于在接收到所述索引模块传输的文章时,接收所述文章,并根据待执行标签对所述文章进行标签标记;
所述索引模块,用于接收文章标签端传输的待执行标签,根据待执行标签对已发布的文章全文检索,进行语义分析,得到语义分析结果,根据语义分析结果获取与待执行标签适应的文章,并将该文章传输给文章标签模块。
9.一种计算机设备,其特征在于,包括:
包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序,所述程序被执行时,能够实现如权利要求1-7任一项所述的文章自动标签分类的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门二五八网络科技集团股份有限公司,未经厦门二五八网络科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911131632.0/1.html,转载请声明来源钻瓜专利网。