[发明专利]一种移动互联网网页或媒体平台文章内容的准确提取方法有效

专利信息
申请号: 201610608825.0 申请日: 2016-07-28
公开(公告)号: CN106227858B 公开(公告)日: 2019-06-25
发明(设计)人: 汪子涵;陈新;丛军伟;汤怀;张伟峰;杜义明 申请(专利权)人: 北京橘子文化传媒有限公司
主分类号: G06F16/9535 分类号: G06F16/9535
代理公司: 北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人: 孟阿妮
地址: 100123 北京市朝阳区高碑店*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种移动互联网网页或媒体平台文章内容的准确提取方法,步骤分为获取同一移动端网站或媒体平台w下的threshold1个网页文本内容,标记获取的网页为ai;将网页ai内容按照html标准进行

之间文字段落、标签中图片链接、