[发明专利]一种网页的文字排版方法、装置、设备和存储介质有效
申请号: | 202110744838.1 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113553524B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 徐治钦;周桂麟;冯嘉妍 | 申请(专利权)人: | 上海硬通网络科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06T11/60;G06F40/109;G06V10/764;G06V10/82;G06V40/10;G06N3/04;G06F9/451 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈志明 |
地址: | 201800 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 文字 排版 方法 装置 设备 存储 介质 | ||
1.一种网页的文字排版方法,其特征在于,包括:
响应于对网页的语言类型的切换操作,获取所述网页的语言类型转换后的文字内容,并获取所述网页的页面图片及所述页面图片在所述网页中的位置信息;
对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果;
根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容;
根据所述页面图片的位置信息及所述页面图片周围预设距离内的各网页页面元素的位置,对应确定所述转换后的文字内容在所述网页中的排版区域;
将所述转换后的文字内容排版在所述网页对应的所述排版区域中;
所述对所述页面图片的图片内容进行识别,得到所述图片内容的识别结果,具体包括:将页面图片输入到预先训练好的图像分类识别模型中,得到所述页面图片的图片内容的识别结果;
所述根据所述页面图片的图片内容的识别结果,确定与所述页面图片的图片内容对应的转换后的文字内容,具体包括:
基于预设的图片内容的识别结果与文字样本集的对应关系,获取与所述图片内容的识别结果对应的文字样本集;所述文字样本集包括至少一个与所述图片内容识别结果预先对应的文字样本;
计算转换后的文字内容与文字样本集信息中各文字样本的文本的匹配度,并将所有的匹配度的值相加后求平均值,得到平均匹配度;
若所述平均匹配度大于预设的匹配度阈值,将所述转换后的文字内容对应于与所述文字样本集对应的页面图片。
2.如权利要求1所述的网页的文字排版方法,其特征在于,所述方法还包括:
将所述转换前的文字内容与所述转换后的文字内容进行文字映射,得到文字映射结果;
获取与所述转换前的文字内容对应的文字排版顺序;
根据所述文字映射结果和所述转换前的文字内容对应的文字排版顺序,确定所述转换后的文字内容的文字排版策略;其中,所述文字排版策略包括所述文字排版顺序;
则,所述将所述转换后的文字内容排版在所述网页对应的所述排版区域中,具体包括:
根据所述文字排版策略,将所述转换后的文字内容排版在所述网页对应的所述排版区域中。
3.如权利要求2所述的网页的文字排版方法,其特征在于,所述文字排版策略还包括文字排版样式,所述文字排版样式包括文字动态效果和文字颜色;
则,所述方法还包括:
根据所述页面图片确定所述文字动态效果和所述文字颜色。
4.如权利要求3所述的网页的文字排版方法,其特征在于,所述文字排版样式还包括字体、字号、字距、对齐方式和行距;
则,所述方法还包括:
根据所述排版区域的大小和所述转换后的文字内容的字数,确定转换后的文字内容的字体、字号、字距、对齐方式和行距。
5.如权利要求2所述的网页的文字排版方法,其特征在于,所述根据所述文字排版策略,将所述转换后的文字内容排版在所述排版区域中,具体包括:
根据所述转换后的文字内容的文字排版顺序和预设的折行算法,将所述转换后的文字内容排版在所述排版区域中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海硬通网络科技有限公司,未经上海硬通网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110744838.1/1.html,转载请声明来源钻瓜专利网。