[发明专利]多语言排版的显示方法、装置、浏览器、终端及介质有效
申请号: | 201810061020.8 | 申请日: | 2018-01-22 |
公开(公告)号: | CN108170660B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 肖求根 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/189 | 分类号: | G06F40/189;G06F40/58 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种多语言排版的显示方法、装置、浏览器、终端及计算机可读存储介质,其中多语言排版的显示方法包括:获取待排版的文本;识别在所述待排版的文本的主体语言文本中的嵌入语言内容,嵌入语言内容包括在所述主体语言文本中嵌入的至少一种非主体语言的内容;确定所述嵌入语言内容的替换内容,其中,所述替换内容包括与所述嵌入语言内容对应的主体语言文本或者嵌入语言内容中非主体语言文本的缩写;以及将嵌入语言内容替换为所述替换内容。本发明实施例避免了多语言排版前端显示中字间距畸变的情况,即能够展现完整的多语言内容,又使页面显示更加整齐美观,提升了用户体验。 | ||
搜索关键词: | 语言 排版 显示 方法 装置 浏览器 终端 介质 | ||
获取待排版的文本;
识别在所述待排版的文本的主体语言文本中的嵌入语言内容,所述嵌入语言内容包括在所述主体语言文本中嵌入的至少一种非主体语言的内容;
确定所述嵌入语言内容的替换内容,其中,所述替换内容包括与所述嵌入语言内容对应的主体语言文本或者嵌入语言内容中非主体语言文本的缩写;以及
将所述嵌入语言内容替换为所述替换内容。
2.根据权利要求1所述的方法,其特征在于,所述识别在所述待排版的文本的主体语言文本中的嵌入语言内容,包括:识别在所述主体语言文本中是否存在第一词对,其中,所述第一词对为非主体语言文本与相对应的主体语言文本组成的词对;以及
所述确定所述嵌入语言内容的替换内容,包括:将所述第一词对中的主体语言文本确定为所述替换内容。
3.根据权利要求2所述的方法,其特征在于,识别在所述主体语言文本中是否存在所述第一词对,包括:识别在主体语言文本中的非主体语言文本;
通过翻译识别所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对。
4.根据权利要求3所述的方法,其特征在于,通过翻译识别所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对,包括:将所述非主体语言文本翻译成主体语言文本,或者将所述相邻的主体语言文本翻译成非主体语言文本;
判断所述非主体语言文本与所述相邻的主体语言文本的匹配度,其中,所述匹配度包括:根据所述翻译结果判断的编辑距离数据、词向量的相似度,和/或,在文本中的共现次数;
根据所述匹配度计算所述非主体语言文本与其相邻的主体语言文本构成所述第一词对的概率;
根据所述概率确定所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对。
5.根据权利要求4所述的方法,其特征在于,所述编辑距离数据包括所述翻译后的文本与相邻的文本的编辑距离,或者所述编辑距离占所述翻译后的文本的长度的比值。6.根据权利要求3所述的方法,其特征在于,通过翻译识别所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对,包括:通过机器翻译语料,并利用神经网络机器模型识别所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对。
7.根据权利要求1所述的方法,其特征在于,所述识别在所述待排版的文本的主体语言文本中的嵌入语言内容,还包括:识别在所述主体语言文本中是否存在第二词对,其中,所述第二词对为所述非主体语言文本的缩写与所述非主体语言文本的全称组成的词对;以及
所述确定所述嵌入语言内容的替换内容,还包括:将所述第二词对中的所述非主体语言文本的缩写确定为所述替换内容。
8.根据权利要求7所述的方法,其特征在于,识别在所述主体语言文本中是否存在第二词对,包括:识别在主体语言文本中的非主体语言文本;
通过首字母判断,识别所述非主体语言文本是否属于所述第二词对。
9.根据权利要求1所述的方法,其特征在于,所述识别在所述待排版的文本的主体语言文本中的嵌入语言内容,还包括:识别在所述主体语言文本中是否存在单独的非主体语言文本,其中,所述单独的非主体语言文本是不构成词对的独立存在的非主体语言文本;
所述确定所述嵌入语言内容的替换内容,还包括:将所述单独的非主体语言文本翻译成主体语言文本,以将所述翻译的主体语言文本确定为所述替换内容。
10.根据权利要求9所述的方法,其特征在于,所述确定所述嵌入语言内容的替换内容,还包括:若翻译后的主体语言文本的存在两种以上翻译结果,则判断所述两种以上翻译结果与所述单独的非主体语言文本的上下文的相关度;以及
将相关度最大的所述翻译结果确定为与所述单独的非主体语言文本相对应的主体语言文本。
11.根据权利要求1‑10中任一项所述的方法,其特征在于,将所述嵌入语言内容替换为所述替换内容之后,还包括:为所述替换内容设置提示标记,所述提示标记包括预设的所述替换内容的字体和/或预设的所述替换内容的标记符号;
响应于预设的操作动作,显示与所述替换内容对应的所述嵌入语言内容。
12.一种多语言排版的显示装置,其特征在于,包括:获取单元,用于获取待排版的文本;
识别单元,用于:识别在所述待排版的文本的主体语言文本中的嵌入语言内容,所述嵌入语言内容包括在所述主体语言文本中嵌入的至少一种非主体语言的内容;
确定单元,用于确定所述嵌入语言内容的替换内容,其中,所述替换内容包括与所述嵌入语言内容对应的主体语言文本或者嵌入语言内容中非主体语言文本的缩写;以及
替换单元,用于将所述嵌入语言内容替换为所述替换内容。
13.根据权利要求12所述的装置,其特征在于,所述识别单元包括第一识别子单元,用于识别在所述主体语言文本中是否存在第一词对,其中,所述第一词对为非主体语言文本与相对应的主体语言文本组成的词对;以及
所述确定单元包括第一确定子单元,用于将所述第一词对中的主体语言文本确定为所述替换内容。
14.根据权利要求13所述的装置,其特征在于,所述第一识别子单元包括:文本识别子单元,用于识别在主体语言文本中的非主体语言文本;
翻译识别子单元,用于通过翻译识别所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对。
15.根据权利要求14所述的装置,其特征在于,所述翻译识别子单元还用于:将所述非主体语言文本翻译成主体语言文本,或者将所述相邻的主体语言文本翻译成非主体语言文本;
判断所述非主体语言文本与所述相邻的主体语言文本的匹配度,其中,所述匹配度包括:根据所述翻译结果判断的编辑距离数据、词向量的相似度,和/或,在文本中的共现次数;
根据所述匹配度计算所述非主体语言文本与其相邻的主体语言文本构成所述第一词对的概率;
根据所述概率确定所述非主体语言文本是否与其相邻的主体语言文本构成所述第一词对。
16.根据权利要求15所述的装置,其特征在于,所述编辑距离数据包括所述翻译后的文本与相邻的文本的编辑距离该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810061020.8/,转载请声明来源钻瓜专利网。