[发明专利]一种对文本进行同义修改、确定文本创作者的方法有效
申请号: | 202010478444.1 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111381191B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 黄凯明;杨磊;潘覃 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G01R31/62 | 分类号: | G01R31/62;G06F40/30;G06F40/284 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 进行 同义 修改 确定 创作者 方法 | ||
1.一种对文本进行同义修改的方法,包括:
获取待修改文本,并提取所述待修改文本的关键词集合;
针对每个关键词,确定该关键词对应的同义词集合,并将该关键词与对应的同义词集合组成备选词集合;
针对每个备选词集合,根据第一排序规则,将该备选词集合中的词进行排序;以及,根据第二排序规则,将各备选词集合进行排序;
获取创作所述待修改文本的用户的数字编号;以及,根据所述数字编号的第i位Ni,将第i个备选词集合中的第Ni个词添加到命中词集合;i=(1,2,…,S),S为数字编号位数;
针对每个关键词,若该关键词不属于所述命中词集合,则将所述待修改文本中的该关键词替换成与该关键词同义的命中词。
2.如权利要求1所述的方法,根据第一排序规则,将该备选词集合中的词进行排序,包括:
若所述待修改文本为汉字文本,则以该备选词集合中每个词的首字为基准,按照拼音首字母由前到后的顺序,将该备选词集合中的词进行排序。
3.如权利要求1所述的方法,根据第二排序规则,将各备选词集合进行排序,包括:
若所述待修改文本为汉字文本,则以每个备选词集合中第一个词的首字为基准,按照拼音首字母由前到后的顺序,将各备选词集合进行排序。
4.如权利要求1所述的方法,所述方法还包括:
将修改后的文本提交至区块链进行存证。
5.一种确定文本创作者的方法,包括:
获取待确定文本,并提取所述待确定文本的关键词集合;
针对每个关键词,确定该关键词对应的同义词集合,并将该关键词与对应的同义词集合组成备选词集合;
针对每个备选词集合,根据第一排序规则,将该备选词集合中的词进行排序;以及,根据第二排序规则,将各备选词集合进行排序;
针对第i个备选词集合,确定该备选词集合中关键词的序位Ni;i=(1,2,…,S),S为数字编号位数;
确定数字编号;其中,所述数字编号的第i位数字为Ni;
将确定的数字编号对应的用户认定为所述待确定文本的创作者。
6.一种对文本进行同义修改的方法,包括:
获取待修改文本,并提取所述待修改文本的关键词集合;
从所述待修改文本中确定出关键段落集合;所述关键段落集合包含的关键词的数量大于指定数量;
针对每个关键段落,执行以下步骤:
针对该关键段落中的每个关键词,确定该关键词对应的同义词集合,并将该关键词与对应的同义词集合组成备选词集合;
针对每个备选词集合,根据第一排序规则,将该备选词集合中的词进行排序;以及,根据第二排序规则,将各备选词集合进行排序;
获取创作所述待修改文本的用户的数字编号;以及,根据所述数字编号的第i位Ni,将第i个备选词集合中的第Ni个词添加到命中词集合;i=(1,2,…,S),S为数字编号位数;
针对该关键段落中的每个关键词,若该关键词不属于所述命中词集合,则将该关键段落中的该关键词替换成与该关键词同义的命中词。
7.如权利要求6所述的方法,针对每个关键段落,还执行以下步骤:
根据所述数字编号与预设计算规则,计算得到校验数字P;
将第S+1个备选词集合中的第P个词添加到命中词集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010478444.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:授信处理方法、装置、设备及系统
- 下一篇:基于账户模型的区块链转账方法及装置