[发明专利]一种文本信息的处理方法及相关装置有效
申请号: | 201910900890.4 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110705206B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 邓文超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F40/151;G06F40/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种文本信息的处理方法及相关装置,用于提高代词指代消解效果。本申请方法包括:确定待处理文本中的第一代词和第一先行词;确定待处理文本的第一向量表示值,第一向量表示值用于表示待处理文本的语义信息;确定第一代词和第一先行词对应的第一语义特征向量;通过指代预测模型获取第一向量表示值以及第一语义特征向量对应的指代预测结果;若指代预测结果为第一代词与第一先行词之间具有指代关系,则将待处理文本中的第一代词替换为第一先行词,得到处理后的文本。本申请中在考虑到了代词和先行词之间的语义特征的基础上,还融入了代词的上下文语义信息,能够有效地提高指代代词的识别率,从而提高代词指代消解效果。 | ||
搜索关键词: | 一种 文本 信息 处理 方法 相关 装置 | ||
【主权项】:
1.一种文本信息的处理方法,其特征在于,包括:/n确定待处理文本中的第一代词和第一先行词,所述待处理文本包括至少一个所述第一代词和至少一个所述第一先行词;/n确定所述待处理文本的第一向量表示值,所述第二向量表示值用于表示所述待处理文本的语义信息;/n确定所述第一代词和所述第一先行词对应的第一语义特征向量;/n通过指代预测模型获取所述第一向量表示值以及所述第一语义特征向量对应的指代预测结果;/n若所述指代预测结果为所述第一代词与所述第一先行词之间具有指代关系,则将所述待处理文本中的所述第一代词替换为所述第一先行词,得到处理后的文本。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910900890.4/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置