[发明专利]文本信息处理方法、短信处理方法、电子设备及可读介质有效
申请号: | 202010116886.1 | 申请日: | 2020-02-25 |
公开(公告)号: | CN112905787B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 田帅;鲁梦平;师婷婷;陈毅臻;吴汉杰;戴云峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06N3/0442;G06N3/045;G06N3/084 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 韩绍君 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 信息处理 方法 短信 处理 电子设备 可读 介质 | ||
1.一种文本信息处理方法,其特征在于,所述文本信息包括第一数量个文本单元,所述文本信息为短信文本,所述方法包括:
获取待处理文本单元的局部特征向量和全局特征向量,其中,所述待处理文本单元为所述第一数量个文本单元中的第二数量个文本单元,所述第二数量小于或等于所述第一数量;
获取每个所述待处理文本单元的分值;
基于每个所述待处理文本单元的分值,确定该待处理文本单元的第一权重和第二权重,其中,每个所述待处理文本单元的所述第一权重和所述第二权重之和为1;
将每个所述待处理文本单元的第一权重和该待处理文本单元的局部特征向量的乘积作为该待处理文本单元的第一向量因子;
将每个所述待处理文本单元的第二权重和该待处理文本单元的全局特征向量的乘积作为该待处理文本单元的第二向量因子;
将每个所述待处理文本单元的第一向量因子和第二向量因子之和作为该待处理文本单元的融合向量;
根据所述融合向量,确定所述待处理文本单元的标签;
根据所述标签由所述文本信息中提取目标内容,所述目标内容包括出行内容,所述出行内容包括出行时刻和出行日期;
根据所述出行内容生成出行提醒信息;
获取用户终端内的闹钟客户端设置的所有闹铃信息,每个闹铃信息包括闹钟时刻和该闹钟时刻对应的闹铃日期;
从所有闹铃信息中查找待选闹铃信息,其中,所述待选闹铃信息的闹铃日期与所述出行日期匹配,且所述待选闹铃信息的闹钟时刻在所述出行时刻之前;
将所述闹钟时刻最早的待选闹铃信息作为目标闹铃信息;
当通过所述目标闹铃信息对用户提醒时,在所述目标闹铃信息对应的所述目标闹铃界面内显示所述出行提醒信息。
2.根据权利要求1所述的方法,其特征在于,所述获取每个所述待处理文本单元的分值,基于每个所述待处理文本单元的分值,确定该待处理文本单元的第一权重和第二权重,包括:
根据下式确定所述待处理文本单元的所述分值:
,
其中,at为第t个文本单元的分值,W为权重矩阵,xt为第t个文本单元的特征向量,b为偏置值,σ为概率归一化函数;
将(1-at)作为第t个文本单元的第一权重,将at作为第t个文本单元的第二权重,其中,t为不大于n的自然数,n为所述第二数量。
3.根据权利要求2所述的方法,其特征在于,所述将每个所述待处理文本单元的第一向量因子和第二向量因子之和作为该待处理文本单元的融合向量,包括:
根据下式确定所述融合向量:
其中,⊙为逐点乘积算子,ht为第t个文本单元的全局特征向量,lt为第t个文本单元的局部特征向量,rt为t个文本单元的融合向量,其中,t为不大于n的自然数,n为所述第二数量。
4.根据权利要求1所述的方法,其特征在于,所述获取所述待处理文本单元的所述局部特征向量,包括:
获取所述待处理文本单元的特征向量;
根据预先获取的窗口参数和所述特征向量,确定所述待处理文本单元的窗口向量;
根据所述窗口向量获取所述待处理文本单元的所述局部特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010116886.1/1.html,转载请声明来源钻瓜专利网。