[发明专利]文本挖掘的方法和装置有效
申请号: | 201510569585.3 | 申请日: | 2015-09-09 |
公开(公告)号: | CN106528519B | 公开(公告)日: | 2019-04-30 |
发明(设计)人: | 张碧川;黄耀海;清水涉 | 申请(专利权)人: | 佳能信息技术(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 宋岩 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文本挖掘的方法和装置。该方法包括文本串接收步骤,用于接收输入文本串;状态对提取步骤,用于根据输入文本串提取状态对,该状态对包括第一状态和第二状态,第一状态包含第一满意度值和第一描述单元,第一满意度值为满意或不满意,第一描述单元包含第一名词和第一描述短语,其中,第一描述短语所描述的对象是第一名词,第一描述短语包含第一形容词或第一动词,且第二状态与第一状态相反;动作文本生成步骤,用于生成动作文本,动作文本描述了一个动作,该动作对应第一状态到第二状态的状态转移,动作文本包含第三动词和第三动词的宾语。利用本发明,能准确地生成动作文本并对输入文本串准确分类。 | ||
搜索关键词: | 文本 挖掘 方法 装置 | ||
【主权项】:
1.一种文本挖掘的方法,包括:文本串接收步骤,用于接收输入文本串;状态对提取步骤,用于根据输入文本串提取状态对,该状态对包括第一状态和第二状态,第一状态包含第一满意度值和第一描述单元,第一满意度值为满意或不满意,第一描述单元包含第一名词和第一描述短语,其中,第一描述短语所描述的对象是第一名词,第一描述短语包含第一形容词或第一动词,第二状态包含第二满意度值和第二描述单元,第二满意度值为满意或不满意,且第二满意度值与第一满意度值相反,第二描述单元包含第一名词和第二描述短语,其中,第二描述短语所描述的对象是第一名词,第二描述短语包含第二形容词或第二动词,且第二描述短语的含义与第一描述短语的含义相反;动作文本生成步骤,用于生成动作文本,动作文本描述了一个动作,该动作对应第一状态到第二状态的状态转移,动作文本包含第三动词和第三动词的宾语。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能信息技术(北京)有限公司,未经佳能信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510569585.3/,转载请声明来源钻瓜专利网。