[发明专利]一种基于作者写作风格的裂缝检测方法有效

专利信息
申请号: 201910618530.5 申请日: 2019-07-10
公开(公告)号: CN110472228B 公开(公告)日: 2023-04-07
发明(设计)人: 刘刚;王凯;李涛 申请(专利权)人: 哈尔滨工程大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/253;G06F40/289;G06F40/30;G06F16/35
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 作者 写作 风格 裂缝 检测 方法
【权利要求书】:

1.一种基于作者写作风格的裂缝检测方法,其特征在于:具体步骤如下:

(1)预处理;

(2)单风格特征提取;

(3)参数权重法确定风格裂缝;

(4)基于风格特征的风格聚裂,判断风格裂缝;

所述的预处理是针对所选用的语料库通过句子拆分和粗粒度分词之后,进行标点过滤;

所述的单风格特征提取包括单维特征和多维特征;单维特征包括词长度、平均句子长度、情感偏向,多维特征包括词汇特征、符号特征、同义词、虚词;

所述的参数权重法是通过对所有参数权重进行遍历,对参数进行调优,最后找出每个特征的最优参数;虚词和同义词降维之后分别选用同一组参数作为权重;

所述的参数权重法确定风格裂缝是在得到最优参数权重的基础上,通过欧几里得计算距离得到滑动窗口对每一个窗口的相似度,根据部分权重的相似度差异,判断风格是否相似,最后在风格差异太大并且是断尾的位置上记一次风格裂缝;

所述的基于风格特征的风格聚裂,判断风格裂缝是先提取出文章每一个段落的风格特征,把风格特征参数组成向量作为K-means++算法的输入,输入当前文档给出的作者个数N;K的取值从1到2N;通过轮廓系数评价最优K;通过这个K值,进行迭代收敛;通过这个收敛结果,找出风格裂缝位置,最后输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910618530.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top