[发明专利]VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法有效
申请号: | 201410683430.8 | 申请日: | 2014-11-24 |
公开(公告)号: | CN104408306A | 公开(公告)日: | 2015-03-11 |
发明(设计)人: | 吴迪;赵鑫 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;H04L29/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 李宝元;梅洪玉 |
地址: | 124221 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | vanet 利用 演化 博弈 激励 停靠 车辆 合作 转发 进行 分析 建模 方法 | ||
1.一种VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法,其特征在于以下步骤,
一、分成两种情况
第一种是停靠的车辆在一定时间内是静止的;对第一种情况用的是单群体的演化博弈SCEGT激励机制,来激励停靠车辆的合作;
第二种是有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是即走的;对第二种情况用的是多种群的演化博弈,其中停靠的车辆为一个种群,即走的车辆为另外一个种群,提出一种多群体的演化博弈MCEGT激励机制;
二、模型的建立
A、V2V的通信模型
第一种:路边停靠车辆是在一定时间内一直停靠;当车辆Vs要传递大的多媒体文件给车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆作为中间节点传输,则利用道路旁边停靠的车辆协助多媒体服务,车辆Vs将多媒体资源分发给停靠的车辆;然后当车辆Vd通过这些拥有资源的停靠车辆时,就会从这些车辆上下载自己满意的多媒体资源;
第二种:路边停靠的车辆有的是长时间停靠的,有的是即走的;当车辆Vs要传递大的多媒体文件给车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆以作为中间节点传输;那么就利用道路旁边停靠的车辆协助多媒体服务;车辆Vs将多媒体资源分发给停靠的车辆;当车辆Vd正在下载车辆上的资源时,停靠车辆要离开停靠车辆团体,它就会把Vs传递给自己的多媒体服务,移交给停靠车辆的邻居车辆,然后离开;当车辆Vd往前行驶,在从车辆2上下载所有的多媒体资源;
B、演化博弈模型
定义G={I,S,π}是基本的演化博弈模型,其中I表示参与者集合,S表示参与者策略集合,π表示参与者效用函数集合;如果y≠x∈S,存在满足等式:u[x,εy+(1-ε)x]>u[y,εy+(1-ε)x],x就是模型的ESS;
演化博弈论的核心有两个:即演化稳定策略、复制者动态方程;演化稳定策略x*需要满足如下两个条件:第一,x'=Ω(x*)=0;第二,Ω'(x*)<06;复制者动态方程描述采取变异的频数关于时间t的一个动态微分方程;用xi'=[φ(xi,x)-φ(x,x)]xi来表示复制者动态方程,其中xi(t)采取纯策略的人占总人数的比例,φ(xi,x)为策略i的适应度,φ(x,x)为平均适应度;
演化博弈论的标准设置是:
(1)有一个用户的种群;种群中的用户数量很大;
(2)假设有有限的纯策略或行为;种群的每个成员从同一个策略集合
Α={1,2,...,I}中选择策略;
(3)设为纯策略集合I上的概率分布集合;M可以解释为混合策略集合;事实上,假设从种群中随机选择出的用户:使用标记策略的参与者遇到使用策略j的参与者的概率是yj;几个博弈过程以后,对于使用j的参与者等价于面对使用混合策略(y1,...,yI)的参与者。
2.根据权利要求1所述的方法,其特征在于,
(一)单群体的演化博弈(SCEGT)激励机制如下:
A.SCEGT模型
第一种情况,停靠的车辆是长时间不移动的;在每个固定的slot中,随机选择配对,策略空间是{0,1},策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务,同时从他们那下载自己感兴趣的资源;策略1表示停靠车辆只从其他车辆上下载自己喜欢的资源,不服务路过车辆或者停靠车辆;
设每个节点提供一个单元的多媒体服务得到的车辆收益是P,成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要的成本是c;其中,P>R,d>c;单团体中,路边停靠的车辆没有迁移发生,每个车辆都是接收一个单元资源,也是提供一个单元的多媒体服务;根据演化博弈规则,参与者j的收益矩阵如下:
定义γ0(t)表示团体中选择策略0的节点数目;γ1(t)表示团体中选择策略1的节点数目;如公式(1)所示,
γ(t)=γ0(t)+γ1(t) (1)
定义表示团体中选择策略0的比例,团体中选择策略1的比例就是1-x(t);
根据博弈矩阵,选择策略0的期望收益如公式(2)所示:
U0(t)=x(t)*(R+P-c-d)+[1-x(t)]*(P-d) (2)
=x(t)*(R-c)+P-d
选择策略1的期望收益如公式(3)所示:
U1(t)=x(t)*(R-c)+[1-x(t)]*0 (3)
=x(t)*(R-c)
整个团体的平均收益如公式(4)所示:
B.动态复制分析
每个阶段博弈是从kt,k∈N开始,在(k+1)t,k∈N结束;节点的平均收益是与博弈对手有关的;设在一个很小的时间间隔ε中,只有ε部分参与博弈;在时间t+ε时的复制动态方程如公式(9)所示:
复制动态方程,如公式(10)所示:
在SMEGT激励机制作用下,ESS是存在的,并且只有一个进化稳定的策略;
本模型中存在ESS,x*(t)=1,并且是唯一的ESS;
(二)多群体的演化博弈(MCEGT)激励机制如下
A、MCEGT模型
系统模型中的第二种情况,有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是随时开走的;
因为车辆是移动的,那么两个车辆之间的连接时间服从指数分布,其参数λ>0,那么在时间τ内,两个车辆连接的概率为1-Qτ,其中Qτ如公式(11)所示:
Qτ=(1+λτ)e-λτ (11)
假设团体Pop1和团体Pop2的节点数量分别是m和n;考虑各个团体的车辆在平面的分布都服从泊松分布,参数是γ>0;那么在一次演化博弈过程中,存在n个车辆的概率如公式(12)所示:
团体1(用pop1表示)中都是停靠的车辆,pop1的策略空间是p1∈{0,1};因为考虑两个团体的博弈,那么演化博弈是在车辆离开时开始的;在这里pop1要与单团体的时候策略有变化;策略0表示接受离开车辆移交的资源;策略1,不接受离开车辆的移交资源;团体2(用pop2表示)包含的是即走的车辆,pop2的策略空间是p2∈{0,1};策略0代表离开时移交资源给相邻车辆;策略1代表车辆离开,车辆自私,不把资源移交给相邻的车辆;每个节点下载和提供服务都是需要成本的;因为车辆在停靠的时候,无线设备等开放是靠电量支持的;假设每个离开节点移交一个单元的多媒体服务得到的收益是P,需要成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要成本c;假设每个车辆上携带一个单元的资源;
因为在两个团体之间不存在竞争;在pop1中,如果其中的节点采取策略0,那么它得到收益的概率如公式(13)所示:
同理,在pop2中,节点采取策略0的收益概率如公式(14)所示:
其中α=1-Qτ;
在pop1中每个博弈参与者选择策略0的概率是x,在pop2中博弈参与者选择策略0的概率是y;表示团体n在选择策略s时的期望收益;那么在pop1中选择策略0的个体的收益可以用公式(15)计算:
同理,在pop2中选择策略0的个体期望收益计算如公式(16)所示:
在两个团体中,个体选择策略1的收益定义为:
在pop1中,采用策略0的节点比例是x,采取策略1的节点比例是1-x,那么团体的平均效用函数如公式(17)所示:
同理,团体Pop2的平均效用函数如公式(18)所示:
B.复制动态分析
演化博弈的复制动态方程用公式(19)表示:
【把代入】那么两个团体的复制动态方程为公式(20):
把公式(15)(16)带入公式(20)整理得公式(21):
用一个表示pop1的稳定演化策略ESS;
在pop2中,用来表示pop2的稳定演化策略ESS;
在MCEGT激励机制中,两个团体都有一个稳定的ESS,如公式(26)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410683430.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种取电池片装置
- 下一篇:海棠果果脯的制作方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用