毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
基于安全首要的一类含消费效用最大化问题的实证分析(3)
2 预备知识
2.1 单边切比雪夫不等式
引理1(马尔可夫Markov不等式):设X为只取非负值的随机变量,
数学
期望 , 则对于任意正数 , 成立不等式:
.证明 构造随机变量
因为 ,所以 .
两边取数学期望有 ,
由此即得结论 .
引理2:设随机变量X的数学期望 ,方差 则对于任意正数 , 成立不等式:
.证明 对任意的实数 ,利用马尔可夫不等式,有
则 时 达到最小值,此时 ,
命题得证。
定理(单边切比雪夫不等式):设随机变量X的数学期望 ,方差 ,则对于任意正数 ,成立不等式:
证明 因为 与 的期望都是0,方差都是 ,由引理2有
即知定理成立。(文献[8])
2.2 动态规划
动态规划是运筹学的一个分支,它是解决一类多阶段决策问题的一种方法,它将多阶段决策问题转化为一系列比较简单的最优化问题。动态规划首先将复杂的问题分解成相互关联的若干阶段,每一个阶段都是最优化子问题,然后逐阶段进行决策,当所有阶段决策都确定了,整个问题的也就确定了。
2.2.1 基本概念和符号
阶段 在处理问题时,通常把所要求解的问题划分成若干个相互联系的小问题。原问题被看作一个过程,小问题就是过程的几个阶段。阶段往往按时间顺序划分,通常用t表示阶段变量,t取自然数1,2,…。
状态 表示某一阶段出发位置的状态,它既是上一阶段的输出又是本阶段的输入,并用向量 表示第t阶段的状态,称为状态变量。状态的取值都有一个范围,称为状态集合,记为 。
决策和策略 对于给定的最优化过程,决策就是某段状态给定以后,从该状态演变到下一阶段某状态的选择。描述决策的变量称为决策变量,用 表示第t阶段当状态处于 时的决策变量。决策变量一般都有一个允许取值的集合,称为允许决策集合,第t阶段的允许决策集合记为 .给定了某阶段的状态,选定了与此状态相应的决策,则下一阶段的状态就完全确定了,这就是所谓的决策过程的确定性。
指标函数和最优指标函数 在多阶段决策过程最优化问题中,指标函数是用来衡量所实现过程的优劣的一种数量指标,也称目标函数。常用 表示t子过程的指标函数,即
(2.2.1)
指标函数 的最优值,称为相应的最优指标函数,记为
(2.2.2)
其中opt表示取最优,可根据实际问题取最大(max)或最小(min)。
状态转移方程 在确定性决策过程中,可以把状态 、决策 ,以及下一阶段的状态 的对应关系表现为
该式就称为状态转移方程。
2.2.2 最优化原理和基本方程
动态规划的最优化原理是由美国贝尔曼(bellman)首先提出来的。具体叙述为:“作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。”
利用这个原理,可以把多阶段决策问题的求解过程看成是一个连续的递推过程,由后向前逐步推算。在求解时,在各阶段以前的状态和决策,对其后面的子问题来说,只不过相当于其初始条件而已,并不影响后面过程的最优策略。因此,可以把一个问题按阶段分解成许多相互联系的子问题,其中每一个子问题均是比原问题简单得多的优化问题,且每个子问题的求解仅利用它的下一阶段子问题的优化结果,这样依次求解,最后可求得原问题的最优解。于是,对于一个确定的离散T阶段决策过程,根据最优化原理,可以给出其动态规划的基本方程,也称动态规划递推关系。
共4页:
上一页
1
2
3
4
下一页
上一篇:
关于拓扑空间的定义+文献综述
下一篇:
Matlab求解旅行商问题的算法应用
基于因子分析和聚类分析...
基于分类器融合的RNA甲基化识别研究+源程序
基于时间序列电视节目收视率的统计分析
基于模糊集理论的聚类分析及其应用
网购中支付宝安全问题的研究
基于NPP数据的江苏省生态价值时空格局分析
数学思维批判性
上海居民的社会参与研究
AES算法GPU协处理下分组加...
浅谈高校行政管理人员的...
酵母菌发酵生产天然香料...
从政策角度谈黑龙江對俄...
基于Joomla平台的计算机学院网站设计与开发
STC89C52单片机NRF24L01的无线病房呼叫系统设计
提高教育质量,构建大學生...
压疮高危人群的标准化中...
浅论职工思想政治工作茬...