本文目录一览

1,什么是状态转移方程

比如,某个模型只有2个状态s1和s2,分别由用户输入1和0来触发。数据用x来代表。那么方程可以写成 x==0 s1->s2 x==1 s2->s1 x==0和x==1就叫做状态转移方程。

什么是状态转移方程

2,动态规划如何设计状态转移方程

首先你要确定这道题是否可以用动态规划来做,即它是否满足最优化原理和无后效性原则。如果是,就开始设计: 一、确定问题的决策对象 二、对决策对象划分阶段 三、对各阶段确定状态变量 四、根据状态变量确定费用函数和目标函数 五、建立各阶段的状态变量的转移方程,写出状态转移方程 六、编程实现

动态规划如何设计状态转移方程

3,动态转移方程

要看具体情况,0/1背包的动态转移方程是:f[i][v]=max如果你想深入了解背包问题建议你上网搜《背包问题九讲》,写的很好 这要根据题目具体分析
首先你要确定这道题是否可以用动态规划来做,即它是否满足最优化原理和无后效性原则。如果是,就开始设计:一、确定问题的决策对象二、对决策对象划分阶段三、对各阶段确定状态变量四、根据状态变量确定费用函数和目标函数五、建立各阶段的状态变量的转移方程,写出状态转移方程六、编程实现

动态转移方程

4,什么是状态转移方程RT

状态转移方程,是动态规划中本阶段的状态往往是上一阶段状态和上一阶段决策的结果。如果给定了第K阶段的状态Sk以及决策uk(Sk),则第K+1阶段的状态Sk+1也就完全确定。动态规划中本阶段的状态往往是上一阶段状态和上一阶段决策的结果。如果给定了第K阶段的状态Sk以及决策uk(Sk),则第K+1阶段的状态Sk+1也就完全确定。也就是说Sk+1与Sk,uk之间存在一种明确的数量对应关系,记为Tk(Sk,uk),即有Sk+1= Tk(Sk,uk)。 这种用函数表示前后阶段关系的方程,称为状态转移方程。在上例中状态转移方程为 Sk+1= uk(Sk) 。
理想气体状态方程(ideal gas,equation of state of),也称理想气体定律,描述理想气体状态变化规律的方程。质量为m,摩尔质量为m的理想气体,其状态参量压强p、体积v和绝对温度t之间的函数关系为: pv=mrt/m=mrt,r=r/m,式中m和n分别是理想气体的摩尔质量和物质的量;r是气体常量。对于混合理想气体,其压强p是各组成部分的分压强p1、 p2、……之和,故pv=( p1+ p2+……)v=(n1+n2+……)rt,式中n1、n2、……是各组成部分的物质的量。以上两式是理想气体和混合理想气体的状态方程,可由理想气体严格遵循的气体实验定律得出,也可根据理想气体的微观模型,由气体动理论导出。在压强为几个大气压以下时,各种实际气体近似遵循理想气体状态方程,压强越低,符合越好,在压强趋于零的极限下,严格遵循。理想气体状态方程是由研究低压下气体的行为导出的。但各气体在适用理想气体状态方程时多少有些偏差;压力越低,偏差越小,在极低压力下理想气体状态方程可较准确地描述气体的行为。极低的压力意味着分子之间的距离非常大,此时分子之间的相互作用非常小;又意味着分子本身所占的体积与此时气体所具有的非常大的体积相比可忽略不计,因而分子可近似被看作是没有体积的质点。于是从极低压力气体的行为触发,抽象提出理想气体的概念。理想气体在微观上具有分子之间无互相作用力和分子本身不占有体积的特征。

5,状态转移方程是什么

一个字符串可以插入、删除、改变到另一个字符串,求改变的最小步骤。和最长公共子序列类似,用二维数组opt[i][j]记录字符串a中的前i个字符到字符串b中的前j个字符匹配所需要的最小步数。假如已知AG到GT的最小步数,AGT到GT的最小步数,AG到GTT的最小步数,求AGT到GTT的最小步数,此时T= =T,这个值是AG到GT的最小步数,AGT到GT的最小步数加一(AGT到GT的最小步数等于AGTT到GTT的最小步数,加一是将T删除的一步),AG到GTT的最小步数加一(AG到GTT的最小步数等于AGT到GTTT的最小步数,加一是在AGT上增加T的一步)。假如已知AG到GT的最小步数,AGA到GT的最小步数,AG到GTT的最小步数,求AGA到GTT的最小步数,此时A! =T,这个值是AG到GT的最小步数加一(A改变为T),AGA到GT的最小步数加一(AGA到GT的最小步数等于AGAT到GTT的最小步数,加一是将T删除的一步),AG到GTT的最小步数加一(AG到GTT的最小步数等于AGA到GTTA的最小步数,加一是在GTTA上删除A的一步)。所以状态转移方程:初始化的时候和最长公共子序列不同,因为第0行,第0列表示null转化到字符串情况,结果是字符串的长度:if(str1.charAt(i-1)==str2.charAt(j-1)) array[i][j] = Math.min(Math.min(array[i-1][j-1], array[i-1][j]+1), array[i][j-1]+1);else array[i][j] = Math.min(Math.min(array[i-1][j-1]+1, array[i-1][j]+1), array[i][j-1]+1);for(int i=0;i<=m;i++) array[i][0] = i;} for(int i=0;i<=n;i++) array[0][i] = i;}
一个字符串可以插入、删除、改变到另一个字符串,求改变的最小步骤。和最长公共子序列类似,用二维数组opt[i][j]记录字符串a中的前i个字符到字符串b中的前j个字符匹配所需要的最小步数。假如已知AG到GT的最小步数,AGT到GT的最小步数,AG到GTT的最小步数,求AGT到GTT的最小步数,此时T= =T,这个值是AG到GT的最小步数,AGT到GT的最小步数加一(AGT到GT的最小步数等于AGTT到GTT的最小步数,加一是将T删除的一步),AG到GTT的最小步数加一(AG到GTT的最小步数等于AGT到GTTT的最小步数,加一是在AGT上增加T的一步)。假如已知AG到GT的最小步数,AGA到GT的最小步数,AG到GTT的最小步数,求AGA到GTT的最小步数,此时A! =T,这个值是AG到GT的最小步数加一(A改变为T),AGA到GT的最小步数加一(AGA到GT的最小步数等于AGAT到GTT的最小步数,加一是将T删除的一步),AG到GTT的最小步数加一(AG到GTT的最小步数等于AGA到GTTA的最小步数,加一是在GTTA上删除A的一步)。所以状态转移方程:初始化的时候和最长公共子序列不同,因为第0行,第0列表示null转化到字符串情况,结果是字符串的长度:if(str1.charAt(i-1)==str2.charAt(j-1)) array[i][j] = Math.min(Math.min(array[i-1][j-1], array[i-1][j]+1), array[i][j-1]+1);else array[i][j] = Math.min(Math.min(array[i-1][j-1]+1, array[i-1][j]+1), array[i][j-1]+1);for(int i=0;i<=m;i++) array[i][0] = i;} for(int i=0;i<=n;i++) array[0][i] = i;}
首先你要确定这道题是否可以用动态规划来做,即它是否满足最优化原理和无后效性原则。如果是,就开始设计:一、确定问题的决策对象二、对决策对象划分阶段三、对各阶段确定状态变量四、根据状态变量确定费用函数和目标函数五、建立各阶段的状态变量的转移方程,写出状态转移方程六、编程实现

6,最优法求解

解:把求得总费用最少问题化为最短路问题,用vi表示“第i年初购进一台新机器”,设v5表示第4年年底,从vi到v5各画一条弧,弧(vi,vj)表示在第i年年初购进的一台新机器一直使用到第j年年初。然后对每条弧赋予权数,弧(vi,vj)的权数即为从第i年年初购进新机器使用到第j-1年年底所花费的购置费及更换、运行维修费的综合。权数表(单位:万元)这是一个最短路的问题,用 Dijkstra 算法求解可得到这问题的解为 4.8,即在 4 年内购买、更换及运行维修最小的总费用为:4.8 万元。最优更新策略为:第一年末不更新 第二年末更新 第三年末不更新第四年末处理机器
键词】动态规划 阶段 动态规划是信息学竞赛中的常见算法,本文的主要内容就是分析它的特点。 文章的第一部分首先探究了动态规划的本质,因为动态规划的特点是由它的本质所决定的。第二部分从动态规划的设计和实现这两个角度分析了动态规划的多样性、模式性、技巧性这三个特点。第三部分将动态规划和递推、搜索、网络流这三个相关算法作了比较,从中探寻动态规划的一些更深层次的特点。 文章在分析动态规划的特点的同时,还根据这些特点分析了我们在解题中应该怎样利用这些特点,怎样运用动态规划。这对我们的解题实践有一定的指导意义。 动态规划是编程解题的一种重要的手段,在如今的信息学竞赛中被应用得越来越普遍。最近几年的信息学竞赛,不分大小,几乎每次都要考察到这方面的内容。因此,如何更深入地了解动态规划,从而更为有效地运用这个解题的有力武器,是一个值得深入研究的问题。 要掌握动态规划的应用技巧,就要了解它的各方面的特点。首要的,是要深入洞悉动态规划的本质。 §1动态规划的本质 动态规划是在本世纪50年代初,为了解决一类多阶段决策问题而诞生的。那么,什么样的问题被称作多阶段决策问题呢? §1.1多阶段决策问题 说到多阶段决策问题,人们很容易举出下面这个例子。 [例1] 多段图中的最短路径问题:在下图中找出从a1到d1的最短路径。 仔细观察这个图不难发现,它有一个特点。我们将图中的点分为四类(图中的a、b、c、d),那么图中所有的边都处于相邻的两类点之间,并且都从前一类点指向后一类点。这样,图中的边就被分成了三类(aàb、bàc、càd)。我们需要从每一类中选出一条边来,组成从a1到d1的一条路径,并且这条路径是所有这样的路径中的最短者。 从上面的这个例子中,我们可以大概地了解到什么是多阶段决策问题。更精确的定义如下: 多阶段决策过程,是指这样的一类特殊的活动过程,问题可以按时间顺序分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列[1]。要使整个活动的总体效果达到最优的问题,称为多阶段决策问题。 从上述的定义中,我们可以明显地看出,这类问题有两个要素。一个是阶段,一个是决策。 §1.2阶段与状态 阶段:将所给问题的过程,按时间或空间特征分解成若干相互联系的阶段,以便按次序去求每阶段的解。常用字母k表示阶段变量。[1] 阶段是问题的属性。多阶段决策问题中通常存在着若干个阶段,如上面的例子,就有a、b、c、d这四个阶段。在一般情况下,阶段是和时间有关的;但是在很多问题(我的感觉,特别是信息学问题)中,阶段和时间是无关的。从阶段的定义中,可以看出阶段的两个特点,一是“相互联系”,二是“次序”。 阶段之间是怎样相互联系的?就是通过状态和状态转移。 状态:各阶段开始时的客观条件叫做状态。描述各阶段状态的变量称为状态变量,常用sk表示第k阶段的状态变量,状态变量sk的取值集合称为状态集合,用sk表示。[1] 状态是阶段的属性。每个阶段通常包含若干个状态,用以描述问题发展到这个阶段时所处在的一种客观情况。在上面的例子中,行人从出发点a1走过两个阶段之后,可能出现的情况有三种,即处于c1、c2或c3点。那么第三个阶段就有三个状态s3=。 每个阶段的状态都是由以前阶段的状态以某种方式“变化”而来,这种“变化”称为状态转移(暂不定义)。上例中c3点可以从b1点过来,也可以从b2点过来,从阶段2的b1或b2状态走到阶段3的c3状态就是状态转移。状态转移是导出状态的途径,也是联系各阶段的途径。 说到这里,可以提出应用动态规划的一个重要条件。那就是将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的发展,而只能通过当前的这个状态。换句话说,每个状态都是“过去历史的一个完整总结[1]”。这就是无后效性。对这个性质,下文还将会有解释。 §1.3决策和策略 上面的阶段与状态只是多阶段决策问题的一个方面的要素,下面是另一个方面的要素——决策。 决策:当各段的状态取定以后,就可以做出不同的决定,从而确定下一阶段的状态,这种决定称为决策。表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量。在实际问题中,决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合。常用dk(sk)表示第k阶段从状态sk出发的允许决策集合。显然有uk(sk) ?dk(sk)。[1] 决策是问题的解的属性。决策的目的就是“确定下一阶段的状态”,还是回到上例,从阶段2的b1状态出发有三条路,也就是三个决策,分别导向阶段3的c1、c2、c3三个状态,即d2(b1)=。 有了决策,我们可以定义状态转移:动态规划中本阶段的状态往往是上一阶段和上一阶段的决策结果,由第k段的状态sk和本阶段的决策uk确定第k+1段的状态sk+1的过程叫状态转移。状态转移规律的形式化表示sk+1=tk(sk,uk)称为状态转移方程。 这样看来,似乎决策和状态转移有着某种联系。我的理解,状态转移是决策的目的,决策是状态转移的途径。 各段决策确定后,整个问题的决策序列就构成一个策略,用p1,n=表示。对每个实际问题,可供选择的策略有一定范围,称为允许策略集合,记作p1,n,使整个问题达到最有效果的策略就是最优策略。[1] 说到这里,又可以提出运用动态规划的一个前提。即这个过程的最优策略应具有这样的性质:无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策应构成最优策略[1]。这就是最优化原理。简言之,就是“最优策略的子策略也是最优策略”。 §1.4最优化原理与无后效性 这里,我把最优化原理定位在“运用动态规划的前提”。这是因为,是否符合最优化原理是一个问题的本质特征。对于不满足最优化原理的一个多阶段决策问题,整体上的最优策略p1,n同任何一个阶段k上的决策uk或任何一组阶段k1…k2上的子策略pk1,k2都不存在任何关系。如果要对这样的问题动态规划的话,我们从一开始所作的划分阶段等努力都将是徒劳的。 而我把无后效性定位在“应用动态规划的条件”,是因为动态规划是按次序去求每阶段的解,如果一个问题有后效性,那么这样的次序便是不合理的。但是,我们可以通过重新划分阶段,重新选定状态,或者增加状态变量的个数等手段,来是问题满足无后效性这个条件。说到底,还是要确定一个“序”。 在信息学的多阶段决策问题中,绝大部分都是能够满足最优化原理的,但它们往往会在后效性这一点上来设置障碍。所以在解题过程中,我们会特别关心“序”。对于有序的问题,就会考虑到动态规划;对于无序的问题,也会想方设法来使其有序。 §1.5最优指标函数和规划方程 最优指标函数:用于衡量所选定策略优劣的数量指标称为指标函数,最优指标函数记为fk(sk),它表示从第k段状态sk采用最优策略p*k,n到过程终止时的最佳效益值[1]。 最优指标函数其实就是我们真正关心的问题的解。在上面的例子中,f2(b1)就表示从b1点到终点d1点的最短路径长度。我们求解的最终目标就是f1(a1)。 最优指标函数的求法一般是一个从目标状态出发的递推公式,称为规划方程: 其中sk是第k段的某个状态,uk是从sk出发的允许决策集合dk(sk)中的一个决策,tk(sk,uk)是由sk和uk所导出的第k+1段的某个状态sk+1,g(x,uk)是定义在数值x和决策uk上的一个函数,而函数opt表示最优化,根据具体问题分别表为max或min。 ,称为边界条件。 上例中的规划方程就是: 边界条件为 这里是一种从目标状态往回推的逆序求法,适用于目标状态确定的问题。在我们的信息学问题中,也有很多有着确定的初始状态。当然,对于初始状态确定的问题,我们也可以采用从初始状态出发往前推的顺序求法。事实上,这种方法对我们来说要更为直观、更易设计一些,从而更多地出现在我们的解题过程中。 我们本节所讨论的这些理论虽然不是本文的主旨,但是却对下面要说的动态规划的特点起着基础性的作用。 §2动态规划的设计与实现 上面我们讨论了动态规划的一些理论,本节我们将通过几个例子中,动态规划的设计与实现,来了解动态规划的一些特点。 §2.1动态规划的多样性 [例2] 花店橱窗布置问题(ioi99)试题见附录 本题虽然是本届ioi中较为简单的一题,但其中大有文章可作。说它简单,是因为它有序,因此我们一眼便可看出这题应该用动态规划来解决。但是,如何动态规划呢?如何划分阶段,又如何选择状态呢? 以花束的数目来划分阶段。在这里,阶段变量k表示的就是要布置的花束数目(前k束花),状态变量sk表示第k束花所在的花瓶。而对于每一个状态sk,决策就是第k-1束花应该放在哪个花瓶,用uk表示。最优指标函数fk(sk)表示前k束花,其中第k束插在第sk个花瓶中,所能取得的最大美学值。 状态转移方程为 规划方程为 (其中a(i,j)是花束i插在花瓶j中的美学值) 边界条件 (v是花瓶总数,事实上这是一个虚拟的边界) 以花瓶的数目来划分阶段。在这里阶段变量k表示的是要占用的花瓶数目(前k个花瓶),状态变量sk表示前k个花瓶中放了多少花。而对于任意一个状态sk,决策就是第sk束花是否放在第k个花瓶中,用变量uk=1或0来表示。最优指标函数fk(sk)表示前k个花瓶中插了sk束花,所能取得的最大美学值。 状态转移方程为 规划方程为 边界条件为 两种划分阶段的方法,引出了两种状态表示法,两种规划方式,但是却都成功地解决了问题。只不过因为决策的选择有多有少,所以算法的时间复杂度也就不同。[2] 这个例子具有很大的普遍性。有很多的多阶段决策问题都有着不止一种的阶段划分方法,因而往往就有不止一种的规划方法。有时各种方法所产生的效果是差不多的,但更多的时候,就像我们的例子一样,两种方法会在某个方面有些区别。 所以,在用动态规划解题的时候,可以多想一想是否有其它的解法。对于不同的解法,要注意比较,好的算法好在哪里,差一点的算法差在哪里。从各种不同算法的比较中,我们可以更深刻地领会动态规划的构思技巧。 §2.2动态规划的模式性 这个可能做过动态规划的人都有体会,从我们上面对动态规划的分析也可以看出来。动态规划的设计都有着一定的模式,一般要经历以下几个步骤。 划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的,否则问题就无法求解。 选择状态:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。 确定决策并写出状态转移方程:之所以把这两步放在一起,是因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以,如果我们确定了决策,状态转移方程也就写出来了。但事实上,我们常常是反过来做,根据相邻两段的各状态之间的关系来确定决策。 写出规划方程(包括边界条件):在第一部分中,我们已经给出了规划方程的通用形式化表达式。一般说来,只要阶段、状态、决策和状态转移确定了,这一步还是比较简单的。 动态规划的主要难点在于理论上的设计,一旦设计完成,实现部分就会非常简单。大体上的框架如下: 对f1(s1)初始化(边界条件) for k?2 to n(这里以顺序求解为例) 对每一个sk?sk fk(sk)?一个极值(∞或-∞) 对每一个uk(sk)?dk(sk) sk-1?tk(sk,uk) t?g(fk-1(sk-1),uk) y t比fk(sk)更优 n fk(sk)?t 输出fn(sn) 这个n-s图虽然不能代表全部,但足可以概括大多数。少数的一些特殊的动态规划,其实现的原理也是类似,可以类比出来。我们到现在对动态规划的分析,主要是在理论上、设计上,原因也就在此。 掌握了动态规划的模式性,我们在用动态规划解题时就可以把主要的精力放在理论上的设计。一旦设计成熟,问题也就基本上解决了。而且在设计算法时也可以按部就班地来。 但是“物极必反”,太过拘泥于模式就会限制我们的思维,扼杀优良算法思想的产生。我们在解题时,不妨发挥一下创造性,去突破动态规划的实现模式,这样往往会收到意想不到的效果。[3] §2.3动态规划的技巧性 上面我们所说的动态规划的模式性,主要指的是实现方面。而在设计方面,虽然它较为严格的步骤性,但是它的设计思想却是没有一定的规律可循的。这就需要我们不断地在实践当中去掌握动态规划的技巧,下面仅就一个例子谈一点我自己的体会。 [例3] 街道问题:在下图中找出从左下角到右上角的最短路径,每步只能向右方或上方走。 这是一道简单而又典型的动态规划题,许多介绍动态规划的书与文章中都拿它来做例子。通常,书上的解答是这样的: 按照图中的虚线来划分阶段,即阶段变量k表示走过的步数,而状态变量sk表示当前处于这一阶段上的哪一点(各点所对应的阶段和状态已经用ks在地图上标明)。这时的模型实际上已经转化成了一个特殊的多段图。用决策变量uk=0表示向右走,uk=1表示向上走,则状态转移方程如下: (这里的row是地图竖直方向的行数) 我们看到,这个状态转移方程需要根据k的取值分两种情况讨论,显得非常麻烦。相应的,把它代入规划方程而付诸实现时,算法也很繁。因而我们在实现时,一般是不会这么做的,而代之以下面方法: 将地图中的点规则地编号如上,得到的规划方程如下: (这里distance表示相邻两点间的边长) 这样做确实要比上面的方法简单多了,但是它已经破坏了动态规划的本来面目,而不存在明确的阶段特征了。如果说这种方法是以地图中的行(a、b、c、d)来划分阶段的话,那么它的“状态转移”就不全是在两个阶段之间进行的了。 也许这没什么大不了的,因为实践比理论更有说服力。但是,如果我们把题目扩展一下:在地图中找出从左下角到右上角的两条路径,两条路径中的任何一条边都不能重叠,并且要求两条路径的总长度最短。这时,再用这种“简单”的方法就不太好办了。 如果非得套用这种方法的话,则最优指标函数就需要有四维的下标,并且难以处理两条路径“不能重叠”的问题。 而我们回到原先“标准”的动态规划法,就会发现这个问题很好解决,只需要加一维状态变量就成了。即用sk=(ak,bk)分别表示两条路径走到阶段k时所处的位置,相应的,决策变量也增加一维,用uk=(xk,yk)分别表示两条路径的行走方向。状态转移时将两条路径分别考虑: 在写规划方程时,只要对两条路径走到同一个点的情况稍微处理一下,减少可选的决策个数: 从这个例子中可以总结出设计动态规划算法的一个技巧:状态转移一般是在相邻的两个阶段之间(有时也可以在不相邻的两个阶段间),但是尽量不要在同一个阶段内进行。 动态规划是一种很灵活的解题方法,在动态规划算法的设计中,类似的技巧还有很多。要掌握动态规划的技巧,有两条途径:一是要深刻理解动态规划的本质,这也是我们为什么一开始就探讨它的本质的原因;二是要多实践,不但要多解题,还要学会从解题中探寻规律,总结技巧。 §3动态规划与一些算法的比较 动态规划作为诸多解题方法中的一种,必然和其他一些算法有着诸多联系。从这些联系中,我们也可以看出动态规划的一些特点。 §3.1动态规划与递推 ——动态规划是最优化算法 由于动态规划的“名气”如此之大,以至于很多人甚至一些资料书上都往往把一种与动态规划十分相似的算法,当作是动态规划。这种算法就是递推。实际上,这两种算法还是很容易区分的。 按解题的目标来分,信息学试题主要分四类:判定性问题、构造性问题、计数问题和最优化问题。我们在竞赛中碰到的大多是最优化问题,而动态规划正是解决最优化问题的有力武器,因此动态规划在竞赛中的地位日益提高。而递推法在处理判定性问题和计数问题方面也是一把利器。下面分别就两个例子,谈一下递推法和动态规划在这两个方面的联系。 [例4] mod 4 最优路径问题:在下图中找出从第1点到第4点的一条路径,要求路径长度mod 4的余数最小。 这个图是一个多段图,而且是一个特殊的多段图。虽然这个图的形式比一般的多段图要简单,但是这个最优路径问题却不能用动态规划来做。因为一条从第1点到第4点的最优路径,在它走到第2点、第3点时,路径长度mod 4的余数不一定是最小,也就是说最优策略的子策略不一定最优——这个问题不满足最优化原理。 但是我们可以把它转换成判定性问题,用递推法来解决。判断从第1点到第k点的长度mod 4为sk的路径是否存在,用fk(sk)来表示,则递推公式如下: (边界条件) (这里lenk,i表示从第k-1点到第k点之间的第i条边的长度,方括号表示“或(or)”运算) 最后的结果就是可以使f4(s4)值为真的最小的s4值。 这个递推法的递推公式和动态规划的规划方程非常相似,我们在这里借用了动态规划的符号也就是为了更清楚地显示这一点。其实它们的思想也是非常相像的,可以说是递推法借用了动态规划的思想解决了动态规划不能解决的问题。 有的多阶段决策问题(像这一题的阶段特征就很明显),由于不能满足最优化原理等使用动态规划的先决条件,而无法应用动态规划。在这时可以将最优指标函数的值当作“状态”放到下标中去,从而变最优化问题为判定性问题,再借用动态规划的思想,用递推法来解决问题。 §3.2动态规划与搜索 ——动态规划是高效率、高消费算法 同样是解决最优化问题,有的题目我们采用动态规划,而有的题目我们则需要用搜索。这其中有没有什么规则呢? 我们知道,撇开时空效率的因素不谈,在解决最优化问题的算法中,搜索可以说是“万能”的。所以动态规划可以解决的问题,搜索也一定可以解决。 把一个动态规划算法改写成搜索是非常方便的,状态转移方程、规划方程以及边界条件都可以直接“移植”,所不同的只是求解顺序。动态规划是自底向上的递推求解,而搜索则是自顶向下的递归求解(这里指深度搜索,宽度搜索类似)。 反过来,我们也可以把搜索算法改写成动态规划。状态空间搜索实际上是对隐式图中的点进行枚举,这种枚举是自顶向下的。如果把枚举的顺序反过来,变成自底向上,那么就成了动态规划。(当然这里有个条件,即隐式图中的点是可排序的,详见下一节。) 正因为动态规划和搜索有着求解顺序上的不同,这也造成了它们时间效率上的差别。在搜索中,往往会出现下面的情况: 对于上图(a)这样几个状态构成的一个隐式图,用搜索算法就会出现重复,如上图(b)所示,状态c2被搜索了两次。在深度搜索中,这样的重复会引起以c2为根整个的整个子搜索树的重复搜索;在宽度搜索中,虽然这样的重复可以立即被排除,但是其时间代价也是不小的。而动态规划就没有这个问题,如上图(c)所示。 一般说来,动态规划算法在时间效率上的优势是搜索无法比拟的。(当然对于某些题目,根本不会出现状态的重复,这样搜索和动态规划的速度就没有差别了。)而从理论上讲,任何拓扑有序(现实中这个条件常常可以满足)的隐式图中的搜索算法都可以改写成动态规划。但事实上,在很多情况下我们仍然不得不采用搜索算法。那么,动态规划算法在实现上还有什么障碍吗? 考虑上图(a)所示的隐式图,其中存在两个从初始状态无法达到的状态。在搜索算法中,这样的两个状态就不被考虑了,如上图(b)所示。但是动态规划由于是自底向上求解,所以就无法估计到这一点,因而遍历了全部的状态,如上图(c)所示。 一般说来,动态规划总要遍历所有的状态,而搜索可以排除一些无效状态。更重要的事搜索还可以剪枝,可能剪去大量不必要的状态,因此在空间开销上往往比动态规划要低很多。 如何协调好动态规划的高效率与高消费之间的矛盾呢?有一种折衷的办法就是记忆化算法。记忆化算法在求解的时候还是按着自顶向下的顺序,但是每求解一个状态,就将它的解保存下来,以后再次遇到这个状态的时候,就不必重新求解了。这种方法综合了搜索和动态规划两方面的优点,因而还是很有实用价值的。 §3.3动态规划与网络流 ——动态规划是易设计易实现算法 由于图的关系复杂而无序,一般难以呈现阶段特征(除了特殊的图如多段图,或特殊的分段方法如floyd),因此动态规划在图论中的应用不多。但有一类图,它的点却是有序的,这就是有向无环图。 在有向无环图中,我们可以对点进行拓扑排序,使其体现出有序的特征,从而据此划分阶段。在有向无还图中求最短路径的算法[4],已经体现出了简单的动态规划思想。但动态规划在图论中还有更有价值的应用。下面先看一个例子。 [例6] n个人的街道问题:在街道问题(参见例3)中,若有n个人要从左下角走向右上角,要求他们走过的边的总长度最大。当然,这里每个人也只能向右或向上走。下面是一个样例,左图是从出发地到目的地的三条路径,右图是他们所走过的边,这些边的总长度为5 + 4 + 3 + 6 + 3 + 3 + 5 + 8 + 8 + 7 + 4 + 5 + 9 + 5 + 3 = 78(不一定是最大)。 这个题目是对街道问题的又一次扩展。仿照街道问题的解题方法,我们仍然可以用动态规划来解决本题。不过这一次是n个人同时走,状态变量也就需要用n维来表示,。相应的,决策变量也要变成n维,uk=(uk,1,uk,2,…,uk,n)。状态转移方程不需要做什么改动: 在写规划方程时,需要注意在第k阶段,n条路径所走过的边的总长度的计算,在这里我就用gk(sk,uk)来表示了: 边界条件为 可见将原来的动态规划算法移植到这个问题上来,在理论上还是完全可行的。但是,现在的这个动态规划算法的时空复杂度已经是关于n的指数函数,只要n稍微大一点,这个算法就不可能实现了。 下面我们换一个思路,将n条路径看成是网络中一个流量为n的流,这样求解的目标就是使这个流的费用最大。但是本题又不同于一般的费用流问题,在每一条边e上的流费用并不是流量和边权的乘积 ,而是用下式计算: 为了使经典的费用流算法适用于本题,我们需要将模型稍微转化一下: 如图,将每条边拆成两条。拆开后一条边上有权,但是容量限制为1;另一条边没有容量限制,但是流过这条边就不能计算费用了。这样我们就把问题转化成了一个标准的最大费用固定流问题。 这个算法可以套用经典的最小费用最大流算法,在此就不细说了。(参见附录中的源程序) 这个例题是我仿照ioi97的“障碍物探测器”一题[6]编出来的。“障碍物探测器”比这一题要复杂一些,但是基本思想是相似的。类似的题目还有99年冬令营的“迷宫改造”[7]。从这些题目中都可以看到动态规划和网络流的联系。 推广到一般情况,任何有向无环图中的费用流问题在理论上说,都可以用动态规划来解决。对于流量为n(如果流量不固定,这个n需要事先求出来)的费用流问题,用n维的变量sk=(sk,1,sk,2,…,sk,n)来描述状态,其中sk,i?v(1£i£n)。相应的,决策也用n维的变量uk=(uk,1,uk,2,…,uk,n)来表示,其中uk,i?e(sk,i)(1£i£n),e(v)表示指向v的弧集。则状态转移方程可以这样表示: sk-1,i = uk,i的弧尾结点 规划方程为 边界条件为 但是,由于动态规划算法是指数级算法,因而在实现中的局限性很大,仅可用于一些n非常小的题目。然而在竞赛解题中,比如上面说到的ioi97以及99冬令营测试时,我们使用动态规划的倾向性很明显(“障碍物探测器”中,我们用的是贪心策略,求n=1或n=2时的局部最优解[8])。这主要有两个原因: 一. 虽然网络流有着经典的算法,但是在竞赛中不可能出现经典的问题。如果要运用网络流算法,则需要经过一番模型转化,有时这个转化还是相当困难的。因此在算法的设计上,灵活巧妙的动态规划算法反而要更为简单一些。 二. 网络流算法实现起来很繁,这是被人们公认的。因而在竞赛的紧张环境中,实现起来有一定模式的动态规划算法又多了一层优势。 正由于动态规划算法在设计和实现上的简便性,所以在n不太大时,也就是在动态规划可行的情况下,我们还是应该尽量运用动态规划。 §4结语 本文的内容比较杂,是我几年来对动态规划的参悟理解、心得体会。虽然主要的篇幅讲的都是理论,但是根本的目的还是指导实践。 动态规划,据我认为,是当今信息学竞赛中最灵活、也最能体现解题者水平的一类解题方法。本文内容虽多,不能涵盖动态规划之万一。“纸上得来终觉浅,绝知此事要躬行。”要想真正领悟、理解动态规划的思想,掌握动态规划的解题技巧,还需要在实践中不断地挖掘、探索。实践得多了,也就能体会到渐入佳境之妙了。 动态规划, 算法之常, 运用之妙, 存乎一心。

文章TAG:状态转移方程  什么是状态转移方程  
下一篇