失眠网 > 【多目标进化优化】多目标进化算法的收敛性

【多目标进化优化】多目标进化算法的收敛性

时间：2019-04-30 12:15:44

声明

本文内容来源于《多目标进化优化》郑金华邹娟著，非常感谢两位老师的知识分享，如有侵权，本利立即删除，同时在此表示，本文内容仅学习使用，也禁止他人侵权，谢谢！

0 前言

\quad\quad 对 M O E A MOEA MOEA 收敛性的研究是 M O E A MOEA MOEA 研究的重要内容，但目前这方面的研究结果比较少。一个 M O E A MOEA MOEA 的收敛性可以从两个方面考虑；一是有限时间内的收敛；二是当时间趋向于无穷大时的收敛。第一类收敛是最理想的，也是 M O E A MOEA MOEA 设计所追求的，但这方面的研究结果很少。第二类收敛是理论上的收敛，它对 M O E A MOEA MOEA 设计也具有指导意义。目前的多数工作主要集中于对第二类收敛的研究。本文通过建立 M O E A MOEA MOEA 的简单进化模型来讨论有限时间内的收敛；同时讨论一般情况下 M O E A MOEA MOEA 在理论上的收敛性。

1. 多目标进化模型及其收敛性分析

\quad\quad 本节我们先讨论 M O E A MOEA MOEA 的简单进化模型，并定义一些 r e d u c e reduce reduce 函数，然后论证其收敛性。

1.1 多目标进化简单模型

\quad\quad定义 5.1（目标空间）\quad 设有限集 Z Z Z 是目标空间中所有可行解的集合，即 Z ∈ P r ， r ≥ 2 Z \in P^r，r≥2 Z∈Pr，r≥2 为目标数。（多目标优化中将原始的 x x x 组成的集合叫决策空间，此处定义目标空间用 Z Z Z 来表示)

\quad\quad定义 5.2（Pareto 最优边界）\quad 设有限集 Z ∗ Z^* Z∗ 表示 Z Z Z 的 P a r e t o Pareto Pareto 最优边界集合， Z ∗ = { z ∗ ∈ Z ∣ ∄ z ∈ Z , z ≻ z ∗ } Z^* = \{z^* \in Z|\not \exists z \in Z, z \succ z^*\} Z∗={z∗∈Z∣∃z∈Z,z≻z∗}

\quad\quad定义 5.3（归档集）设有限集 M t ⊆ Z M_t \subseteq Z Mt⊆Z 为时间 t t t (或第 t t t 代）的归档集。（即在第 t 代所产生的最优非支配解集）

\quad\quad定义 5.4（个体产生过程）过程 G e n ( t ) Gen(t) Gen(t) 在时间 t t t 产生的个体为 z t ∈ Z z_t \in Z zt∈Z。对 Z Z Z 中每个个体 z z z ，在时间 t t t 通过 G e n ( t ) Gen(t) Gen(t) 产生 z z z 的概率为 p r ( t , z ) ， p r ( t , z ) > 0 p_r(t, z)， p_r(t, z)>0 pr(t,z)，pr(t,z)>0 \quad(G e n ( t ) Gen(t) Gen(t)：表示某一种进化算法)

\quad\quad定义 5.5（非支配集过滤器）任给一个目标向量集 Z 1 Z^1 Z1，它的非支配集为 N D S e t ( Z 1 ) NDSet(Z^1) NDSet(Z1)：（即用 N D S e t ( Z 1 ) NDSet(Z^1) NDSet(Z1) 来表示 Z 1 Z^1 Z1 的非支配集）

N D S e t ( Z 1 ) = { z i ∈ Z 1 ∣ ∄ z j ∈ Z 1 , z j ≻ z i , i , j ∈ 1 ⋅ ⋅ ⋅ ∣ Z 1 ∣ } NDSet(Z^1) = \{z^i \in Z^1 |\not \exists z^j \in Z^1, z^j \succ z^i, i, j \in 1 ··· |Z^1| \} NDSet(Z1)={zi∈Z1∣∃zj∈Z1,zj≻zi,i,j∈1⋅⋅⋅∣Z1∣}

\quad\quad定义 5.6\quad 设向量 z a z^a za, 非支配集 Z n d = N D S e t ( Z n d ) ， z a Z_{nd} = NDSet(Z_{nd})，z^a Znd=NDSet(Znd)，za 和 Z n d Z_{nd} Znd 之间的关系定义如下：（ z a z^a za：表示 a 这个个体，为向量是因为含有多个目标，且每个目标可能含有多个变量）

\quad\quad ① z a ≻ Z n d ⇔ ∃ z ∈ Z n d , 有 z a ≻ z z^a \succ Z_{nd} \Leftrightarrow \exists z \in Z_{nd}, 有 z^a \succ z za≻Znd⇔∃z∈Znd,有za≻z

\quad\quad ② Z n d ≻ z a ⇔ ∃ z ∈ Z n d , 有 z ≻ z a ，或者 Z n d ≻ z a ⇔ Z n d = N D S e t ( { z a } ∪ Z n d ) , 且 z ∉ Z n d Z_{nd} \succ z^a \Leftrightarrow \exists z \in Z_{nd}, 有 z \succ z^a，或者 Z_{nd} \succ z^a \Leftrightarrow Z_{nd} =NDSet(\{z^a\} \cup Z_{nd}), 且 z \not \in Z_{nd} Znd≻za⇔∃z∈Znd,有z≻za，或者Znd≻za⇔Znd=NDSet({za}∪Znd),且z∈Znd

\quad\quad ③ z a ∽ Z n d ⇔ z a ⊁ Z n d ∧ Z n d ⊁ z a ，且 z ∉ Z n d z^a \backsim Z_{nd} \Leftrightarrow z^a \not \succ Z_{nd} \wedge Z_{nd} \not \succ z^a，且 z \not \in Z_{nd} za∽Znd⇔za≻Znd∧Znd≻za，且z∈Znd 。( 即表示： z a z^a za 与 Z n d Z_{nd} Znd 无关，互不支配)

\quad\quad 在讨论 M O E A MOEA MOEA 的收敛性之前，为简便起见，先建立一个简化了的 M O E A MOEA MOEA 模型，如算法 5.1 （simple MOEA, SMOEA）所示。虽然 S M O E A SMOEA SMOEA 在每一代进化时只产生一个新个体，但很容易将 S M O E A SMOEA SMOEA 扩展为一般的 M O E A MOEA MOEA,即在每一代进化时产生多个新个体。

\quad\quad定义 5.7（收敛）当 M t M_t Mt 中所有个体在进一步运行 S M O E A SMOEA SMOEA 时不再发生变化，即 ∀ t ＞ t c \forall t ＞ t_c ∀t＞tc，有 M t = M t c M_t = M_{t_{c}} Mt=Mtc，则称 M t M_t Mt 收敛。（即随着新一代产生，归档集中的个体不发生变化时，收敛）

1.2 reduce 函数

（1）unbounded reduce 函数

\quad\quad unbounded reduce 函数非常简单，每次产生一个新个体时，只有当它对归档集是非支配的，才将该个体加人到归档集，并将归档集中被它所支配的所有个体删除，如算法 5.2 所示。容易证明，unbounded reduce 函数可以使 SMOEA 收敛到最优解集。由此，归档集的大小取决于可行解集 Z Z Z 的大小，而 Z Z Z 可能很大，因此这类算法的实用价值不大。

（2）simple bounded reduce 函数

\quad\quad simple bounded reduce 函数与 unbounded reduce函数的不同之处在于，归档集的大小为一约定值 arcsize。这样，当新个体支配归档集时，将它加入到归档集中，同时删除归档集中被该个体所支配的个体；否则，只有当归档集不满时，即当（ ∣ M t − 1 − 1 ∣ | M_{t-1}-1 | ∣Mt−1−1∣ < arcsize）时，才将它加入到归档集中，同时删除归档集中被该个体所支配的个体。如算法 5.3 所示。容易证明 simple bounded reduce 函数可以使 SMOEA 收敛到最优解集的一个子集，但解集具有比较差的分布性。

（3）S-metric reduce 函数

S ( A ) S(A) S(A) ：由一组目标向量所支配的区域

\quad\quad 在 S-metric reduce 函数中，当有新的非支配个体产生时，利用 S-metric 来保持归档集中个体的分布性。S-metric 最早由 Zitzler 等提出(Zitzler et al,1999a)， Fleischer 也对它 (Fleischer, )进行了比较详细的讨论。S-metric 类似于 hypervolume measure 方法，是目标空间中被非支配集所支配的一块区域，如图 5.1 所示。在图 5.1 的左上部，三个向量 { z 1 ， z 2 ， z 3 } \{z^1，z^2，z^3\} {z1，z2，z3} 共同支配的区域为 S(A)，在图 5.1 的右上部，三个向量 { z 1 ， z 2 ， z 3 } \{z^1，z^2，z^3\} {z1，z2，z3} 共同支配的区域为 S(B)，有 S(A) > S(B)。在图 5.1 的下半部分，由于参考向量 z r e f z^{ref} zref 在第二个目标上的值变大，而在第一个目标上的值又变小了，这样，三个向量 { z 1 ， z 2 ， z 3 } \{z^1，z^2，z^3\} {z1，z2，z3} 共同支配的区域发生了变化，此时有 S(A) < S(B)。由此可见，S-metric 与参考向量的选取有关。（ z r e f z^{ref} zref：参考向量）

\quad\quad 给定向量集 A = { z 1 , z 2 , … } A = \{z^1 , z^2 ,…\} A={z1,z2,…}，其中 z i = { z 1 i , z 2 i , … , z r i } z^i=\{z_1^i, z_2^i ,…, z_r^i\} zi={z1i,z2i,…,zri} 和一个参考向量 z r e f = { z 1 r e f , z 2 r e f , . . . , z r r e f } z^{ref} = \{z_1^{ref}, z_2^{ref}, ..., z_r^{ref}\} zref={z1ref,z2ref,...,zrref}, 定义 R ( A , z r e f ) R(A, z^{ref}) R(A,zref) 为：

R ( A , z r e f ) = ∪ i ∈ 1... ∣ A ∣ R ( z i , z r e f ) R(A, z^{ref}) = \cup_{i \in 1...|A|} R(z^i, z^{ref}) R(A,zref)=∪i∈1...∣A∣R(zi,zref)

式中， R ( z i , z r e f ) = { y ∣ y ≻ z r e f ∧ z i ≻ y , y ∈ R r } R(z^i, z^{ref}) = \{y|y \succ z^{ref} \wedge z^i \succ y, y \in \Bbb{R}^r\} R(zi,zref)={y∣y≻zref∧zi≻y,y∈Rr}（即向量集 A 中的每个向量与参考向量之间的区域，如图 5.1 中的 S 区域）

\quad\quad A A A 的 S − m e t r i c S-metric S−metric 是 A A A 与参考向量 z r e f z^{ref} zref 之间的一块区域，或者说是 R ( z i , z r e f ) R(z^i, z^{ref}) R(zi,zref) 的 Lebesgue integral 积分

\quad\quad 在只有 2 个目标的情况下， S ( A ) S(A) S(A) 的计算可表示为

S ( A ) = ∑ i ∈ 1... ∣ A ∣ ∣ z 1 i − z 1 r e f ∣ ⋅ ∣ z 2 i − z 2 i − 1 ∣ S(A) = \sum_{i \in 1...|A|} |z_1^i - z_1^{ref} | \cdot |z_2^i - z_2^{i-1}| S(A)=i∈1...∣A∣∑∣z1i−z1ref∣⋅∣z2i−z2i−1∣

式中， z 2 0 = z 2 r e f z_2^0 = z_2^{ref} z20=z2ref。（其中 z 1 i z^i_1 z1i 表示第 i i i 个个体的第 1 个目标向量，即上标表示个体，下标表示目标）

\quad\quad 当目标数大于 2 时，计算 S ( A ) S(A) S(A) 比较复杂一些，这里介绍一个用递归计算 S ( A ) S(A) S(A) 的方法 s i z e − o f − s e t ( A , z r e f , r ) size-of-set(A, z^{ref}, r) size−of−set(A,zref,r)，如算法 5.4 所示。值得说明的是，在计算 S ( A ) S(A) S(A) 时，要在第一个目标上对 A A A 中个体按降序排序。

1.3 收敛性分析

\quad\quad 下面来讨论 S − m e t r i c r e d u c e S-metric reduce S−metricreduce 函数的收敛性，即讨论 S − m e t r i c r e d u c e S-metric reduce S−metricreduce 函数是否可以使 S M O E A SMOEA SMOEA 收敛到最优解集。为了讨论方便，这里将 S M O E A + S − m e t r i c r e d u c e SMOEA + S-metric reduce SMOEA+S−metricreduce 函数表示为 S M O E A S SMOEAS SMOEAS

\quad\quad引理 5.1\quad 若 M t − 1 M_{t-1} Mt−1 是一个非支配集，在时刻 t t t 应用了 ( r u l e ： s i z e ) (rule： size) (rule：size)，则 M t M_t Mt 仍为非支配集。也就是说， ( r u l e ： s i z e ) (rule： size) (rule：size) 能维持归档集为一个非支配集。（ ( r u l e ： s i z e ) (rule： size) (rule：size)：表示通过进化算法产生新的个体 z t z_t zt，并利用 S-metric reduce 函数筛选后得到了 M t M_t Mt）

\quad\quad引理 5.2\quad 若存在 t , t, t, S M O E A − S SMOEA-S SMOEA−S 使 M t M_t Mt 收敛，则有 M t ⊆ Z ∗ M_t \subseteq Z^* Mt⊆Z∗ \quad（ Z ∗ Z^* Z∗ 为 Pareto 最优边界组成的集合，都收敛了肯定属于 Z ∗ Z^* Z∗）

\quad\quad引理 5.3\quad 若 t n ＞ t m ， M t n ≠ M t m t_n ＞ t_m，M_{t_n} ≠ M_{t_m} tn＞tm，Mtn=Mtm，则 ∀ t ＞ t m , M t ≠ M t m \forall t ＞ t_m, M_{t} ≠ M_{t_m} ∀t＞tm,Mt=Mtm

\quad\quad引理 5.4\quad 存在 t ， S M O E A − S t，SMOEA-S t，SMOEA−S 使 M t M_t Mt 收敛。

\quad\quad引理 5.5\quad S M O E A − S SMOEA-S SMOEA−S 使 M t M_t Mt 收敛到 Z ∗ Z^* Z∗ 的子集。

2. 自适应网格算法及其收敛性

\quad\quad 在多目标进化群体的分布性一文中已经讨论了自适应网格技术，这里将具体讨论自适应网格算法(adaptive grid algorithm, AGA),并对其收敛性进行分析。由于采用 A G A AGA AGA 保持进化群体分布性时，不能有效地阻止某些非支配个体多次循环地进入和移出归档集，因此 S M O E A + A G A ( 简称 S M O E A − A ) SMOEA+AGA (简称SMOEA-A) SMOEA+AGA(简称SMOEA−A) 不能满足定义 5.7 的收敛性，但 S M O E A − A SMOEA-A SMOEA−A 能使进化群体具有良好的分布性。

2.1 有关定义

为了讨论方便，先给出有关定义

\quad\quad定义 5.8\quad 设第 t − 1 t-1 t−1 代归档集为 M t − 1 ， G e n ( t ) M_{t-1}，Gen(t) Mt−1，Gen(t) 产生的新个体为 z t z_t zt ,则 N t = N D S e t ( { z t } ∪ M t − 1 ) N_t = NDSet(\{z_t\} \cup M_{t-1}) Nt=NDSet({zt}∪Mt−1)。注意，此时可能有 ∣ N t ∣ > a r c s i z e |N_t| > arcsize ∣Nt∣>arcsize。（ N t N_t Nt：表示第 t 代的非支配集）

\quad\quad定义 5.9\quad 可行解集 Z Z Z 中，设第 k k k 个目标的最大和最小值分别表示为 m a x z k , z maxz_{k, z} maxzk,z 和 m i n z k , z minz_{k, z} minzk,z ，其中 m a x z k , z = m a x z ∈ Z ( z k ) , m i n z k , z = m i n z ∈ Z ( z k ) maxz_{k, z} = max_{z \in Z}(z_k), minz_{k, z} = min_{z \in Z}(z_k) maxzk,z=maxz∈Z(zk),minzk,z=minz∈Z(zk) 。则 N t N_t Nt 中，第 k k k 个目标的域宽 r a n g e k , t = m a x { z k ∣ z ∈ N t } − m i n { z k ∣ z ∈ N t } range_{k,t} = max\{z_k | z \in N_t\} - min\{z_k | z \in N_t\} rangek,t=max{zk∣z∈Nt}−min{zk∣z∈Nt} \quad（第 k 个目标的域宽即为非支配集中，最大向量 - 最小向量）

\quad\quad定义 5.10\quad 一个自适应网格，需要设置 2 r 2r 2r 个边界：下界 ( l b k ) (lb_k) (lbk) 和上界 ( u b k ) ( k = 1 , 2 , . . . , r ) , r (ub_k) (k = 1, 2, ..., r), r (ubk)(k=1,2,...,r),r 为目标数。 ∀ t , ∀ k , l b k , t < m i n { z k ∣ z ∈ N t } \forall t, \forall k, lb_{k, t} < min\{z_k | z \in N_t\} ∀t,∀k,lbk,t<min{zk∣z∈Nt} 且 u b k , t > m a x { z k ∣ z ∈ N t } ub_{k, t} > max\{z_k | z \in N_t\} ubk,t>max{zk∣z∈Nt}。（第 k 个目标的下界小于非支配集中的最小向量，上界大于最大向量）

\quad\quad定义 5.11\quad 用超立方体的两个对角标识一个自适应网格： ( l b 1 , t , l b 2 , t , . . . . , l b r , t ) (lb_{1,t}, lb_{2,t}, ...., lb_{r,t}) (lb1,t,lb2,t,....,lbr,t) 和 ( u b 1 , t , u b 2 , t , . . . . , u b r , t ) , (ub_{1,t}, ub_{2,t}, ...., ub_{r,t}), (ub1,t,ub2,t,....,ubr,t), 它可以被分割为若干个小网格（或区域） r t i ∈ R t r_t^i \in R_t rti∈Rt 这里 i = ( i 1 , i 2 , . . . , i r ) i = (i_1, i_2, ..., i_r) i=(i1,i2,...,ir)，且有 i k ∈ { 1 , 2 , . . . , d } , d ∈ Z i_k \in \{1, 2, ..., d\}, d \in \Bbb Z ik∈{1,2,...,d},d∈Z 是一个常数，表是在每一维上的分割次数，一般为大于 2 的自然数。具体的分割次数取决于进化群体的大小和待优化问题的目标数。将所有小网格 r t i ∈ R t r_t^i \in R_t rti∈Rt 的坐标 i i i 表示为 I I I 的集合，有 ∣ I ∣ = d r |I| = d^r ∣I∣=dr。 \quad（对于这里 r t i r_t^i rti 不怎么清楚的朋友，可以先看一下我另一篇博文的网格部分：多目标进化群体的分布性）

\quad\quad定义 5.12\quad 每个小网格 r t i ∈ R t r_t^i \in R_t rti∈Rt 的边界定义如下：

∀ k ∈ { 1 , 2 , . . . , r } , r u b k , i , t = l b k , t + i k × w k , t \forall k \in \{1, 2, ..., r\}, rub_{k, i, t} = lb_{k, t} + i_k × w_{k, t} ∀k∈{1,2,...,r},rubk,i,t=lbk,t+ik×wk,t

r l b k , i , t = l b k , t + ( i k − 1 ) × w k , t rlb_{k, i, t} = lb_{k, t} + (i_k - 1)× w_{k, t} rlbk,i,t=lbk,t+(ik−1)×wk,t

其中 w k , t w_{k, t} wk,t 为每一个小网格在第 k k k 维上的宽度 , w k = r a n g e k , t / d , ， r a n g e k , t , w_k = range_{k, t}/d,，range_{k, t} ,wk=rangek,t/d,，rangek,t 为第 k k k 维上的域宽。（ r t i r_t^i rti 即如下的很多个小网格区域）

\quad\quad定义 5.13 （占用区）\quad 设 z ∈ M t − 1 , z \in M_{t-1} , z∈Mt−1, 对区域 r t i ， r_t^i， rti，若 ∀ k ∈ { 1 , 2 , . . . , r } , z k ≥ r l b k , i , t \forall k \in \{1, 2, ..., r\}, z_k ≥ rlb_{k, i, t} ∀k∈{1,2,...,r},zk≥rlbk,i,t 且 z k < r u b k , i , t ， z_k < rub_{k, i, t}， zk<rubk,i,t，则称个体 z z z 在区域 r t i r_t^i rti 中，并将 r t i r_t^i rti 称为占用区（occupied region,OR）

\quad\quad定义 5.14 （Pareto 占用区）\quad 设 z ∈ Z ∗ z \in Z^* z∈Z∗ ( z z z 可以不在 M t − 1 M_{t-1} Mt−1 中)，对区域 r t i r_t^i rti，若 ∀ k ∈ { 1 , 2 , . . . , r } , z k ≥ r l b k , i , t \forall k \in \{1, 2, ..., r\}, z_k ≥ rlb_{k, i, t} ∀k∈{1,2,...,r},zk≥rlbk,i,t 且 z k < r u b k , i , t z_k < rub_{k, i, t} zk<rubk,i,t ，则将 r t i r_t^i rti 称为 Pareto 占用区（Pareto occupied region, POR）。

\quad\quad定义 5.15\quad p ( r t i ) p(r_t^i) p(rti) 为区域 r t i r_t^i rti 中所有个体的计数，即 p ( r t i ) = ∣ { z ∈ M t − 1 ∣ ∀ k ∈ { 1 , 2 , . . . , r } , z k ≥ r l b k , i , t ∧ z k < r u b k , i , r } ∣ p(r_t^i) = | \{z \in M_{t-1} | \forall k \in \{1, 2, ..., r\}, z_k ≥ rlb_{k, i, t} \wedge z_k < rub_{k, i, r}\} | p(rti)=∣{z∈Mt−1∣∀k∈{1,2,...,r},zk≥rlbk,i,t∧zk<rubk,i,r}∣。 \quad（注意这里是对 M t − 1 M_{t-1} Mt−1 中的个体进行计数）

\quad\quad定义 5.16\quad o c c ( r t i , Z ) occ(r_t^i, Z) occ(rti,Z) 为区域 r t i r_t^i rti 中所有个体的集合，即 o c c ( r t i , Z ) = { z ∈ Z ∣ ∀ k ∈ { 1 , 2 , . . . , r } , z k ≥ r l b k , i , t ∧ z k < r u b k , i , r } ， o c c ( r t i , Z ) ⊆ Z occ(r_t^i, Z) = \{z \in Z | \forall k \in \{1, 2, ..., r\},z_k ≥ rlb_{k, i, t} \wedge z_k < rub_{k, i, r} \}， occ(r_t^i, Z) \subseteq Z occ(rti,Z)={z∈Z∣∀k∈{1,2,...,r},zk≥rlbk,i,t∧zk<rubk,i,r}，occ(rti,Z)⊆Z

\quad\quad定义 5.17\quad 在时间 t , t, t, 被向量 z z z 所占用的区域 r t i r_t^i rti，表示为 r t i ( z ) r_t^{i(z)} rti(z)

\quad\quad定义 5.18\quad 在 N t N_t Nt 中的极点向量（uniquely extremal vectors）定义为： \quad（ N t N_t Nt：第 t 代的非支配集）

z e x t = { y ∈ N t ∣ ( ∃ k ∈ { 1 , 2 , . . . , r } , ∄ z ∈ N t , z ≠ y , z k ≤ y k ) ∨ ( ∃ k ∈ { 1 , 2 , . . . , r } , ∄ z ∈ N t , z ≠ y , z k ≥ y k ) } z^{ext} = \{y \in N_t | (\exists k \in \{1, 2, ..., r\}, \not \exists z \in N_t, z ≠ y, z_k ≤ y_k) \vee (\exists k \in \{1, 2, ..., r\}, \not \exists z \in N_t, z ≠ y, z_k ≥ y_k)\} zext={y∈Nt∣(∃k∈{1,2,...,r},∃z∈Nt,z=y,zk≤yk)∨(∃k∈{1,2,...,r},∃z∈Nt,z=y,zk≥yk)}

\quad\quad 也就是说，在某个目标上其值最大或最小的个体均被认为是极点。极点总是分布在端点位置上，它有利于使进化群体具有更好的分布性，故而在执行选择操作时，一般不能让极点丢失。

\quad\quad定义 5.19\quad 在区域 r t i r_t^i rti 中，将除去极点后所有个体的集合（non-uniquely extremal vectors）定义为 n u e ( r t i ) , nue(r_t^i), nue(rti), 即 n u e ( r t i ) = o c c ( r t i , Z ) \ z e x t nue(r_t^i) = occ(r_t^i, Z) \backslash z^{ext} nue(rti)=occ(rti,Z)\zext。 ( \ \backslash \ 并不是除法，表示除去其中的向量)

\quad\quad定义 5.20（最大区域聚集）\quad 定义 p u n e ( r t i ) = ∣ n u e ( r t i ) ∣ ， p_{une}(r_t^i) = |nue(r_t^i)| ， pune(rti)=∣nue(rti)∣，则当 p u n e ( r t i ) p_{une}(r_t^i) pune(rti) 具有最大值时，表明在区域 r t i r_t^i rti 聚集的个体最多（crowded region, CR），将所有 C R CR CR 的集合定义为 C R t = { i ∈ I ∣ m a x ( p u n e ( r t i ) ) } CR_t = \{i \in I | \ max(p_{une}(r_t^i))\} CRt={i∈I∣max(pune(rti))}

\quad\quad定义 5.21\quad 定义时间 t , t, t, 所有 C R CR CR 中的个体组成的集合为 Z c , t = { z ∣ z ∈ ∪ n u e ( r t i ) , r t i ∈ C R t } Z_{c,t} = \{z | z \in \cup nue(r_t^i), r_t^i \in CR_t\} Zc,t={z∣z∈∪nue(rti),rti∈CRt} \quad（最大区域聚集中的个体）

\quad\quad 在 Z c , t Z_{c,t} Zc,t 中，其个体的聚集程度最大，因此，为保持进化群体的分布性，通常从 Z c , t Z_{c,t} Zc,t 中随机选取个体 z c , t ∈ Z c , t z_{c,t} \in Z_{c,t} zc,t∈Zc,t 删除

\quad\quad 值得说明的是，在以上定义中，假定 ∀ t , k ∈ { 1 , 2 , . . . , r } , m a x { z k ∣ z ∈ N t } ≠ m i n { z k ∣ z ∈ N t } \forall t, k \in \{1,2,... ,r \}, max\{z_k | z \in N_t\} ≠ min\{z_k | z \in N_t\} ∀t,k∈{1,2,...,r},max{zk∣z∈Nt}=min{zk∣z∈Nt} , 同时假设归档集大小 a r c s i z e > 2 r ， arcsize>2r， arcsize>2r，这里 r r r 为目标数。

2.2 自适应网格算法

2.3 AGA 收敛性分析

\quad\quad 要分析 AGA(自适应网格算法) 的收敛性，就必须考虑网格的边界，网格中的每一个区域的边界，以及进化个体在这些区域中的分布等，本节讨论 AGA 在一定条件下是收敛的。

\quad\quad引理 5.5\quad 设在时间 t t t 产生的向量为 z t ∈ Z z_t \in Z zt∈Z，如果对一些 j ∈ { 1 , 2 , . . . , r } j \in \{1, 2, ..., r\} j∈{1,2,...,r}，有 z j = m i n z j , Z z_j = minz_{j, Z} zj=minzj,Z，则 m i n z j , M t = m i n z j , Z minz_{j, M_t} = minz_{j, Z} minzj,Mt=minzj,Z

\quad\quad引理 5.6\quad 如果对一些 j ∈ { 1 , 2 , . . . , r } , ∃ z ∈ M t m 使 z j = m i n z j , Z ， j \in \{1, 2, ..., r\}, \exists z \in M_{t_m} 使 z_j = minz_{j, Z}， j∈{1,2,...,r},∃z∈Mtm使zj=minzj,Z，则 ∀ t > t m ， ∃ z ∈ M t \forall t > t_m，\exists z \in M_t ∀t>tm，∃z∈Mt 使 z j = m i n z j , Z z_j = minz_{j, Z} zj=minzj,Z

\quad\quad定理 5.2\quad 网格的下边界 ( l b k , t lb_{k,t} lbk,t) 收敛， k ∈ { 1 , 2 , . . . , r } k \in \{1, 2, ..., r\} k∈{1,2,...,r}

\quad\quad 定理 5.2 表明了上边界是收敛的。但对于上边界，它在一般条件下是不收敛的，只有在某种特定的条件下才收敛。为了后续讨论，先假定上边界也是收敛的。

\quad\quad假设 5.1\quad 网格的上边界 ( u b k , t ub_{k, t} ubk,t) 收敛， k ∈ { 1 , 2 , . . . , r } k \in \{1, 2, ..., r\} k∈{1,2,...,r}

\quad\quad推论 5.1\quad 网格中所有小网格(区域)的边界是收敛。

\quad\quad 推论 5.1 是由定理 5.2 和假设 5.1 得出的。接下来的讨论将依赖于推论 5.1。为便于进一步的讨论，下面先定义有关术语。

\quad\quad定义 5.22\quad 将边界收敛的区域的集合定义为区域收敛集，每个这样的区域定义为收敛区域(converged region, CR)。

\quad\quad定义 5.23\quad 若一个区域收敛集的子集总是被占用，则说存在占用区域的收敛集(a converged set of occupied regions),表示为 R C O R R_{COR} RCOR，并将这样的区域称为常占区(constantly occupied region, COR) 。

\quad\quad定义 5.24\quad 我们说一个区域厂 r ( 1 ) r^{(1)} r(1) 优于另一个区域 r ( 2 ) r^{(2)} r(2)，或者说 r ( 2 ) r^{(2)} r(2) 比 r ( 1 ) r^{(1)} r(1) 劣，当且仅当 r ( 1 ) r^{(1)} r(1) 的坐标均小于 r ( 2 ) r^{(2)} r(2) 的。

\quad\quad 这样，在 r ( 2 ) r^{(2)} r(2) 中的个体均被 r ( 1 ) r^{(1)} r(1) 中的个体所支配，任何一个比 P O R POR POR 差的区域不可能是 P O R ， POR， POR，如图 5. 2 所示（POR：Pareto 占用区）

\quad\quad定义 5.25\quad 当 r ( 1 ) r^{(1)} r(1) 的坐标小于等于 r ( 2 ) r^{(2)} r(2) 的坐标时，我们说区域 r ( 1 ) r^{(1)} r(1) 稍优于区域 r ( 2 ) r^{(2)} r(2)，或者说 r ( 2 ) r^{(2)} r(2) 比 r ( 1 ) r^{(1)} r(1) 稍劣。

\quad\quad 如果 r ( 2 ) r^{(2)} r(2) 比 r ( 1 ) r^{(1)} r(1) 稍劣,则在 r ( 2 ) r^{(2)} r(2) 中可能存在非支配个体,这样, r ( 2 ) r^{(2)} r(2) 可能是 POR。

\quad\quad定义 5.26\quad 如果两个区域之间相互没有谁优或稍优，则称这两个区域是相互不可比较的(incomparable)，或称相容。

\quad\quad定义 5.27\quad 在收敛区域集中，不比其他任何 P O R POR POR 稍劣的 P O R POR POR 称为关键 P O R POR POR 或 C P O R ( c r i t i c a l P O R ) CPOR (critical POR) CPOR(criticalPOR) 所有 C P O R CPOR CPOR 的集合表示为 R C P O R R_{CPOR} RCPOR，如图 5.3 所示

\quad\quad 在图 5.3 中， z 1 z^1 z1 所在区域 r 2 , 2 r^{2,2} r2,2 稍优于 z 2 z^2 z2 所在区域 r 2 , 3 ， r^{2,3}， r2,3，或者 r 2 , 3 r^{2,3} r2,3 稍劣于 r 2 , 2 r^{2,2} r2,2。 r 2 , 3 r^{2,3} r2,3 中个体可能被 r 2 , 2 r^{2,2} r2,2 中个体所支配，但 r 2 , 2 r^{2,2} r2,2 中个体绝不可能被 r 2 , 3 r^{2,3} r2,3 中个体所支配。事实上， r 2 , 2 r^{2,2} r2,2 不比其他任何区域稍劣，因此它是 C P O R ， CPOR， CPOR，可见，在 C P O R CPOR CPOR 中的个体不被可行解集 Z Z Z 中任何其他个体所支配。

\quad\quad定义 5.28\quad 我们将 P O R POR POR 和比 P O R POR POR 稍劣的区域统称为 P a r e t o Pareto Pareto 非劣区域，或 PNIR (Pareto non-inferior region)，如图 5.4 所示。在图 5.4 中， r 1 , 5 r^{1, 5} r1,5 是 P O R ， POR， POR， r 2 , 5 r^{2, 5} r2,5 比 r 1 , 5 r^{1, 5} r1,5 稍劣，它们都是 PINR。

\quad\quad引理 5.7\quad 如果一个 C P O R CPOR CPOR 在时间 t i t_i ti 是被占用的，则对该 C P O R CPOR CPOR 也是被占用的

\quad\quad定理 5.3\quad 在一个有 r r r 个目标的向量空间中，非劣区域的最大数目为 d r − ( d − 1 ) r ， d^r - (d-1)^r， dr−(d−1)r，其中 d d d 为每一维空间的均分次数。

\quad\quad引理 5.8\quad ∀ t , G e n ( t ) \forall t, Gen(t) ∀t,Gen(t) 产生的向量为 z t ∈ Z ∗ ， z_t \in Z^*， zt∈Z∗，若 a r c s i z e > d r − ( d − 1 ) r + 2 r ， arcsize > d^r - (d-1)^r + 2r， arcsize>dr−(d−1)r+2r，则有 p ( r t i ( z t ) ) ≥ 1 p(r_t^{i(z_t)}) ≥ 1 p(rti(zt))≥1

\quad\quad定理 5.4\quad 若 a r c s i z e > d r − ( d − 1 ) r + 2 r ， arcsize > d^r - (d-1)^r + 2r， arcsize>dr−(d−1)r+2r，则 ∃ t m ， \exists t_m， ∃tm，使得 ∀ t > t m , ∀ r t i ∈ R C P O R ， \forall t > t_m, \forall r_t^i \in R_{CPOR}， ∀t>tm,∀rti∈RCPOR，有 p ( r t − 1 i ) > 0 p(r_{t-1}^i) > 0 p(rt−1i)>0

\quad\quad定理 5.5\quad 若在时间 t m t_m tm，所有的 C P O R CPOR CPOR 收敛到 R C P O R R_{CPOR} RCPOR，则 ∀ t > t m , M t \forall t > t_m , M_t ∀t>tm,Mt 中所有的个体将会占用 PNIR。

2.4 AGA 的收敛条件

\quad\quad 上一小节讨论了在网格的上边界是收敛的情况下，AGA 是收敛的。本节将讨论网格的上边界在什么条件下收敛。

\quad\quad 一种特殊情况是，当目标数为 2，同时在每个目标上最优边界的宽度与整个搜索空间的宽度相同，这种情况下网格的上边界是收敛的。然而，对于一般情况，结果未必正确，如个体循环地进入归档集和从归档集中移出，这种情况的上边界是不收敛的。例如，在一个 3 目标归档集中，设当前第一个目标值最大的向量为 z 1 = ( 5 , 2 , 7 ) z^1 = (5, 2, 7) z1=(5,2,7) 若在下一个时间产生了一个向量 z 2 = ( 6 , 4 , 5 ) z^2=(6, 4, 5) z2=(6,4,5)，则向量 z 2 z^2 z2 将被接收进入归档集，并将第一个目标的上边界从 5 修改为 6；若接下来产生了一个向量 z 3 = ( 5 , 3 , 4 ) z^3 = (5, 3, 4) z3=(5,3,4)，因 z 3 z^3 z3 支配 z 2 z^2 z2，故接收 z 3 z^3 z3，并将 z 2 z^2 z2 从归档集中移出，同时将第一个目标的上边界从 6 改为 5。如果这种进入和移出操作循环发生，第一个目标的上边界就不会收敛。

\quad\quad 为使网格的上边界收敛，有必要做一些限制。

\quad\quad条件 5.1\quad ∀ k , ∄ z ∈ C ( Z ∗ ) ， z k ≥ m a x z k , Z ∗ ， ∃ z ∗ ∈ Z ∗ ， z k ∗ = m a x z k , Z ∗ ， z ∽ z ∗ \forall k, \not \exists z \in C(Z^*)，z_k ≥ maxz_{k, Z^*}，\exists z^* \in Z^*，z_k^* = maxz_{k, Z^*}，z \backsim z^* ∀k,∃z∈C(Z∗)，zk≥maxzk,Z∗，∃z∗∈Z∗，zk∗=maxzk,Z∗，z∽z∗。这里 C ( Z ∗ ) = Z \ Z ∗ ， r C(Z^*) = Z \backslash Z^*，r C(Z∗)=Z\Z∗，r 为目标数

\quad\quad 条件5.1 做岀的限制是，不存在这样的支配向量，它在某个目标上的值大于等于非支配向量在这个目标上的最大值，同时它又与这个具有最大目标值的向量不可比较。

\quad\quad引理 5.9\quad 如果条件 5.1 成立，同时在时间 t t t 产生了一个向量 z ∗ ∈ Z ∗ ， k ∈ { 1 , 2 , . . . , r } ， z k ∗ = m a x z k , Z ∗ ， z^* \in Z^*，k \in \{1, 2, ..., r\}，z_k^* = maxz_{k, Z^*}， z∗∈Z∗，k∈{1,2,...,r}，zk∗=maxzk,Z∗，则有 m a x z k , M t = m a x z k , Z ∗ maxz_{k, M_t} = maxz_{k, Z^*} maxzk,Mt=maxzk,Z∗。这里 r r r 为目标数。

\quad\quad引理 5.10\quad 如果条件 5.1 成立， k ∈ { 1 , 2 , . . . , r } ， ∃ z ∈ M t m , z k = m a x z k , Z ∗ k \in \{1, 2, ..., r\}，\exists z \in M_{t_m}, z_k = maxz_{k, Z^*} k∈{1,2,...,r}，∃z∈Mtm,zk=maxzk,Z∗ ，则 ∀ t > t m ， ∃ y ∈ M t ， y k = m a x z k , Z ∗ \forall t > t_m，\exists y \in M_t，y_k = maxz_{k, Z^*} ∀t>tm，∃y∈Mt，yk=maxzk,Z∗。这里 r r r 为目标数。

\quad\quad定理 5.6\quad 如果条件5.1 成立，网格的上边界 u b k , t ub_{k, t} ubk,t 收敛 ( k ∈ { 1 , 2 , . . . , r } k \in \{1, 2, ..., r\} k∈{1,2,...,r})， r r r 为目标数。

\quad\quad 下面讨论在 2 目标的特殊情况下，条件 5.1 总是成立的

\quad\quad定理 5.7\quad 当目标数 r = 2 r = 2 r=2 时，条件5.1 成立

3. MOEA 的收敛性分析

\quad\quad 前面已讨论了，通过建立多目标进化的简单模型，针对具体的 reduce 函数，论证了其收敛性。最大的特点是，算法在有限步内收敛，因此具有很好的实用价值。但不足之处是不具有一般性，为此，本节从一般意义上讨论 MOEA 的收敛性。

3.1 Pareto 最优解集的特征

\quad\quad 在单目标优化 EA 中。任意两个目标函数值均可以比较其大小，因此可行解集合是全序的。而在多目标优化 MOEA 中，存在一些个体，它们之间是不可比较的，如所有的非支配个体（或向量）之间是相互不可比较的。多目标优化的可行解集是一个偏序集。

\quad\quad定义 5.29 （关系）\quad 令 x ， y ∈ X ， x，y \in X， x，y∈X， R R R 为定义在 x x x 和 y y y 上的二元关系，即存在序偶 ⟨ x , y ⟩ ∈ R ， \langle x, y \rangle \in R， ⟨x,y⟩∈R，表示为 x R y xRy xRy。若 ∀ x ∈ X ， x R x \forall x \in X，xRx ∀x∈X，xRx，则称 R R R 为自反的。若 ∀ x ∈ X ， ⟨ x , x ⟩ ∉ R \forall x \in X，\langle x, x \rangle \not \in R ∀x∈X，⟨x,x⟩∈R，则称 R R R 为反自反的。若 ∀ x ， y ∈ X ， x R y ， \forall x，y \in X，xRy， ∀x，y∈X，xRy，则必有 y R x ， yRx， yRx，称 R R R 为对称的。若 ∀ x ， y ∈ X ， x R y ， y R x ， \forall x，y \in X，xRy，yRx， ∀x，y∈X，xRy，yRx，则必有 x = y ， x =y， x=y，称 R R R 为反对称的。若 ∀ x ， y ∈ X ， x R y ， y R z ， \forall x，y \in X，xRy，yRz， ∀x，y∈X，xRy，yRz，则必有 x R z ， xRz， xRz，称 R R R 为传递的。

\quad\quad定义 5.30 （偏序关系和偏序集）\quad 若 R R R 是自反的、反对称的和传递的，则称 R R R 为偏序关系，同时称（ X , R ）（X, R）（X,R）为偏序集。

\quad\quad定义 5.31 （严格偏序关系）\quad 若 R R R 是反自反的、传递的，则称 R R R 为严格偏序关系。

\quad\quad 在定义 5.31 中没有列出反对称关系，是因为由反自反和传递的这两个关系，可以推导岀反对称关系。在多目标优化中定义的支配关系 “ ≻ ” “\succ” “≻” 是严格偏序关系，称（ X , ≻ ）（X, \succ）（X,≻）为偏序集。

\quad\quad定义 5.32 （最小元素）\quad 称 x ∗ x^* x∗ 是偏序集（ X , ≻ ）（X, \succ）（X,≻）中的最小元素，若在 X X X 中不存在任何其他 x x x 比 x ∗ x^* x∗ 更小，即 ∄ x ∈ X ， \not \exists x \in X， ∃x∈X，使 x ≻ x ∗ x \succ x^* x≻x∗。所有最小元素的集合表示为 M ( X , ≻ ) M(X, \succ) M(X,≻)。

\quad\quad 这里定义的最小元集合 M ( X , ≻ ) M(X, \succ) M(X,≻)，就是 X X X 的非支配集。

\quad\quad 一般情况下，有 X = R n X = R^n X=Rn，但在 M O E A MOEA MOEA 实现和应用中，所有的操作或运算都是基于有限集合的，通常将这个有限集合称为可行解集。在任何有限解集上，至少存在一个最优解。

\quad\quad定理 5.8\quad 给定一个多目标优化问题 MOP （multi-objective problem）和非空有限可行解集 w ⊆ Ω w \subseteq \Omega w⊆Ω，至少存在一个最优解

\quad\quad定义 5.33 （variation kernel, VK）\quad 在 E A EA EA 中， V K VK VK 是一个函数，它将搜索空间中父个体的转移概率映射到其子个体。当 V K ＞ 0 VK＞0 VK＞0，表明 V K VK VK 是正的，即 PVK（ positive variation kernel）

\quad\quad Rudolph 定义的 V K VK VK，即转移概率函数，就是可达条件。也就是说，通过合适的交叉和变异操作，使搜索空间中每个点（个体）均成为可访问的。这样，在有限时间内，至少有一个个体进入到偏序集中。

\quad\quad定理 5.9\quad 在有限搜索空间中，一个具有 P V K PVK PVK 和最优个体选择策略的 M O E A MOEA MOEA，在进化过程中产生了一个群体序列 P k n o w n ( t ) P_{known}(t) Pknown(t)，至少有一个个体在有限时间内以概率 1 1 1 进入偏序集中。

\quad\quad定理 5. 10 （充分条件）\quad 如果一个 M O E A MOEA MOEA 的 V K VK VK 是正的，则在有限时间内以概率 1 1 1 使组成群体 P k n o w n P_{known} Pknown 的个体均为最小元素。

\quad\quad定理 5.11\quad 任何 M O P MOP MOP 的 P a r e t o Pareto Pareto 最优边界 P F t r u e PF_{true} PFtrue 最多由无穷个不可数的向量组成。

\quad\quad 在讨论 M O P MOP MOP 时， P F t r u e PF_{true} PFtrue 的界是一个有很意义的概念，定理 5.8 给出了其下界为 1 1 1，定理 5.12 将给出其上界。我们可以用 B o x Box Box 计数来定义最优边界的维数。

\quad\quad定义 5.34 （Box 计数维数）\quad 在空间 R k R^k Rk 中，一个有界集 S S S 的 B o x Box Box 计数维数定义为：

B o x d i m ( S ) = lim ⁡ ϵ → 0 l n N ( ϵ ) l n ( 1 / ϵ ) Boxdim(S) = \lim_{\epsilon \to 0} \frac {lnN(\epsilon)}{ln(1/\epsilon)} Boxdim(S)=ϵ→0limln(1/ϵ)lnN(ϵ)

式中， N ( ϵ ) N(\epsilon) N(ϵ) 为与 S S S 相交（intersect）的 Box 的数目，且极限存在。

\quad\quad定理 5.12\quad 给定一个 MOP 及其 Pareto 最优边界 P F t r u e ， PF_{true}， PFtrue，如果 P F t r u e PF_{true} PFtrue 是有界的，则它是一个 Box 计数维数不大于 q — 1 集合。

3.2 MOEA 的收敛性

\quad\quad 为了讨论 MOEA 的收敛性，先回顾一下单目标情况下 EA 的收敛性。设 x x x 为决策变量， I I I 为决策变量空间， F F F 为适应度函数， t t t 为进化代数。当满足条件：

\quad\quad ① ∀ x ， y ∈ I ， \forall x，y \in I， ∀x，y∈I， y y y 为 x x x 通过进化操作所得（即可达性）

\quad\quad ② 群体进化序列 P ( 0 ) , P ( 1 ) , … , P(0), P(1),…, P(0),P(1),…, 是单调的，即

∀ t ： m i n { F ( x ( t + 1 ) ∣ x ( t + 1 ) ∈ P ( t + 1 ) ) } ≤ m i n { F ( x ( t ) ∣ x ( t ) ∈ P ( t ) ) } \forall t：min\{F(x(t +1)|x(t + 1) \in P(t +1))\} ≤ min\{F(x(t)|x(t)\in P(t))\} ∀t：min{F(x(t+1)∣x(t+1)∈P(t+1))}≤min{F(x(t)∣x(t)∈P(t))}

\quad\quad Back 证明了 E A EA EA 将以概率 1 1 1 收敛

\quad\quad 在多目标情况下，以上两个条件都不合适。一方面，单目标优化时，可行解集是全序的，而多目标优化时可行解集是偏序的；另一方面，基于 Pareto 的适应度的计算不同于单目标函数的适应度，它在不同进化代可能具有不同的值；第三个方面，多目标优化的解个体是一个向量，而且最后的结果是一个解集。

\quad\quad MOEA 的收敛过程是通过 P F k n o w n PF_{known} PFknown 不断逼近 P F t r u e PF_{true} PFtrue 实现的，为了描述不同进化代之间的关系，下面给出有关定义

\quad\quad定义 5.35\quad 给定一个 MOP 以及其进化群体 P A PA PA 和 P B PB PB，定义 P A PA PA 和 P B PB PB 的关系为 P A ≥ P B PA ≥ PB PA≥PB，若满足条件 ∀ x ∈ P A ， ∄ y ∈ P B ， \forall x \in PA，\not \exists y \in PB， ∀x∈PA，∃y∈PB，使 y ≻ x y \succ x y≻x。 \quad( P i P_i Pi：表示第 i i i 代进化群体序列)

\quad\quad 定义 5.35 表明，若 P A ≥ P B PA ≥ PB PA≥PB，则在 P A PA PA 中不存任何受 P B PB PB 所支配的向量，但在 P B PB PB 中可能存在受 P A PA PA 所支配的向量。由此可知 P k n o w n ( t + 1 ) ≥ P k n o w n ( t ) P_{known}(t +1) ≥ P_{known}(t) Pknown(t+1)≥Pknown(t)，因为 P k n o w n ( t + 1 ) = N D ( P k n o w n ( t ) ∪ P c u r r e n t ( t + 1 ) ) = { x ∈ P k n o w n ( t ) ∪ P k n o w n ( t + 1 ) ∣ ∄ y ∈ P k n o w n ( t ) ∪ P c u r r e n t ( t + 1 ) ， P_{known}(t +1) = ND(P_{known}(t) \cup P_{current}(t +1)) = \{x \in P_{known}(t) \cup P_{known}(t + 1) | \not \exists y \in P_{known}(t) \cup P_{current}(t +1) ， Pknown(t+1)=ND(Pknown(t)∪Pcurrent(t+1))={x∈Pknown(t)∪Pknown(t+1)∣∃y∈Pknown(t)∪Pcurrent(t+1)，使 y ≻ x } y \succ x\} y≻x}

\quad\quad定理 5.13\quad 给定 MOP 和 MOEA，若满足条件：

\quad\quad ① Pareto 最优边界的 Box 计数维数不大于 r − 1 , r r-1, r r−1,r 为目标数。

\quad\quad ② P k n o w n ( 0 ) , P k n o w n ( 1 ) , . . . P_{known}(0),P_{known}(1),... Pknown(0),Pknown(1),... 是单调的，即

∀ t : P k n o w n ( t + 1 ) ≥ P k n o w n ( t ) \forall t : P_{known}(t + 1) ≥ P_{known}(t) ∀t:Pknown(t+1)≥Pknown(t)

即 MOEA 以概率 1 1 1 收敛，即

P r o b ( lim ⁡ t → ∞ { P t r u e = P ( t ) } ) = 1 P_{rob}(\lim_{t \to \infty}\{P_{true} = P(t)\}) = 1 Prob(t→∞lim{Ptrue=P(t)})=1

式中， P r o b ( ) 为概率， P_{rob}() 为概率， Prob()为概率， P ( t ) = P k n o w n ( t ) ， P t r u e P(t) = P_{known}(t)，P_{true} P(t)=Pknown(t)，Ptrue 为全局 Pareto 最优解集。

\quad\quad定理 5.14\quad 如果定理 5.9 成立，且在 P k n o w n ( t ) P_{known}(t) Pknown(t) 中的最小元是其父代个体的组合并产生子代个体，则进化群体将收敛到 Pareto 最优解集 P t r u e P_{true} Ptrue

\quad\quad Rudolph 的收敛理论中，除基于 VK 外（如定理 5.14），他还提出了基于相似随机矩阵的方法。

\quad\quad定义 5.36\quad G G G 是一个随机矩阵（stochastic matrix）, 它记录了从当前进化群体到下一代的转移概率，即从 P c u r r e n t ( t ) P_{current}(t) Pcurrent(t) 到 P c u r r e n t ( t + 1 ) P_{current}(t+1) Pcurrent(t+1) 的转移概率

\quad\quad定义 5.37 （收敛）\quad 如果当 t → ∞ t \to \infty t→∞ 时， P F t r u e PF_{true} PFtrue 与 P F k n o w n ( t ) PF_{known}(t) PFknown(t) 之间的距离以概率 1 1 1 趋向于 0 0 0，即

\quad\quad 当 t → ∞ t \to \infty t→∞ 时， ∣ P F t r u e ∪ P F k n o w n ( t ) ∣ − ∣ P F t r u e ∩ P F k n o w n ( t ) ∣ → 0 |PF_{true} \cup PF_{known}(t)| - |PF_{true} \cap PF_{known}(t)| \to 0 ∣PFtrue∪PFknown(t)∣−∣PFtrue∩PFknown(t)∣→0

或

\quad\quad 当 t → ∞ t \to \infty t→∞ 时， ∣ P F k n o w n ( t ) ∣ − ∣ P F t r u e ∪ P F k n o w n ( t ) ∣ → 0 |PF_{known}(t)| - |PF_{true} \cup PF_{known}(t)| \to 0 ∣PFknown(t)∣−∣PFtrue∪PFknown(t)∣→0

则称 MOEA 收敛。

\quad\quad定理 5.15\quad 设 G G G 是一个相似随机矩阵，它记录了从 P c u r r e n t ( t ) P_{current}(t) Pcurrent(t) 到 P c u r r e n t ( t + 1 ) P_{current}(t+1) Pcurrent(t+1) 的转移概率。对于给定的 MOEA，如果 G G G 是正定的，则 M O E A MOEA MOEA 收敛。

\quad\quad 如果将当前代的所有最小元都选入到下一代，则会使进化群体变得越来越大。在实际应中，往往只选取一部分有代表性的最小元进入下一代进化群体。

\quad\quad定理 5.16\quad 设 G G G 是一个相似随机矩阵，它记录了从 P c u r r e n t ( t ) P_{current}(t) Pcurrent(t) 到 P c u r r e n t ( t + 1 ) P_{current}(t+1) Pcurrent(t+1) 的转移概率。对于给定的 MOEA，每一代进化时从 P c u r r e n t ( t ) P_{current}(t) Pcurrent(t) 中选取一部分具有代表性的最小元进入 P c u r r e n t ( t + 1 ) P_{current}(t+1) Pcurrent(t+1)，如果 G G G 是正定的，则 MOEA 收敛

\quad\quad推论 5.2\quad F F F 是给定 M O P MOP MOP 的目标向量函数，针对定理 5.15 的情况（即上一代最小元无限制地进入下一代），则进化群体以概率 1 1 1 收敛到 Pareto 最优解集，同时进化群体的规模以概率 1 1 1 收敛到预定的最小值或 P t r u e P_{true} Ptrue 的势（即 ∣ P t r u e ∣ |P_{true}| ∣Ptrue∣）

\quad\quad推论 5.3\quad F F F 是给定 MOP 的目标向量函数，针对定理 5.16 的情况（即限定进化群体规模，每次只从上一代选取一定数量的，且有代表性的最小元进入下一代），则进化群体以概率 1 1 1 收敛到 Pareto 最优解集的子集。

\quad\quad 值得说明的是，根据定义 5.37、定理 5.15 和定理 5.16 所指的收敛是从目标向量方面考虑的，而推论 5.2 和推论 5.3 则是从决策向量方面考虑的

\quad\quad 本节讨论的收敛理论主要基于两个假设：一是搜索空间是可数的；二是 Pareto 最优解集的势是有限的。Hanne 基于锥（cone）理论，针对连续函数提出了 MOEA 收敛理论。

如果觉得《【多目标进化优化】多目标进化算法的收敛性》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。