Теорема Холланда о схемах

Теорема схем Холланда, также называемая фундаментальной теоремой генетических алгоритмов, - это неравенство, которое возникает в результате грубого разложения уравнения эволюционной динамики. Теорема схем гласит, что короткие схемы низкого порядка, обладающие пригодностью выше среднего, экспоненциально увеличиваются в частоте в последующих поколениях. Теорема была предложена Джоном Холландом в 1970-х годах. Первоначально она была широко принята за основу для объяснения возможностей генетических алгоритмов. Однако такая интерпретация ее следствий была подвергнута критике в нескольких публикациях, обзор которых приведен в , где теорема схем показана как частный случай уравнения Прайса с индикаторной функцией схемы в качестве макроскопического измерения.

Схема - это шаблон, определяющий подмножество строк, имеющих сходство в определенных позициях строк. Схемы являются частным случаем цилиндрических множеств и, следовательно, образуют топологическое пространство.

Описание

Рассмотрим двоичные строки длины 6. Схема 1*10*1 описывает множество всех строк длины 6 с 1 в позициях 1, 3 и 6 и 0 в позиции 4. Символ * - это символ подстановки, который означает, что позиции 2 и 5 могут иметь значение 1 или 0. Порядок схемы o ( H ) {\displaystyle o(H)} $o(H)$ определяется как количество фиксированных позиций в шаблоне, а определяющая длина δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ - это расстояние между первой и последней конкретными позициями. Порядок 1*10*1 равен 4, а его определяющая длина - 5. Пригодность схемы - это средняя пригодность всех строк, соответствующих схеме. Пригодность строки - это мера ценности закодированного решения задачи, вычисляемая специфической для задачи оценочной функцией. Используя установленные методы и генетические операторы генетических алгоритмов, теорема о схемах утверждает, что короткие схемы низкого порядка с более высокой средней пригодностью экспоненциально увеличиваются в последующих поколениях. Выражается в виде уравнения:

E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p] } $\operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p].$

Здесь m ( H , t ) {\displaystyle m(H,t)} $m(H,t)$ - число строк, принадлежащих схеме H {\displaystyle H} $H$ в поколении t {\displaystyle t} $t$ , f ( H ) {\displaystyle f(H)} $f(H)$ - наблюдаемая средняя пригодность схемы H {\displaystyle H} $H$ и a t {\displaystyle a_{t}} $a_{t}$ - наблюдаемая средняя пригодность в поколении t {\displaystyle t} $t$ . Вероятность нарушения p {\displaystyle p} $p$ - это вероятность того, что кроссинговер или мутация разрушат схему H {\displaystyle H} $H$ . Она может быть выражена как:

p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}} $p={\delta (H) \over l-1}p_{c}+o(H)p_{m}$

где o ( H ) {\displaystyle o(H)} $o(H)$ - порядок схемы, l {\displaystyle l} $l$ - длина кода, p m {\displaystyle p_{m}} $p_{m}$ - вероятность мутации и p c {\displaystyle p_{c}} $p_{c}$ - вероятность кроссинговера. Таким образом, схема с меньшей определяющей длиной δ ( H ) {\displaystyle \delta (H)} $\delta (H)$ имеет меньшую вероятность быть нарушенной.
Часто не понимают, почему теорема о схеме является неравенством, а не равенством. На самом деле ответ прост: Теорема пренебрегает небольшой, но ненулевой вероятностью того, что строка, принадлежащая схеме H {\displaystyle H} $H$ , будет создана "с нуля" путем мутации одной строки (или рекомбинации двух строк), которая не принадлежала H {\displaystyle H} $H$ в предыдущем поколении.

Ограничение

Теорема о схемах выполняется в предположении генетического алгоритма, который поддерживает бесконечно большую популяцию, но не всегда переносится на (конечную) практику: из-за ошибки выборки в начальной популяции генетические алгоритмы могут сходиться к схемам, которые не имеют селективного преимущества. Это происходит, в частности, при мультимодальной оптимизации, когда функция может иметь несколько пиков: популяция может дрейфовать, предпочитая один из пиков, игнорируя другие.

Причина, по которой теорема схем не может объяснить силу генетических алгоритмов, заключается в том, что она применима ко всем экземплярам задач и не позволяет провести различие между задачами, в которых генетические алгоритмы работают плохо, и задачами, в которых генетические алгоритмы работают хорошо.

График мультимодальной функции в двух переменных.

Вопросы и ответы

В: Что такое теорема Холланда о схемах?

О: Теорема схем Холланда - это теорема, касающаяся генетических алгоритмов, которая гласит, что особи с приспособленностью выше средней имеют больше шансов на победу.

В: Кто и когда предложил теорему Холланда о схемах?

О: Джон Холланд предложил теорему схем Холланда в 1970-х годах.

В: Что такое схема в контексте генетических алгоритмов?

О: В контексте генетических алгоритмов схема - это шаблон, который идентифицирует подмножество строк, имеющих сходство в определенных позициях строк.

В: Какова интерпретация теоремы Холланда о схемах, которая была использована в качестве основы для объяснения силы генетических алгоритмов?

О: Интерпретация теоремы схем Холланда, которая была использована в качестве основы для объяснения силы генетических алгоритмов, заключается в том, что особи с приспособленностью выше средней имеют больше шансов на победу.

В: Что показала критика теоремы схем Холланда?

О: Критика теоремы схем Холланда показала, что она является частным случаем уравнения Прайса с индикаторной функцией схемы в качестве макроскопического измерения.

В: Что является частным случаем цилиндрических множеств?

О: Схемы являются частным случаем цилиндрических множеств.

В: Какой вид пространства образуют схемы?

О: Схемы образуют топологическое пространство.