Expand Cut Tags

No cut tags
mns2012: (Default)
[personal profile] mns2012

Функция, определенная в пространстве Ω строк символов фиксированного алфавита A, по необходимости является разреженной (sparse). Причём степень разреженности тем больше, чем выше сложность функции.

Прежде всего заметим, что функция определена в нашем случае на множестве дискретных переменных.

Функциональная сложность переменной (строки s ∈ Ω) измеряется количеством функциональной информации в строке:

If(s) = —log2(|Tf|/|Ω(A)|),

где:


  • Ω(A) -- пространство возможных строк символов алфавита А.

  • Tf -- целевое подпространство, включающее лишь строки, доставляющие функцию f.

  • |X| -- число элементов множества Х.

Почему функция, определённая в таком пространстве, по необходимости разрежена?

Проиллюстрируем это на простом примере, который мы позаимствуем из замечательной лекции Стивена Майера.

Велосипедный замок позволяет установить кодовую комбинацию цифр, которая его открывает.
велосипедный замок.png
Итак, функция кодовой комбинации цифр -- открывать замок. В данном случае:


  • А = {0,1,...,9}, |A| = 10.

  • |Ω| = 104.

  • |Tf| = 1.

  • If = 4 log210 ≈ 13.3 бит.

А теперь представим, что мы увеличили длину L строк на 1 символ, не меняя алфавита. То есть мы купили новый замок, длина кодовой комбинации которого не 4, а 5 цифр. Теперь у нас такая картина:


  • |Ω| = 105.

  • |Tf| = 1 (число функциональных комбинаций не изменилось).

  • If = 5 log210 ≈ 16.6 бит (количество функциональной информации возросло).

Число функциональных комбинаций осталось тем же самым, а размер пространства увеличился в |A| = 10 раз.

В случае сложных функций размер |Tf| целевого подпространства (то есть фактически число синонимов функциональной строки s) с ростом длины строки L растёт медленнее, чем взрывается размер |Ω| пространства возможных строк:

O(|Tf(L)|) < O(|Ω(L)|).

Попросту говоря, с увеличением длины строки экспоненциально растет число нефункциональных строк. Почему, собственно, в распознавании дизайна и интересны сложные функции.

Кстати, Douglas Axe во время оно показал, что для белкового домена средних размеров (если не ошибаюсь, ~150 АА) отдельно взятого белкового семейства (beta-lactamase), редкость функциональных строк оценивается отношением 1 функциональная строка на каждые 1077. Причём максимальное число организмов, когда-либо живших за всю историю биосферы, в предположениях, благоприятных для эволюционной парадигмы, Майер оценивает как 1040 ≈ 2133 (более оптимистичная для эволюции оценка GPuccio в 2140 организмов отличается в 27=128 раз). Если использовать оценку Майера, то получается, что доля состояний, которые теоретически могли быть просмотрены эволюцией, за всю её славную и неповторимую историю, в процессе поиска функциональной аминокислотной строки для фермента beta-lactamase, составляет 1040/1077 = 10-37. Для осознания масштаба стоящих перед эволюцией задач надо иметь в виду, что размер протеома одноклеточной E.Coli оценивается в 1620-2260 различных типов белков. Как-то многовато для незатейливой схемы RV+NS...

Date: 2024-09-20 03:28 pm (UTC)
From: [identity profile] staerum.livejournal.com

Это скорее опровержение мысли, что случайность надо понимать как равномерную. Если пространство структуры реальности неравномерно (а оно очевидно неравномерно), то брать всё пространство возможных строк для таких оценок не вполне корректно. Если взять клавиатуру, руки человека, привычки человека, то генерируемые им "случайные последовательности" будут иметь вполне заметные особенности и даже близко не покроют всё пространство возможных последовательностей равномерными примерами.

Date: 2024-09-20 04:54 pm (UTC)
From: [identity profile] staerum.livejournal.com

Контр-пример. rand()


Тут надо как-то обозначит границы этого утверждения. В общем случае это не так.

Date: 2024-09-20 06:16 pm (UTC)
From: [identity profile] staerum.livejournal.com

Скажите операторам дронов противника )


Случайность и целесообразность вещи ортогональные. Случайность это функция и ей есть место в реальности.


Случайность это кроме прочего ещё и метод, я думаю вы прекрасно знаете метод стохастической оптимизации Монте-Карло. Проблема, что для использования функции нужна цель, а вот целевая функция из метода никак не следует.

Edited Date: 2024-09-20 06:28 pm (UTC)

Date: 2024-09-20 06:47 pm (UTC)
From: [identity profile] staerum.livejournal.com

Оптимизируемая функция не случайна, конечно. Случайность тут метод.


Но в реальности никто не говорит, что случайна оптимизируемая функция. Нет такой теории. Говорят о случайности как методе.

Date: 2024-09-20 06:48 pm (UTC)
From: [identity profile] staerum.livejournal.com

Это вас с праздником! У нас ещё не наступил )

Date: 2024-09-20 06:55 pm (UTC)
From: [identity profile] staerum.livejournal.com

Да, с этим я не спорю.

Date: 2024-09-21 03:30 pm (UTC)

Date: 2024-09-21 04:08 pm (UTC)
From: [identity profile] staerum.livejournal.com

Точно, с вечерни же. Упускаю специфику.

Profile

mns2012: (Default)
mns2012

January 2026

S M T W T F S
    1 23
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Page generated Jan. 15th, 2026 02:30 pm
Powered by Dreamwidth Studios