Абсолютно черное тело

thoughtful emoticon

Я люблю проблемы Ферми вообще. Впрочем, об этом я говорил и раньше — я люблю получать информацию вообще из ничего. Эта информация не точна. Эта информация имеет не так много общего с реальностью. И в то же время, этой информации обычно достаточно для того, чтобы сформулировать стратегию по получению дальнейших данных, или по крайней мере представить себе масштаб проблемы. Это просто задача на прикидку масштаба, не более и не менее. Знать масштаб нередко достаточно для принятия решения.

Классическим случаем проблемы Ферми является уравнение Дрейка. Это оценка числа внеземных цивилизаций, с которыми мы теоретически можем пытаться установить контакт.

Парадокс уравнения Дрейка в том, что подставив в него разумные на первый взгляд значения, мы получаем N, то есть число таких цивилизаций, много большее чем единица,1 однако, достоверного контакта ни с кем не установлено — это называется парадокс Ферми. Фишка в том, что если во всех случаях брать самое пессимистическое значение которое можно подставить, максимальное значение N будет равно 0.08, что является полной чушью, поскольку человечество тоже входит в это число, и меньше единицы N быть не может по определению.

Существует много вариантов объяснения этого парадокса, которые делятся на два основных вида. Первые говорят что N=1, и ниибет. Вторые говорят что чему бы ни было равно N, либо есть какая-то причина по которой они из принципа с нами разговаривать не будут, либо мы ищем как-то не так.

Ситуация эта однако повторяется на всех уровнях, ибо там черепахи до самого низа. В пределах одной социальной системы, и даже одного Интернета, доступного нам в байтиках, велико количество элементов, ведущих себя как абсолютно черные тела, то есть не излучающих ничего, или излучающих недостаточно ярко, чтобы их можно было обнаружить, или излучающих вне спектра, который нам по факту доступен. По разным оценкам, до 80% всей информации которая в интернете существует, из штатных поисковиков недоступна в принципе, потому что не может быть проиндексирована по разным причинам — это называется deep web.

Теперь внимание, программная телега.

Уже не раз отмечалось, что в социальной системе построенной на связях и с поисковыми системами типа PageRank в которых вероятность нахождения страницы поисковиком зависит от количества ссылок на нее, прохождение любой информации может быть слабым совершенно непропорционально ее реальной социальной важности, если она не попала на глаза альфа-блоггерам, «тысячникам» и прочему подобному контингенту. Я даже накатал про это довольно вялую статью которую непременно пихну куда-нибудь, ибо надо набивать публикации, которые все равно не читает никто.

Каким образом два члена социальной сети, вообще имеющие мало связей по тем или иным причинам, могут найти друг друга?

Это очень похоже на последнюю задачу из замечательной книжки П.В. Маковецкого «Смотри в корень», которая была посвящена решению многих житейски неочевидных и противоречащих здравому смыслу задач:

Начните с задачи попроще. Двое подружились (в туристическом походе, например) и договорились 1 сентября в 15:00 встретиться в Ленинграде. Но забыли назвать точное место встречи. И никакой информации друг о друге, которая могла бы помочь уточнить место свидания, у них нет. Они только знают, что оба будут стараться встретиться. Куда они пойдут в назначенный час?

В случае интернета задача с одной стороны сложнее, потому что о времени речи не идет, и о предварительной договоренности тоже, а с другой стороны проще, потому что паучков и прочих роботов никто не отменял, и возможность оставлять друг другу сообщения — тоже.

Это не значит что у меня есть решения, но то, что основой решения должен быть поиск в обход рейтинговых алгоритмов и даже самих ссылок как таковых — очевидно.


  1. У самого Дрейка получилось 10. ↩︎