Копаясь в каталоге arxiv.org набрел на занятную статью китайских товарищей: The Metabolism and Growth of Web Forums. В ней они сравнивают форумы в интернете с живыми организмами. Только если организмы поглощают, перерабатывают, накапливают и выделяют энергию, то “пищей” для форумов является человеческое внимание. В статье есть и математическая теория и экспериментальные графики, полученные в результате анализа логов нескольких популярных форумов. Авторы работы связаны с китайским поисковиком baidu. Наверняка, эти исследования также важны для властей Китая, которые, как известно, стремятся сильно контролировать интернет пространство. Работу интересно читать просто из-за того, что некоторые привычные для вебмастера вещи рассматриваются под другим углом.
Важными характеристиками для форума является число посетителей за единицу времени (в сутки) и число просмотренных страниц за единицу времени
. Очевидно, что по мере роста популярности форума эти две величины также должны расти со временем
(
– это число дней). Среднее число просмотров страниц на посетителя
при этом также зависит от времени. Однако, авторы утверждают, что степень “залипательности” форума (stickness) может выражаться с помощью не зависящей от времени величины
. При чем, считается, что справедливо следующее важное соотношение:
где величины и
– константы и не зависят от времени. Эта формула напоминает т.н. закон Клайбера, связывающий скорость основного обмена (у нас это
) и массу организма животного (у нас это
). Для разных форумов эти константы разные, в то время, как для разных живых организмов в законе Клайбера
. Можно выразить интересующую нас величину
через экспериментально измеряемые величины
и
:
Заметьте, слева стоит величина, независящая от времени, а справа стоит выражение, которое содержит зависимость от времени. То есть, величину можно определить по углу наклона прямой
как функции от
построенной в двойных логарифмических координатах. Что и было проделано авторами, которые исследовали поведение трех разных форумов в течении двух месяцев. Вот так выглядят экспериментальные графики.
![](https://rotozeev.net/media/pv_plot_forums.png)
Анализ роста трех форумов за 1440 часов (два месяца). Величина
![Rendered by QuickLaTeX.com \theta](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-0a67b7f5d4afc33e4eb3d1f3094740cd_l3.png)
Также построено распределение величины
![Rendered by QuickLaTeX.com \theta](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-0a67b7f5d4afc33e4eb3d1f3094740cd_l3.png)
![](https://rotozeev.net/media/theta_stat_forums.png)
Статистическое распределение величины
![Rendered by QuickLaTeX.com \theta](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-0a67b7f5d4afc33e4eb3d1f3094740cd_l3.png)
Авторы анализируют “поток внимания” (flow of attention) и его свойства. Ниже представлен наглядный пример того, как пять посетителей (a,b,c,d,e) могут просматривать шесть тем форума (0,1,2,3,4,5):
![](https://rotozeev.net/media/flow_attention_1.png)
Один из примеров реализации потока внимания. Числа рядом со стрелками показывают число таких одинаковых стрелок, если их больше одной.
Что это значит? Source – внешний источник посетителей, Sink – это условный внешний “сток”, куда уходят посетители. Например, посетитель c пришел на форум извне в тему номер 2, затем он перешел в тему номер 3, а затем закрыл форум или перешел по ссылке на другой, внешний ресурс. С такими обозначениями у нас имеется закон сохранения потока внимания как для всей сети в целом (число стрелочек из источника равно числу стрелочек в сток) так и для каждого узла (число стрелочек входящих в узел [тему] равно числу исходящих стрелочек). Обратите внимание, в каждый узел можно прийти как из другого узла, так и напрямую из источника. И уйти из узла можно как в другой узел, так и в сток. Обозначим
![Rendered by QuickLaTeX.com T_i](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-82a65b374dc20c245c0c6da9cff83add_l3.png)
![Rendered by QuickLaTeX.com i](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-dd4b4fe68c08331eadb196be13122f73_l3.png)
![Rendered by QuickLaTeX.com D_i](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-de010327e8bb7efc30f89cdd116f0572_l3.png)
![Rendered by QuickLaTeX.com D_i](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-de010327e8bb7efc30f89cdd116f0572_l3.png)
где и
константы, характеризующие конкретный форум. Среднее значение величины
составляет около 0.93 для выборки из 6877 форумов за один день наблюдений.
Авторы утверждают и на простых примерах показывают, что между величинами и
существует слабо выраженная отрицательная корреляция.
![](https://rotozeev.net/media/gamma_theta.png)
Слабая, еле заметная отрицательная корреляция между
![Rendered by QuickLaTeX.com \theta](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-0a67b7f5d4afc33e4eb3d1f3094740cd_l3.png)
![Rendered by QuickLaTeX.com \gamma](https://rotozeev.net/wp-content/ql-cache/quicklatex.com-72c153095cf53898e5880489d3c37171_l3.png)
Одним из главных результатов работы авторы называют методологию определения “залипательности” форумов.
Саму статью можно скачать отсюда.
PS. Я не совсем уверен в правильности перевода термина “attention flow”, т.к. русский google по запросу в кавычках “поток внимания” выдает в основном какие-то мутные сайты про саморазвитие, чакры, йогу, а по запросу на английском “attention flow” выпадают и книжки по психологии. Вариант с “движение внимания” тоже в русскоязычном гугле ограничивается одной статьей на хабре. Возможно, я плохо искал. Возможно, эта тема просто не интересна русскоговорящим психологам/социологам.
Поделиться: twitter facebook