Метаболизм и рост веб-форумов. Поток внимания.

Копаясь в каталоге arxiv.org набрел на занятную статью китайских товарищей: The Metabolism and Growth of Web Forums. В ней они сравнивают форумы в интернете с живыми организмами. Только если организмы поглощают, перерабатывают, накапливают и выделяют энергию, то “пищей” для форумов является человеческое внимание. В статье есть и математическая теория и экспериментальные графики, полученные в результате анализа логов нескольких популярных форумов. Авторы работы связаны с китайским поисковиком baidu. Наверняка, эти исследования также важны для властей Китая, которые, как известно, стремятся сильно контролировать интернет пространство. Работу интересно читать просто из-за того, что некоторые привычные для вебмастера вещи рассматриваются под другим углом.

Важными характеристиками для форума является число посетителей за единицу времени (в сутки) UV(t) и число просмотренных страниц за единицу времени PV(t). Очевидно, что по мере роста популярности форума эти две величины также должны расти со временем t (t – это число дней). Среднее число просмотров страниц на посетителя L(t)=PV(t)/UV(t) при этом также зависит от времени. Однако, авторы утверждают, что степень “залипательности” форума (stickness) может выражаться с помощью не зависящей от времени величины \theta. При чем, считается, что справедливо следующее важное соотношение:

    \[PV(t) = A\cdot UV(t)^\theta\]

где величины A и \theta – константы и не зависят от времени. Эта формула напоминает т.н. закон Клайбера, связывающий скорость основного обмена (у нас это UV) и массу организма животного (у нас это PV). Для разных форумов эти константы разные, в то время, как для разных живых организмов в законе Клайбера \theta=4/3. Можно выразить интересующую нас величину \theta через экспериментально измеряемые величины PV(t) и UV(t):

    \[\theta = \dfrac{d\ln PV(t)}{d\ln UV(t)}\]

Заметьте, слева стоит величина, независящая от времени, а справа стоит выражение, которое содержит зависимость от времени. То есть, величину \theta можно определить по углу наклона прямой PV(t) как функции от UV(t) построенной в двойных логарифмических координатах. Что и было проделано авторами, которые исследовали поведение трех разных форумов в течении двух месяцев. Вот так выглядят экспериментальные графики.



Анализ роста трех форумов за 1440 часов (два месяца). Величина \theta равна 1.15(синие точки), 1.21 (зеленые точки), 1.29 (коричневые точки).

Также построено распределение величины \theta среди почти что 30000 форумов. Среднее значение: 1.06.


Статистическое распределение величины \theta.

Авторы анализируют “поток внимания” (flow of attention) и его свойства. Ниже представлен наглядный пример того, как пять посетителей (a,b,c,d,e) могут просматривать шесть тем форума (0,1,2,3,4,5):


Один из примеров реализации потока внимания. Числа рядом со стрелками показывают число таких одинаковых стрелок, если их больше одной.

Что это значит? Source – внешний источник посетителей, Sink – это условный внешний “сток”, куда уходят посетители. Например, посетитель c пришел на форум извне в тему номер 2, затем он перешел в тему номер 3, а затем закрыл форум или перешел по ссылке на другой, внешний ресурс. С такими обозначениями у нас имеется закон сохранения потока внимания как для всей сети в целом (число стрелочек из источника равно числу стрелочек в сток) так и для каждого узла (число стрелочек входящих в узел [тему] равно числу исходящих стрелочек). Обратите внимание, в каждый узел можно прийти как из другого узла, так и напрямую из источника. И уйти из узла можно как в другой узел, так и в сток. Обозначим T_i – это общее число входов в данный узел i, а D_i – это число выходов в “сток” из данного узла. То есть, величина D_i описывает диссипацию потока внимания. Утверждается, что между этими двумя величинами существует связь следующего вида:

    \[D_i = B\cdot T_i^\gamma\]

где B и \gamma константы, характеризующие конкретный форум. Среднее значение величины \gamma составляет около 0.93 для выборки из 6877 форумов за один день наблюдений.

Авторы утверждают и на простых примерах показывают, что между величинами \theta и \gamma существует слабо выраженная отрицательная корреляция.



Слабая, еле заметная отрицательная корреляция между \theta и \gamma.

Одним из главных результатов работы авторы называют методологию определения “залипательности” форумов.

Саму статью можно скачать отсюда.

PS. Я не совсем уверен в правильности перевода термина “attention flow”, т.к. русский google по запросу в кавычках “поток внимания” выдает в основном какие-то мутные сайты про саморазвитие, чакры, йогу, а по запросу на английском “attention flow” выпадают и книжки по психологии. Вариант с “движение внимания” тоже в русскоязычном гугле ограничивается одной статьей на хабре. Возможно, я плохо искал. Возможно, эта тема просто не интересна русскоговорящим психологам/социологам.

Поделиться:      twitter       facebook