Сделал сегодня две разных версии для рейтинга записей, с разными алгоритмами.

Первый скачивает все записи топовых петербургских блоггеров (топовых — по информации Яндекс.Поиска по блогам, петербургских — по результатам разбора профиля юзеринфо) за пять дней и подсчитывает там ссылки на другие блоги.

К сожалению, ни одна запись не набрала таким способом более трёх ссылок. Но наши чемпионы с тремя ссылками, вот они:

1) Снова печальное... (про икону из Русского музея)
2) Губернатор Белых про «Школьный конкурс о роли личности Сталина»
3) старый пост про Ирека Муртазина, которого вчера суд отправил в колонию за то, что он «преследуя цель возбуждения ненависти и вражды по признакам принадлежности к определенной социальной группе … разделил общество на противодействующие категории, а именно население и власть республики Татарстан»

Обнаружил, кстати, что в моих алгоритмах сбой — проваливается на юзерах, юзернейм которых оканчивается на «_», но при этом не начинается с этого символа. Думаю, возиться с поправками или же проигнорировать этих странных людей?

Дальше я воспользовался API статистики записей Яндекс.Поиска по блогам. Яндекс не имеет отношения к моей методе. Я собрал через него все попавшиеся записи за последние три дня, выбрал из них те, на которые было больше 4 ссылок, а из них — тех, кто были из Петербурга (увы, коммьюнитями временно пришлось пожертвовать). И вот что получилось (без сортировки, смысл показателей см. http://blogs.yandex.ru/faq/entriesapi):

  • Русский Север / The Russian North
    ком-ов:14 ком-ов24:6 комм-ев:27 комм-ев24:12 ссылок:5 ссылок24:5 ссылок24в:4.002 ссылокв:4.002

  • Доносное.
    ком-ов: ком-ов24: комм-ев: комм-ев24: ссылок:15 ссылок24:15 ссылок24в:15 ссылокв:15

  • Ленинградский метрополитен. 1968
    ком-ов:11 ком-ов24:10 комм-ев:14 комм-ев24:14 ссылок:9 ссылок24:9 ссылок24в:9 ссылокв:9

  • Божена Львовна
    ком-ов:49 ком-ов24:6 комм-ев:84 комм-ев24:9 ссылок:6 ссылок24: ссылок24в: ссылокв:4.004

  • Отвечаю на все вопросы
    ком-ов:17 ком-ов24:11 комм-ев:120 комм-ев24:33 ссылок:7 ссылок24:3 ссылок24в:1.004 ссылокв:2.01

    Вот такие вот дела пока что.

    Комментариев нет
  • Что-то меня сегодня с утра вздёрнуло и сказало: а сделай-ка, Волохонский, новый топ петербургских ЖЖ... Итак, получайте. Топ петербургских блогов по данным Яндекса. (Петербургский или нет — определялось по наличию в профиле соответствующего местоположения или по прямому мне указанию).

    Итак, за 20 дней топ покинули: starij_abramych, emelian1917, sempre_idem, polittechno, interviwer, otkrovenye, pvn123 (и ещё кто-то). Думаю, некоторых мы ещё увидим снова в топ-100.

    А теперь посмотрим на существенные приросты-падения рейтинга.Во-первых, сразу видно, что Яндекс что-то подкрутил в своих алгоритмах Подробнее...

    Комментариев нет

    Рейтинг основан на показателе «авторитетность» Поиска по блогам Яндекса.

    Во-первых, из топа выбыли такие люди, как rromanov, stariy_pioneer, sinitzat, santehnik_dush, tobico.

    Во-вторых, продолжается тенденция роста рейтинга «антибашенных» блогов. Существенный рост показали vveshka, ecoist, matholimp, bashne_net, aneta_spb.

    Ворвался в топ100 Абрамыч со своей печальной историей об уголовном деле и сотрясении мозга. Кроме него с высокой позиции стартанул блог tebedam, что стало результатом его второго письма президенту. Благодаря похоронам Япончика вернулся в топ100 ssmirnoff.

    Вырос рейтинг и у asena. Чёрный юмор ЖЖ рейтингов — чтобы у тебя повысился рейтинг, надо, чтобы закрыли твою телепрограмму.

    Тенденция общего роста рейтингов петербургских блогов тоже продолжилась. Нельзя не отметить совершенно дикий рост числа зафрендивших у некоторых юзеров. Например, фрицморген прирос больше, чем на 2000 новых френдов за три недели, хотя с июня по октябрь — всего на тыщу. Предполагаю, что это связано с каким-то исправленным глюком Яндекса, который что-то там недооценивал летом. Потому как у меня показано плюс 92, хотя реальный прирост только где-то около 30. Дальше — собственно таблица. Подробнее...

    Один комментарий

    Топ 100 петербургских ЖЖ за октябрь

    Комментариев нет

    Если хотите, чтобы я что-то заметил, ставьте ссылку на мой блог, их я ещё как-то отслеживаю через RSS Яндекс-поиска... В следующий раз время почитать френдленту у меня появится, кажется, в воскресенье... Сегодня наконец-то отписался про встречу с ректором, перепостил про петербургский марш кругом у Юбилейного, написал про университетский приказ, а теперь мне надо уже наконец-то писать текст для завтрашней записи видео... И искать фоновую картинку. Я думаю, что вообще надо сначала искать фоновую картинку, а потом под неё придумывать текст. Хочу на этот раз найти что-то хорошее с деревянными солдатами Урфина Джюса... Я буду про факультетские учёные советы говорить! :-)

    Вот это вот на фоновую картинку не годится, но очень хорошо для пояснения того, как должно выглядеть правильное учебное заведение, выполняющее поставленные перед ним современной Россией задачи:


    Фамилии сами подпишите... :-)

    Завтра я с утра сплю, потом еду навестить пожилую родственницу, оттуда на факультет — у меня четвёртая пара, потом заседание кафедры (у меня, кажется, появился ещё один магистрант де-факто), оттуда бегу на студию, часиков в девять буду дома. В принципе, можно френдленту и завтра вечером почитать. Френды! Я по вам соскучился! Вы хоть комментируйте, что ли...

    Один комментарий

    Ну вот, как и предполагалось, на сцену вышел очередной капитошка — http://kostyaorlov.livejournal.com/181185.html с письмом президенту о якобы «выросшем в разы» объёме взяток в СПбГУ. Пост выведен в топ яндекса той же бригадой, что и в прошлый раз.

    Кстати... Поскольку вот этот товарищ, по имени Павел Желтов, комиссар движения «Наши», специалист по мониторингу и вирусному маркетингу, активно участвует в раскрутке этой истории (и в казусе капитошки, кажется, отметился), то полагаю, заинтересованные в подобной работе товарищи, могут с ним связаться... Забавно, начинали атаку на Кропачева оппозиционеры из ОГФ, а теперь лямку тянут их конкуренты из путинюгенда...

    Кстати, на примере раскрутки данного поста можно практически досконально разобрать технологию выведения поста в топ яндекса, кого она интересует.

    Комментариев нет

    Этот фрагмент юмористического шоу сильно напомнил мне статью Тани Сафоновой в нашем сборнике статей про блоги...

    Комментариев нет

    Как известно, если информационной войной занимается профессионал, ты никогда не сможешь наверняка понять, что против тебя начали информационную войну. Поэтому сегодняшние события — выход в топ Яндекса вот этого поста про взятки на юрфаке и в тот же день публикация сего шедевра на ньюсрукоме (который по большей части является копипастом с аналогичного творения «Нового региона») может быть и стечением обстоятельств — у журналиста всё никак не доходили руки до написания статьи, а тут вот вдруг дошли, да ещё кстати и пост про взятки подвернулся.

    Кстати, пост был профессионально выведен в топ яндекса. Например, сравните содержание этих блогов: раз, два, три, четыре, пять. Там в начале можно много куда заглянуть в списке постов со ссылкой на «взяточный» топ. Ссылающиеся блоги (часть из них) объединяет активное участие в акциях «френдинга» и в размещении коммерческой рекламы. Вот такие вот дела. Не знаешь даже в итоге, верить написанному в посте, или на самом деле на юридическом факультете ничего такого не происходит. И студента этого никогда не существовало, а декан юрфака — белошвейка... Поневоле станешь параноиком со всей этой историей. Впрочем, с чего бы это вдруг кому-то начинать достаточно профессионально работать против Кропачева? До этого вся работа велась откровенно топорно...

    UPD: Места для сомнений больше не остаётся: внимательный nikolaswheatten засёк: автор с радостью весной писал о том, как он съездил на первомай в Питер и о том, что хотел бы съездить туда ещё разок — на отдых...
    UPD2: А вот в этом посте (кстати, реклама какой-то фашистской акции путинюгенда) этот Капитошка говорит «Мы, студенты МГУ Леса»...

    Комментариев нет

    В понедельник проведу специальный эксперимент для проверки одной гипотезы. Прошу особо не пугаться — я за день напишу больше десятка небольших постов, посвящённых некоторым «новостям дня» — хочу проверить одну бизнес-идею — узнать, что будет с посещаемостью блога, если написать посты про такие увлекательные вещи, как прошедший сегодня День Российского флага (его чуть не порвали в Москве ОМОНовцы), мультик «Миссия Дарвина», который я хочу посмотреть и фильм «Бесславные ублюдки», про который не уверен и «Бросок кобры», который наверное, и вовсе не посмотрю; про то, что некто Ярослав Рыбаков стал чемпионом мира по прыжкам в высоту; про отстранение Екатерины Андреевой от эфира и выборы президентские в Афганистане, про письмо учителей президенту и министерству образования и науки, про требование какого-то редиски Михаила Ковалева запретить мат в ЖЖ.

    Ну или про что там в понедельник будет модно писать в своих уютненьких жежешечках. Не пугайтесь — это всего лишь эксперимент, на один день. Думаю, не сделать ли отдельный такой блог...

    Комментариев нет

    Во-первых, у меня, как я недавно писал, развилась острая нелюбовь к выведению в топ чего бы то ни было. А раз это уже написало полфрендленты, то оно будет в топе и без моих усилий. Во-вторых, потому что я сразу не поверил в то, что там может быть слышно какие бы то ни было стуки. Я не специалист, может быть я ошибаюсь. Но в машинном зале ГЭС не очень хорошо слышно человека, который довольно громко говорит в пяти метрах от тебя. Зато уж чего, а всяческих стуков там хоть отбавляй. Собственно, любой, кто посмотрит видео из машинного зала, это поймёт. Там вообще-то рядом один из самых мощных водопадов в мире.

    Выводить в топ ничего не буду. Читаем топ яндекса, оно уже всё там, как посты хороших людей, так и тошнотных слизней из путинюгенда. А, там нет поста matholimp, которого я недавно упоминал как причину моего интереса к гидрогеологии Вуоксы. Вот, почитайте: http://matholimp.livejournal.com/116490.html.

    UPD: Был не прав про услышать. Нашёл во вконтакте запись водолаза:

    Комментариев нет

    Что-то у меня как-то нет особых сил это комментировать. Лучше какой-нибудь ещё интересный результат посчитаю...
    Подробнее...

    Комментариев нет

    Новое сообщество движения «Солидарность» взамен захваченного — . Заявление члена федерального политсовета движения «Солидарность» Романа Доброхотова по данному вопросу: http://dobrokhotov.livejournal.com/357442.html

    Один комментарий

    Итак, на дворе май месяц, а наконец-то подготовил свежий выпуск топ-100 наших петербургских жежешечек (топ основан на рейтинге авторитетности Яндекса). Внимая свежим тенденциям, я его раскрасил, как и обещал в прошлый раз.

    Что у нас нового? В первой пятёрке по прежнему никаких особых изменений, хотя нельзя не отметить драматическое падение «авторитетности» у stanislav_mikov. В остальном списке хорошо заметен рост оной авторитетности у malka_lorenz, за последнюю неделю дважды прорывавшейся в топ записей Яндекса с «женскими» размышлениями.

    Вошли в сотню vet_life, vbb2007, 0rchid_thief, yury_lifshits, rromanov (с которым мы вчера неожиданно познакомились), isl, everlasting_cat, stariy_pioneer, ment52, kouprianov (которому большое спасибо за одолженный модем!).

    Покинули рейтинг pudgik, karleev, gans_spb, zenturion, youstas, dmitry_maximov, matholimp, morita, kassandra_138, tr00per.

    Дальше — собственно таблица, с указанием приростов и падений. Зелёненькое — к лучшему, красненькое — к худшему.

    Подробнее...

    Один комментарий

    Увы, я неудачно нажал на кнопку «TRUNCATE TABLE», так что мартовские данные вылетели в трубу и разницу в итоге считал без использования умных алгоритмов.
    Напоминаю, что рейтинг основан на рейтинге Яндекса, который в свою очередь основан на индексе цитирования в других блогах.

    Основные итоги прошедшего месяца:

    Первая четвёрка осталась без изменений, однако можно заметить, что fima_psuchopadt начал терять позиции, а к нему уже подбирается знатный скриптописатель stanislav_mikov. Резкий прирост показателей заметен также у ворвавшейся в десятку alphyna и подвинувшего пару конкурентов dar_jan. Самый бурный рост числа френдов — у petrosphotos, увеличившего свою аудиторию на 20%. Кстати, рекомендую.

    Самое драматичное падение в рейтинге — у kulhazker, сброшенного с 27 на 46 позицию.

    Вылетели из первой сотни leto06, n_nastusha, confound_876, anna_domini, akop38, kshk, vvladimirsky, blindkamikadze, mnog,risha_spb, vl_plotnikov.

    Новые ники первой сотни: nikolkaya (не было в прошлый раз из-за ошибки), honestlil, le_ranger, santehnik_dush, skotic, bobagot, crazycat_meyr, deekourtsman, kassandra_138, tr00per, apervushin.

    Дальше, собственно, таблица результатов с указанием прироста (падения):
    Подробнее...

    6 комментариев

    Чешутся шаловливые ручки вместо диссертации позаниматься ещё какими-нибудь пиписькомерками — рейтинг «авторитетности» яндекса какой-то странный и непрозрачный (хотя в общем, первые две-три сотни более-мене адекватны реальности), количество читателей вообще нерелевантно. Знаю кучу народа с 1500—2000 френдов, которых реально читает едва ли больше трёх сотен.

    Задумался о «коэффициенте внимания» — относительно простом показателе, в котором каждый френд будет вносить ту долю внимания, которую он ему уделяет. Иначе говоря, если я вношу кого-то во френды, то он получает 1/325 «человековнимания», а если кто-то читает френдленту, в которой только один жж-юзер, то этот самый жж-юзер получает 1 (целое) человековнимание.
    Правда такой рейтинг и будет накручиваться элементарно именно сотней-другой зафрендивших ботов. Впрочем, с этим тоже можно бороться, считая простые индексы внимания для зафрендивших, а для итогового индекса перемножая их.

    Но по настоящему интересной мерой был бы «коэффициент трансляции». Коэффициент трансляции — тоже очень простая мера (а вот рассчитывать её куда труднее) — сколько человек увидят сообшение юзера в своих френдлентах, если его скопируют все френды юзера? Иначе говоря, это «френд-оф-френдс» наоборот. Читатели читателей. Фишка как раз в том, что это количество может очень сильно пересекаться. Скажем, среди моих читателей есть такие группы человек по двадцать, где все френды всех. Для расчёта этого показателя в лоб нужны, как я понимаю, неслабые ресурсы компьютера, а для уменьшения потребных ресурсов нужны неслабые мозги нормального программиста с нормальным образованием. Впрочем, может летом попробую порешать задачку «в лоб» и посмотреть, может оно как-то выйдет?

    Комментариев нет

    Почему-то товарищи, которые в прошлом и позапрошлом году делали эту интересную работу, её забросили, а раз уж я всё равно посвятил эту неделю освежению навыков программирования, то решил потратить часика три-четыре. Не взыщите строго — это первая версия алгоритма, который проходит по рейтингу ЖЖ Яндекса и пытается извлечь из профилей самых популярных блоггеров информацию о местоположении. Затем по этой информации пытается догадаться, нет ли там слова «петербург» в какой-либо форме.

    Рейтинг Яндекса составляется не по количеству читателей, а по «авторитетности» — аналогу индекса цитируемости для блогов. Разглядывая эту сотню, не могу не удивляться — насколько же стал ЖЖ необъятен — с большей частью этих людей я никогда не пересекался.

    Если вы заметили, что кто-то должен быть в рейтинге, но его там нет, сообщите, пожалуйста, я поправлю к следующей версии. Опять таки, если сюда прокрался кто-то не из Петербурга, тоже поправлю.

    Следующая версия — в начале апреля.
    Подробнее...

    2 комментария

    http://www.irena.org.ru/index.php?option=com_content&task=view&id=1143&Itemid=472 — выложена на сайте МЭСП. Вообще-то я ещё страшнее, чем на фотке там.

    Вот теперь я ещё лучше понимаю авторов статей, чьи материалы проходили через мои шаловливые ручки. Когда я сегодня начал читать этот текст, сразу заметил в первых же абзацах мою любимую стилистическую ошибку — повтор речевого оборота («в какой-то степени»). Однако обнаружил, что текст всё же прошёл через редактора. Потому что...

    Этот феномен доверия также связан с тем, что за текст несёт ответственность персонально его автор, не делясь ею с редакторами, издателями, корректорами, верстальщиками, владельцами и прочими атрибутами средств массовой информации

    превратилось в

    Этот феномен доверия также связан с тем, что за текст несёт ответственность персонально его автор, не делясь ею с редакторами, издателями, корректорами, верстальщиками, владельцами и прочими работниками средств массовой информации.

    Но реальная проблема в том, что статью стало трудно воспринимать — все сноски включены внутрь текста. Не надо было мне ими злоупотреблять. Так что для желающих PDF того, что я посылал: http://volokhonsky.ru/internet/politblogs.pdf.

    Комментариев нет

    Человек стал «тысячником» в течение суток после появления в блоге первого поста: garry_kasparov. Неудивительно. У меня всё детство прошло под аккомпанемент непрерывных сводок с линии фронта «Карпов-Каспаров». Путлер капут.

    Комментариев нет

    ... так это соотношение трудозатрат и полученных результатов. Так, я сейчас уже порядка десяти часов пишу программу для сбора данных, ещё один (а может и не один) товарищ пишет программу для обработки этих данных, несколько умных людей будут тратить кучу своих усилий на то, чтобы понять полученный результат.

    И всё это ради того, чтобы доказать примерно такую (если по простому) гипотезу:

    Люди комментят в чужих ЖЖ то, о чём сами пишут в своих.

    Иначе говоря, если я напишу что-то типа «на психфаке МГУ учатся одни тупоголовые болваны, да и преподаватели там — редкостное фуфло», то я могу быть уверен, что ad_meliorem не оставит этот пост без внимания, потому как его тоже интересует вопрос качества студентов и преподавателей психологии, тем более на психфаке МГУ. А если мы заглянем в его уютненькую жежешечку, то увидим там довольно-таки высокий коэффициент появления слов «студент» и «психолог». Вместе с тем, если я напишу подобную филиппику в отношении, например, лидеров национал-большевиков, вряд ли уважаемый Илья Валерьевич обратит на это внимание.

    3 комментария

    Вообще-то наверняка, статистика получше, просто я разместил счётчик в посте, опубликованном где-то уже совсем ночью...

    http://volokhonsky.livejournal.com/1043820.html

    Комментариев нет

    Мои сайты

    Рубрики

    Реклама

    Реклама

    Архивы

    Взлом вконтакте