Индексирование твитов в Google

В июле 2014 года интернет-агентство Stone Temple Consulting выложили на обозрение широкой общественности результаты своего исследования, целью которого было изучить влияние сигналов от Twitter на рейтинг сайта.

Индексирование твитов в гугле

Они наблюдали за тем, как индексируются твиты в Google и в процессе нашли много другой интересной информации. У них получилось, что индексирование твитов в Гугле низкое, однако у влиятельных пользователей этого сервиса микро-блогов индексация твитов лучше, чем у других.

Базовая информация об индексировании Twitter

Во время IPO стало известно, что Twitter обрабатывает в среднем более 500 миллионов твитов в день. На следующем рисунке показаны пара поисковых запросов в Google, которые были использованы в агентстве, чтобы попытаться выяснить, сколько Twitter-страниц находится в индексе Google:
twitter-indexed-tweets
Между этими двумя запросами мы видим менее 1,5 миллиардов страниц, что является довольно небольшим количеством, если учесть, что создаётся 500 миллионов твитов в день. Тем не менее, данные из этих двух запросов не обязательно точны, поэтому сотрудники агентства решили, что стоит попробовать пойти дальше и посмотреть, сколько Twitter-страниц было проиндексировано за месяц в Гугл.

Для этого использовались дополнительные операторы поисковых запросов, как показано на рисунке ниже:
dopolnitelniy-poisk-twitow
Сначала они выбрали «Инструменты поиска», затем «за всё время», а затем «За период». Так они использовали функцию календаря, чтобы выбрать диапазон дат.

Проанализировав месяц за месяцем с января 2012 года по июнь 2014 года, ими были получены следующие результаты:
indexirovanie-po-mesyacam
Во-первых, нужно сразу оговориться. Оператор «site:twitter.com» — как известно, довольно неточный. Тем не менее, даже с учетом большой степени погрешности, эти данные показывают, что скорость индексации твитов на самом деле довольно низкая. Это уже говорит о ценности информации в твитах для Гугл — она довольно близко к нулевому значению.

В качестве дополнительной информации, которой вы удивитесь — на самом деле ретвиты потенциально делают посты намного менее ценным для отдельного индекса. В соответствии с отчётом Дэна Зарелла про анализ 5000000 твитов, количество ретвитов составляет около 1,4 процента от общего числа твитов.

Исследование индексации твитов

В декабре Stone Temple Consulting опубликовали исследование о потенциальном влиянии Facebook на SEO, в котором они изучали как Google индексирует содержание профилей Facebook. Оно показало, что обновления влиятельных профилей Facebook индексируются в пределах 59 процентов. Рассмотрим подобное исследование для Твиттера.

В этой части исследования, они взяли для анализа индексации сообщений 963 различных аккаунтов Twitter. Используя Twitter и Google API, чтобы вытащить 20 последних твитов от каждого из этих аккаунтов, они отследили их уровни индексации с помощью различных способов. Количество последователем у аккаунтов, включенных в исследование, было разбито на следующие категории:

  • Более 5M — 26
  • 3M до 5М — 9
  • 1M до 3М — 23
  • 500K до 1M — 20
  • 100K до 500K — 71
  • 10K до 100K — 199

Индексация твитов с течением времени

Для начала были получены данные о проценте твитов, которые были проиндексированы безотносительно к числу последователей. В течение первых семи дней были получены такие показатели:
indexirovanie-twitter-po-dnyam
В совокупности было 10 453 твитов, которые наблюдались в течение последних семи дней и 326 из них были проиндексированы до уровня индексации 3,12 процента. Это на самом деле довольно соответствует тому, что мы видели в первой части этого исследования, где были использованы простые операторы, чтобы проверить уровень индексации в течении долгого времени.

Уровень индексации для твитов, которые были размещены более чем одну неделю назад показывает такой результат:
indexirovanie-twitow-po-nedelyam
Еще раз видим, что уровень индексации является относительно низким. Было проверено всего 19389 твитов, 701 из них индексируется до уровня индексации 3,62 процента. Индексация достигла максимума в четвертой неделе. Учитывая глубину данных, можно заключить, что индексация твитов увеличивается с течением времени. Особенно в период от двух до четырех недель, а затем начинает снижаться.

Уровень индексации в зависимости от числа читателей

Данные, относительно числа фолловеров:
twitter-indexaciya-ot-followerow
Как вы можете видеть, уровень индексации твитов для аккаунтов с 1000000 или более последователей на самом деле довольно высока. Как только мы опускаемся ниже 1 млн последователей этот показатель резко падает. Снижение продолжается и для аккаунтов по 10000 последователей (индексация только 0,22 процента) — уровень, который согласуется с данными, полученными с помощью специальных операторов поиска.

Становится ясно, что идёт сильное смещение в сторону больших твиттер-аккаунтов. В тесте 63,9 процентов аккаунты, имеющие 10000 последователей или более показали очень высокие цифры. Подавляющее же большинство твиттер-аккаунтов имеют гораздо меньше, чем 10 000 последователей.

Индексация раскрученных аккаунтов с течением времени

Рассмотрим индексацию твитов от очень влиятельных аккаунтов с течением времени в более подробной форме. Уровни индексации твитов в течение долгого времени день за днем:
twitter-indexaciya-magorov-so-vremenem
Что действительно интересно — твиты от очень высокого числа фолловеров не индексируются особенно быстро. Давно считается, что Twitter используется Google для получения новостей. Однако эти данные показывают, что Google не особенно быстр при индексации твитов даже из самых влиятельных профилей.

Что заставляет твиты индексироваться?

Было также проведено исследование твитов в различных категориях, чтобы посмотреть как это может повлиять на индексацию. Для целей настоящего анализа, сосредоточение было на пяти Twitter-профилях с наибольшим количеством последователей и пяти Twitter-профилей, которые имели наибольшее число входящих ссылок. Обращаем внимание, что размер выборки для этого теста был небольшой: в общей сложности 92 твита были проверены на этом уровне детализации.

Для пяти профилей с самым высоким числом фолловеров было обнаружено, что они были проиндексированы на 80 процентов , а пять профилей с сильнейшим ссылочным — только на 20 процентов.

20,3 процента из индексированных твитов пяти профилей с наибольшим количеством последователей были любопытными или очень актуальными и 43,2 процента из индексированных твитов имели в своём содержании ссылку. 71,6 процентов имели внешние ссылки на себя. Всего 86,5 процента были новостями или имели ссылку на новости. Диаграмма, показывающая указанные данные:
index-twitter
Проведя исследование выдачи по двум запросам, компания нашла в Google в общей сложности почти 1,5 млрд проиндексированных страниц Twitter.

Заключение

Итак, графики показывают нам, что в целом индексация содержания твитов по Google довольно низкая. Однако твиты из более влиятельных аккаунтов индексируются довольно хорошо (до 50 процентов). Однако, индексация и таких профилей не такая быстрая, как хотелось бы. Учитывая традиционную веру, что Google может использовать общие ссылки в Twitter в качестве потенциального показателя, мы ожидали что индексация будет более быстрой.

Тем не менее, данные этого не подтверждают. Даже для счетов с более чем 5 миллионов последователей только шесть процентов твитов индексируются в течение первых 24 часов. Этот показатель поднимается до 15 процентов к концу 48 часов. Google на самом деле может искать твиты, не индексировать их. В целом, данные свидетельствуют о том, что Google в настоящее время не использует деятельность в Twitter как сигнал.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *