Большая Тёрка / Мысли / Личная лента Arhat109 /
Яндекс, поиск, Директ, спам, Yandex, google, mail, search, интернет реклама, Ya , HTTP REQUEST, remote IP , referer, клики, тиц , показы, поисковый робот, Гугль
Недавно прикрутил к корпоративному сайту статистику посещений с полным разбором заголовка приходящего запроса. Анализ содержимого таблицы в базе наводит ряд интересных моментов, о которых и решил высказааться... и так:
1. Общее количество посещений - в сутки примерно 40-50 тысяч шт. Поначалу - вроде как "ого-го!". Но при ближайшем рассмотрении, оказывается что от 80% до 98% заходов - это поисковые запросы роботов поисковых машин. Причем с некоторых поисковиков запросы приходят "по отдельности" от разных служб и разных "зеркал"... Итог: относительно "полезный" траффик сервера это "всего лишь" около 5 тысяч запросов в сутки.
2. При дальнейшем рассмотрении оказывается, что среди нужного остатка тоже есть запросы роботов. Никто ведь не решит отнести к "пользователю за компом" - 52 внешних запроса с одного и того же адреса, сделанных в течение менее чем одной секунды к разным(!) страницам сайта... таких можно условно отделить как около 10% остаточного траффика. Далее: при обратном поиске по различным спискам в инете адресов и сигнатур посетителя, обнаруживаем что часть из них тоже известна как роботы различных назначений... Итого, суммарно полезного траффика у меня осталось еще половина - 2500шт в день.
3. Дальнейший анализ сухого остатка показывает, что большая часть (две трети) - это запросы с поисковиков, в основном Яндекс, Мэйл и Гугль (в порядке убывания долей) примерно в равном количестве... что несогласуется и сильно с принятым рейтингом в инете... ну да ладно, может это сайт такой.
4. Итого оставшиеся около 800 запросов в день - это и есть те самые посетители. И, если учесть среднюю повторяемость одного адреса во времени, то можно оценить полезность и качество просмотра ресурса... Это с одной стороны.
А с другой: полезность поискового запроса - оказывается "обрамлена" тучей поискового спама, вычленить из которого что-то - задачка. Т.е. когда кто-то говорит, что у него "стоимость одного клика ... всего лишь" - можно смело умножать эту цифру от 10 до 100раз. Не ошибешься. Или если речь о "росте посетителей", то делить на тот же коэффициент. Ну это ладно, это к вопросу стоимости интернет рекламы, которая и так уже "до небес".
5. А с третьей стороны, что и побудило написать эту мысль: все старательно бьются против почтового спама, а спам поисковый - вроде как никто не замечает. Но ведь именно он (ну так получается!) и создает основную загруженность каналов интернет!!! т.е. от 80% ВСЕГО ИНТЕРНЕТ траффика - это поисковый спам. Вот что мне показалось грустным.
ShaDart, «готовые решения» — конечно же используются. Все сравнения приведены как раз с ними. Причем между «готовыми» решениями — расхождения в подсчете — меньше конечно, но тоже выходят за рамки «нормальной стат‑погрешности»... вот и решил проверить... :(
Там еще интересный момент есть: Директ утверждает о заходе, ну например в, 100 посетителей «чисто наши». Переходы с директа в заголовках отмечены соответственно... по крайней мере при утверждении в 100 заходов я их вижу. Правда не в таком количестве, а всего... 10. т.е. ладно, если они теряют данные в силу дальности, загруженности и т.д., но вот когда НАХОДЯТ — становится интересно. У меня‑то столько ЛЮДЕЙ — не регистрируется... :)