Несколько слов о анализе посещаемости сайта
Любому владельцу интернет-ресурса необходимо знать, насколько он информативен, удобен в работе и популярен у посетителей. А значит, как минимум, нужно получить представление о посещаемости ресурса, о наиболее востребованных его разделах, а также о том, не уходят ли с сайта посетители, не достигнув своей цели (то есть по причине того, что нужную им страницу не удалось загрузить или на нее непросто попасть). Тем же, кто связывает со своим проектом коммерческие планы, необходимо иметь больше информации о сайте и его посетителях. Например, следует учитывать аудиторию посетителей - то есть идентифицировать пришедших на сайт пользователей, имя хоста (хост в переводе англ. host - хозяин - сущность сети, обладающая IP-адресом, то есть персональный компьютер, сервер или коммуникационное устройство, в отчетах под хостами понимаются уникальные посетители), браузер, фиксировать ресурсы с которых пришли пользователи, сколько времени провели на исследуемом ресурсе, сколько страниц посетили, куда перешли и т.д. Нужно также контролировать действия посетителей, в частности выявлять, к какой информации они проявляют повышенный интерес, что загружают, по каким ссылкам переходят, а кроме того, оценивать результативность проведения рекламных кампаний, вести учет эффективности партнерских ссылок.
В общем, разработка любого успешного интернет-проекта, немыслима без точных инструментов анализа его работы, которые помогут принять верные решения относительно дальнейшего развития сайта, лучше понять предпочтения клиентов, повысить отдачу от рекламы и т.п.
Методы подсчета статистики посещаемости сайта
Существует два основных метода подсчета статистики:
использование анализаторов логов;
применение счетчика посещений;
Каждый из названных методов имеет свои плюсы и минусы, однако в большинстве случаев более просты в применении и подходят для широкого круга пользователей именно счетчики, а лог-анализаторы, как правило, сложны в настройке, а также требуют необходимой специальной подготовкой конфигурационных файлов. При этом ни один из методов не обеспечивает полной достоверности статистических данных, и на практике показания счетчиков и лог-анализаторов могут различаться в десятки раз. Оптимальным решением является комбинация обоих методов сбора информации, поскольку только в этом случае возможно получить наиболее близкие к реальности данные.
Анализаторами логов называют программы, которые сами не занимаются сбором статистики, но умеют анализировать серверные логи (т.е. данные обо всех обращениях к серверу, записанные им в лог-файлы). Теоретически лог-файлы можно просматривать и вручную через текстовый редактор, но это достаточно трудоемко, а при большом (в сотни и тысячи) числе посетителей и вообще невозможно. Гораздо удобнее использовать анализаторы логов, преобразующие данные в понятные отчеты. Поскольку web-сервер фиксирует все обращения к сайту, то формируемые на их основе отчеты обеспечивают самую полную статистику о посетителях и могут рассказать очень многое. Так, с помощью отчетов анализаторов можно узнать не только общее количество хитов (от англ. hit - попадание - событие, возникающее при выполнении веб-сервером запроса об открытии страницы, в отчетах под хитами понимается количество страниц, на которых побывали посетители исследуемого ресурса) и хостов, но и выяснить, по каким ссылкам приходили на сайт посетители, на каких именно страницах они были, какие файлы загружали, сколько времени провели, с каких страниц ушли, смогли ли вообще загрузить нужные им страницы и т.д. Серверные логии также позволяют учитывать число заходов с поисковых систем, вести статистику поисковых запросов, определять маршруты перемещения пользователей по сайту, вести статистику рефереров (ресурс, с которого посетитель пришел на анализируемый сайт) и отслеживать деятельность поисковых роботов и т.д. Иными словами, приведенная в отчетах лог-анализаторов статистика отличается максимально возможной полнотой (последнее, правда, относится к профессиональным решениям) и позволяет проанализировать работу проекта и выявить имеющиеся проблемы. В то же время в подавляющем большинстве случаев хостеры в целях минимизации размера лог-файлов не включают на серверах возможность фиксации cookies - в итоге точно идентифицировать посетителей по серверным логам удается далеко не всегда, ведь зачастую руководствоваться приходится только IP-адресами. А один IP-адрес в действительности не может ассоциироваться с одним и тем же пользователем - у части пользователей адреса динамические, при работе через прокси-сервер множество пользователей получают одинаковый IP-адрес, часть пользователей применяют софт для сокрытия своих IP-адресов и т.д. Все это означает, что на базе серверных логов нельзя получить статистику, важную для электронной коммерции, например отчеты по продажам.
В отличие от анализаторов, счетчики посещений собирают данные для анализа самостоятельно, правда для этого требуется разместить на страницах используемого сайта специальный код, по которому при обращении к странице (когда наряду с содержимым сайта загружается и внешний элемент - чаще всего картинка) записываются данные о посетителе. Счетчики ведут общую статистику посещаемости с детальным распределением по времени, фиксируют хосты и хиты, выявляют уникальных посетителей (с подробной информацией о каждом их них, включая IP-адрес, браузер, ОС, новый или старый и т.д.) вкупе с количеством посещенных ими страниц и временем пребывания на каждой из них. Кроме того, счетчики фиксируют реферов, нередко могут запоминать данные о путях перемещения посетителя по сайту, начиная с точки захода на сайт и заканчивая точкой выхода, могут определять информацию о цветности, разрешении экрана, языке браузера и т.д.
Вместе с тем собранную счетчиками статистику нельзя признать полной, ведь они не могут подсчитать трафик, не предоставят данные о загрузке пользователем файлов, флэш-объектов, картинок, активации ссылок и форм и, как правило, не умеют отслеживать поисковых роботов и т.д. Да и назвать точной статистику от счетчиков нельзя по многим причинам. Счетчики берут данные из cookies, получение информации из которых может блокироваться в браузере. Они управляются скриптами, поддержку которых в браузере несложно отключить. Пользователь может работать с несколькими браузерами, что еще больше запутывает ситуацию. Кроме того, при медленной связи некоторые картинки, в том числе и картинки счетчиков, могут просто не успевать загрузиться, ведь пользователь, увидев требуемую информацию, никогда не станет ждать окончания загрузки страницы, а перейдет дальше по нужной ссылке. И наконец, многие из тех, кто использует dual-up , просто отключают загрузку картинок в браузере, так что картинка счетчика потенциально не может загрузиться, а следовательно, скрипт не сработает и пользователь останется неучтенным. Так что погрешность собираемых счетчиками данных внушительна и, как считают многие специалисты в данной сфере, может составлять до 30%.
Счетчики бывают внешними и внутренними. Первые реализованы как веб-сервисы и управляются с уделенного сервера, на которых и хранится вся собираемая информация. Данный тип статистики широко распространен и прельщает многих пользователей относительной бесплатностью (на самом деле никакой благотворительности тут нет, так как на сайте размещается картинка с логотипом соответствующего сервиса, по сути представляющая собой его рекламу) и простотой использования. Внешние счетчики не обеспечивают получение статистики в режиме реального времени (они выдают ее с некоторым опозданием) и не умеют отслеживать роботов. Кроме того, собираемая ими информация хранится на внешнем сервере, а это небезопасно. Для бесплатных счетчиков можно назвать еще ряд минусов. Во-первых, никто не гарантирует бесперебойной работы счетчика (или хотя бы uptime в 99%) и высокой скорости загрузки сайта со счетчиком. Во-вторых, на сайт придется устанавливать видимые картинки счетчика с логотипом соответствующего веб-сервиса, которые, как правило, совсем не вписываются в дизайн сайта. В-третьих, не всегда есть возможность получить услуги анонимно, то есть без регистрации в различных рейтингах и каталогах.