... обнаружен на наших сайтах нашим бдительным партнером по обмену ссылками (проблема непреднамеренная - мы сами не задумывали и не прогнозировали такой результат)
- использование в урле страницы ссылок символов не соответствующих стандарту (не помню какому).
В нашем случае в урле использовался символ `
Урлы с этим символом не индексируются (как минимум Яндексом).
Пришлось много урлов исправлять.
Если исходить из того, что сайты из каталога - примесь в выдаче, то возникает следующая тактика продвижения:
1. Разделяем выдачу по запросу на два списка:
- список сайтов из каталога;
- список сайтов не из каталога.
2. Анализируем списки раздельно, выявляя параметры лидеров по каталогу и отдельно по основной базе (может быть разница в факторах).
3. Смотрим, каким путем будет проще продвигать конкретный сайт.
Это еще один аргумент в пользу того, что присутствие в каталоге ФАКТОРОМ НЕ ЯВЛЯЕТСЯ, а результаты поиска по каталогу подмешиваются ("слияние" в терминах архитектуры яндекса) в выдачу по основной базе без объединяющего ранжирования.
Повторю цитату из Яндекса:
"Запрос выполняется паралельно для всех коллекций...
Слияние результатов производится на том из собирающих (метапоисковых) веб-сервере, на которую попадал пользователь при заходе по адресу www.yandex.ru...
При этом не требуется переранжирование результатов, полученных из разных неоднородных коллекций..."
Причем, подмешиваться может разное количество сайтов, в зависимости от темы - ситуация с туризмом.
Да, забыл добавить, если в выдачу добавляется "примесь" из каталога, то постоянный вопрос "влияет ли тИЦ на выдачу Яндекс", мог бы иметь положительный ответ - влияет, косвенно, через ранжирование каталожной "примеси".
Но это все гипотеза, наверное, есть здесь гуру, кто знает точный ответ...
Вам надо "бла-бла-бла"... ? Будет...
читаем описание архитектуры рамблера: http://www.rambler.ru/doc/architecture.shtml
(Независимые базы. База ТОП100 - "быстрая база".)
"После того, как запрос обработан на backend'ах, информация о результатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают отсортированные результаты с машин "быстрой базы". Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend'ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим - с 6.1, четвертым - с 5.5.2 и т.д....Полученные результаты отдаются на frontend...
Помимо информации с proxy-сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю."
Т.е., судя по этому тексту, общего ранжирования выдачи после слияния результатов поиска по большой базе по ТОП100 не происходит (т.к. общее ранжрование после слияния результатов поисковых серверов "большой базы" - упомянуто.). Мы знаем, что в оптимизаторской практике этот метод получил название "примесь", когда результаты топа просто "подмешивались"(подмешиваются) к результатам основной базы.
Далее, читаем в описании архитектуры Яндекса: http://company.yandex.ru/programs/web_200203.html
"Параллельный поиск - это одновременный поиск в специализированных базах (коллекциях), предлагаемых поисковой системой. Обычно, источник - это отдельная база небольшого размера, отличная от "большой" базы документов...
Если при поиске по обычной базе находятся и документы из базы параллельного поиска, точно соответствующие запросу, то одновременно (параллельно) с обычным результатами поиска выдаётся список из нескольких найденных документов...
В "Яндексе" есть четыре базы параллельного поиска...
...
...по каталогу ("ручному" описанию веб-ресурсов)...
Обычно используются все коллекции. Собирающий сервер раздает в коллекции модифицированные запросы...
Запрос выполняется паралельно для всех коллекций...
На мой взгляд - аналогия с рамблеровской архитектуров "большой базой" и "малыми базами", в данном случае - каталогом. Здесь прямо сказано, что поиск ведется одновременно и по "большой базе" и по каталогу, далее результаты сливаются. Они могут сливаться, например, путем учета наличия документа в каталоге с повышением в выдаче. Но этого не происходит, поскольку переранжирования выдачи после слияния результатов поиска из "большой базы" и каталога не происходит (понятно, что это не мешает учитывать ссылку из каталога Яндекса, как "просто ссылку" с неким ВИЦем). Как еще они могут сливаться? Крайне существенное значение этой ссылки некоторое время назад и прецедент поведения Рамблера в аналогичной ситуации, позволяют предположить, что результаты каталога могут (могли) появлятся в выдаче, именно как "примесь".
Итого, имеем гипотезы по географическим-национальным факторам на гугле:
1. Влияние региона, откуда пришел запрос (у меня сайт летает со второй страницы на за сотую).
2. Региональные настройки в заголовке запроса (там не только язык браузера). Влияет не сильно - тасует сайты в пределах 3-5 мест.
3. Зона ссылающихся страниц.
4. Язык ссылающихся страниц.
5. IP хостера. Проверял гипотезу о связи региона по IP запроса с регионом по IP хостера - вроде не влияет.
Могу еще предположить:
6. Регион по добавлению в гугль через форму. Т.е. если я с русского IP добавляю сайт - это будет хорошо для русских (по IP, а не по тексту) запросов.
В связи с этим, откуда известно, что разные датацентры поддерживают общую копию индекса?
У меня складывается впечатление, что индексы разные, и их согласование - процесс очень длительный. Сидя в некоторой региональной сетке попадаешь, преимущественно, на конкретный "твой" датацентр. Если ему скормил новый сайт, то именно на нем сайт быстрее всего поднимается.
Ниже ссылка на "механизм" гугла, с помощью которого он позволяет искать слова расположенные "около ссылок".
labs.google.com/cgi-bin/webquotes
По законам сцены, ружье, висящее на стене, должно стрелять...
как-то я пытался поднять эту тему...
1. Может ли Директ отличить реальный запрос от проверки места?
Может. Если за запросом в сессии не последовал клик по сайту - запрос "левый", можно в прогнозе Директа не показывать.
2. А нужно ли это Директу?
Не нужно. Ибо статистика уменьшится и деньги.
... давно думаю, что продавцы контекстной рекламы (и Яндекс в частности) должны бы учитывать клики, чтобы отделять реальных "ищущих" от вебмастеров (и оптимизаторов) проверяющих позиции своих сайтов в выдаче...
Например, хочу я купить объявление в директе по запросу "мебель для офиса". Директ говорит мне, что я могу рассчитывать на 695 запросов в месяц (потенциальных моих клиентов).
В каталоге Яндекса 80 серьезных, по мнению редакторов, сайтов по данному запросу. Пусть владельцы\вебмастера проверяют позиции хотя бы раз в неделю (из опыта - иной бизнесовладелец может проверять почти ежедневно) 80Х4=320 запросов. Итого, половина статистики директа оказывается "неперспективной" с точки зрения рекламодателя (и оптимизатора).
Как можно отсеять? - заносить в статистику директа только те запросы, за которыми последовал клик в течении сессии. Правда, публиковать такую статистику продавцам контекстной рекламы будет невыгодно.
А вот, кстати, поощрять вебмастеров оптимизировать и проверять позиции - выгодно! Может, в этом причина поддержки гуглом и овертюрой сообщества оптимизаторов ;)
Целевая аудитория (веб-сайта) - совокупность интернет-пользователей, на которых (целе)направлено рекламное воздействие (веб-сайта).
т.е. целевая аудитория предполагает наличие:
- субъекта целенаправленного воздействия;
- объекта воздействия (аудиторию);
- цель воздействия;
- сам акт воздействия (хотя бы в плане).
Тематическая аудитория (Интернет) - совокупность интернет-пользователей, интересующихся определенной темой.
тут есть только две составляющие:
- тема (определяемая на бытовом уровне или, например, как результат группировки при иерархической кластеризации);
- субъект интереса к теме - та самая аудитория.
Например, интернет-пользователи, интересующиеся автомобилями БМВ - "тематическая аудитория". Но если у них нет бабок - то они никак не "целевая аудитория" для сайта продавца БМВ.
А вообще, Яндекс знает всего 4 сайта про "тематическую аудиторию" и 578 про "целевую аудиторию".
...но это так, к слову...