funsad

Рейтинг
116
Регистрация
15.11.2000

Спасибо, что снова подняли эту тему. Я почти год назад писал на форуме Яндекса предложение ввести отдельный файл, который бы регулировал поведение робота относительно проблемы зеркал. Назовем его условно mirrors.txt.

Во-первых, он не конфликтует с robots.txt и не вызывает путаницы. Во-вторых, этим файлом можно указать не только перечень индексируемых зеркал, но и полный перечень зеркал с указанием главного. Зачем? Зеркала могут быть частичными (скажем, для одного раздела), либо страницы могут отличаться какими-то небольшими деталями, и сайты уже не будут распознаны как зеркала. Если же содержание файлов mirrors.txt на двух и более серверах идентично (т.е. это не подложный mirrors), значит, все второстепенные зеркала можно не индексировать (если главное нормально доступно).

С уважением,

Александр Садовский.

Как писал defresto
юзер хочет увидить хороший сайт по теме которую он ищет

Пока мы рассматриваем одного оптимизатора, все хорошо. Но что делать, когда их много? Пример: запрос "краски". Согласно данным Яндекса, львиная доля запросов приходится на группу "Краски", но в выдаче информация только о продавцах красок. Конечно, есть пользователи, которым нужно именно это, но они составляют 20% или 30% от всех, кто задает такой запрос. При этом среди первых 150 ссылок нет ни одной на музыкальную группу, дальше я проверять не стал.

Можно винить алгоритм Яндекса, но нужно понимать, что подобный перекос отчасти вызван и деятельностью оптимизаторов.

С уважением,

Александр Садовский.

Как писал euhenio
"ремонт" однозначно определяет услугу
-а что, нет? Скажем так, потребность определяет, отличную от запроса "голые девки"...

Помнится, что в фидо конференция remont имела несколько иную направленность. :)

С уважением,

Александр Садовский.

Как писал RAINMAN
Физически удаляется сайт из базы или работает какой-либо фильтр на выдаче результатов запроса? Ходит ли робот на этот сайт?

А зачем хранить мусор? Возможно, исключение можно сделать для очень больших сайтов, которые сложно проиндексировать повторно, но такие сайты сами, как правило, не балуются спамом. Поэтому вполне логичное решение -- удалить сайт из базы и запретить роботу ходить на него. Как устроено в Яндексе на самом деле, ответить может Илья.

С уважением,

Александр Садовский.

Как писал wolf
Вот Волож считает, что стучать - этично, а я - что не этично. Наверное, слишком много времени провел в дестве в пионерлагерях, где к стукачам отношение было однозначное

Ситуация немного сложнее, чем в пионерлагере. Есть несколько видов стука (классификация ;)):

  • Стук о сбоях. Поисковая система -- это сложный алгоритм + какой-то объем ручной работы (тот же каталог). Если ты на странице каталога встретишь ошибку и напишешь об этом в Яндекс, это стук или нет? Конечно, нет. Если ты напишешь про trap-сообщения, это тоже ведь не стук, правда? То есть когда речь идет о сбоях, независимо от того, чем они вызваны, это нормально.
  • Стук об атаке. Предположим, что хакер вскрыл защиту Яндекса и тянет ценные данные. Ты видишь это и по-человечески сочувствуешь Яндексу. Будет ли письмо о хакере стуком? С одной стороны, тебя никто не просил вмешиваться. С другой, если ты видишь, как карманник вытягивает у прохожего кошелек, когда ты проходишь мимо, тебя тоже никто не просит вмешаться. Но если ты остановишь кражу, все будут считать это честным поступком. Поэтому я склонен думать, что письмо о проделках хакера этично и стуком не является.
  • Стук о том, что не нравится. Эта категория самая запутанная. Представь, что у тебя в пионерлагере есть друг (Яндекс), который не любит, когда ему в компот сыпят соль и ставят грабли перед дверью. Ты видишь проделки других ребят над другом и предупреждаешь его. Стук это или нет? Если ты сам не сыпешь соль в компот, это не стук: ты спасаешь человека от того, что ему неприятно. Тем более, что он ничем не досадил своим обидчикам. Но если ты сам занимаешься подобными проделками вместе с ребятами, а потом закладываешь других, выгораживая себя, то это некрасиво и является стуком.

Как видно, стук это или нет определяет только то, принимаешь ли ты участие в проказах. То есть если обычный пользователь пишет о спамерском сайте, то он не стукач. Но любой оптимизатор, с другой стороны, является и пользователем Яндекса. В какой из ипостасей он написал письмо? В одном случае это стук, в другом -- нет.

Поэтому лично у меня отношение к письмам о конкурентах спокойное. Я пишу в Яндекс, только если результат раздражает меня как пользователя.

С уважением,

Александр Садовский.

Как писал xyz
если страница будет состоять из 1 слова, то его вес будет =100%.

Не факт. На конференции Михаил Костин говорил, что в Апорте для небольших документов, размер которых (в словах) меньше заданной константы, относительная частота рассчитывается не от их фактического размера, а от этой константы.

Это может быть верным и для других поисковиков.

С уважением,

Александр Садовский.

Как писал andre
Не могли бы Вы дать ссылку на полный список партнерских ресурсов Бегуна, которые разместили модуль показа рекламных ссылок?

Он есть на сайте:

http://www.begun.ru/service/padcat.phtml

С уважением,

Александр Садовский.

Как писал AiK
Я в акции не участвую, но она мешает ужасно. И не моей платной рекламе :).

Для этого и есть возможность добавить свой ответ, а не только голос, чтобы рассказать нам, какие проблемы приносит порядочным людям акция "48 часов". :) С большим интересом послушаю.

С уважением,

Александр Садовский.

Как писал AiK
Саш, ты не находишь, что вопросы заданы по типу "Вы уже перестали пить коньяк поутрам?"

Почему же? Два положительных ответа, два негативных, один "воздержался". Нормальный выбор.

С уважением,

Александр Садовский.

Как писал andre
Есть ли иные варианты, и какой из предложенных кажется наиболее вероятным?

Скорее всего, пользователи нажимают на ссылку, которая находится выше. Это особенно вероятно, если слово "Казань" отсутствует в заголовке или начале аннотации.

Я в свое время экспериментировал с баннерной рекламой, ориентированной на Харьков. Когда не применялся региональный таргетинг, на нее кликали из России, Израиля и других стран (регионов), совершенно не связанных с Харьковом. При этом на баннере огромными буквами говорилось про Харьков. Кто-то хотел узнать уровень цен, кто-то нажал случайно, кто-то заинтересовался предложением, подразумевая, что найдется аналогичное и в своем регионе.

Поэтому чтобы работать с умеренными расходами с Казанью в "Бегуне", надо окучивать поисковые фразы, содержащие слова "Казань", "казанский" и аналогичные. Если число запросов получается слишком маленьким, можно расширять тематику (скажем, вместо "сканеры Казань" рекламироваться по "компьютеры Казань").

Второй вариант -- снижать ставки, чтобы уменьшить число "idiot clicks". Человек, который почему-то пропустил первое и второе объявление, скорее всего, прочел их, значит, прочтет и третье. Многие жалуются на низкое качество посетителей из каталога "Бегуна". Я уже писал на форуме, чем вызвано плохое качество аудитории из каталога. Тем не менее, клиенты, у которых в "Бегуне" ставки низкие, говорят, что такие посетители ничуть не хуже, чем из поисковиков. Наверное, если человек не кликает сразу, он выбирает то, что ему больше подходит.

С уважением,

Александр Садовский.

Всего: 1503