melkov

Рейтинг
57
Регистрация
25.01.2001
Должность
postgraduate student (DMMC), yandex.ru programmer
Интересы
search engine(s), 3d engines

deniss

> так это совершенно официально официально что яндекс предпочитает российские домены иностранным в результатах поиска

> то есть в индексе у страниц из !.ru стоит некий коэффициэнт < 1

Нет, неправда. Какая разница, где домен, если его уже разрешили? Скорее всего, и без переезда сайта результаты были бы примерно те же . Позиция на поиске ведь зависит не только от содержимого вашего сайта.

ztop

1) писать надо было на addurl, а не webadmin, если уж пользуетесь службой addurl. Пока письмо с webadmin дойдет-таки до addurl, не один день может пройти.

2) Если сайт не полностью русскоязычный, либо на нем нет отдельной директории на русском языке, модератор addurl все равно откажет в регистрации, несмотря на то, что робот вроде бы сказал "да".

Яндекс точно не ходит по редиректам с robots.txt, любой http-код, кроме 200, интерпретируется как отсутствие этого файла. Я сейчас это еще раз проверил .

Фраза "file must be accessible" как раз и означает, что должен быть http-код 200 (в крайнем случае 304, если было спрошено if-modified-since).

Что касается kuking.*, то там вот какая картина с зеркалами:

Основной адрес:

kuking.net

Редиректы: www.kuking.ru www.taste.ru www.kuking.net

kuking.spb.ru

w3.spb.ru

recipes.spb.ru www.kuking.spb.ru

kuking.ru

robots.txt:

taste.ru

А еще в середине февраля все зеркала, кроме kuking.net, действительно были успешно запрещены robots.txt.

Что касается Рамблера, IMHO, kuking.net просто не походил там ручную проверку (доменная зона-то .net). Советую почитать их раздел помощи, в крайнем случае написать в лужбу техподдержки.

deniss

Яндекс вроде бы не ходит по редиректам с robots.txt. Не совсем понятно, зачем это делать? Более того, это, вроде бы, идеологически неверно.

http://www.robotstxt.org/wc/norobots.html :

The method used to exclude robots from a server is to create a file on the server which specifies an access policy for robots. This file must be accessible via HTTP on the local URL "/robots.txt".

Далее, а зачем вообще запрещать /robots.txt сайт, с которого идет полный редирект? Совершенно логично, что такие сайты не выбираются главным зеркалом по той же причине, что и запрещенные /robots.txt: они не могут быть проиндексированы.

Не верьте глазам своим

На упомянутый сайт ссылаются с использованием префикса www. http://www.yandex.ru/yandsearch?text=&Link=http://agromage.al.ru,http://www.agromage.al.ru&iserverurl=agromage.al.ru,www.agromage.al.ru

Трюк со ссылками с главной страницы, конечно же, работает, но robots.txt - это существенно более вежливый и корректный метод работы с зеркалами с точки зрения поисковых систем (поскольку действует безотказно не только с Яндексом).

С другой стороны, значительная часть web-мастеров испытывает определенные сложности с установкой (правильного) robots.txt на свой сайт. Ну а в случае, когда возникает вопрос о выдаче различного содержимого по разным виртуальным адресам, обычно требуется вмешательство системного администратора (который не доверяет web-мастеру и не дает ему соответствующие права ). Поэтому, если есть возможность использовать robots.txt - лучше его использовать, а если нет - см. первый способ.

itman

Ну просто нельзя не ответить...


> Читать-то я читал, только фраза "лексика" ссылок, требует уточнения.
> б) учитывает какие ключевые слова юзаются между <a href ..> и </a> при ссылках на страницу ...

Ну так это и называется поиском по лексике ссылок.


> В яндексе ссылка выходит второй и кричит о себе, что она по ссылке найдена. В гугле она первая.

И тоже найдена по ссылке. Просто Гугль не считает нужным писать об этом (в чем-то они и правы).

Как Вы можете заметить, в нормальных современных поисковиках на "качество поиска" влияет не только содержимое страницы, но и ее положение в гипертекстовой структуре сети. Поэтому вебмастера сверхпопулярных ресурсов могут себе позволить оптимизировать не "искабельность" их страниц в ПС, а качество контента и удобство интерфейса.

Что касается запроса "яндекс почта" - обратите внимание на третью ссылку - это она и есть . Зеркала, понимаете...

Речь идет прежде всего о зарубежных доменах. По ссылкам там Яндекс ходить не будет, т.к. трафик дорогой ;(

itman, а Вы про "поиск по лексике ссылок" в этом форуме случайно ничего не читали?

сделайте запрос:

(Яндекс-энциклопедии) && #link="encycl.yandex.ru"

Странно. http://encycl.yandex.ru/ на первом месте, вроде. Может, какая-то машинка опять не ответила?

Всего: 142