Комментарии - Kost - Профиль вебмастера - Форум об интернет-маркетинге

Как оптимизировать клон сайта?

18 июня 2011, 16:27

Разумеется, отдельный домен лучше.

Опрос: оцените плотность ключей, чтоб не было беды

18 июня 2011, 14:41

Видимо, вам нужно обратиться в раздел "Работа для вебмастера".

Мой сайт накручивают

18 июня 2011, 10:44

k.d.r:
Напишите об этом в яндекс, для подстраховки, приложите логи и т.д.

О, да, Платону больше делать нечего, чьи-то логи изучать. Не смешите народ.

Как повысить доверие к сайту (не seo)?

18 июня 2011, 10:28

Видимо, нужно на сайте написать, в чем состоит механизм получения скидки.

Мой сайт накручивают

18 июня 2011, 10:25

k.d.r:
у ispsystem.net стоит какая-то простукивалка

Которая дергает счетчик LI ?

Мой сайт накручивают

18 июня 2011, 10:17

Если боитесь, запретите доступ к сайту с этих IP.

Сайт *.net.ua ввести в зону .ru

18 июня 2011, 10:13

marks:
украинских версиях поисковиков?

У вас должно быть одно из зеркал главным, оно и будет во всех версиях каждого отдельного поисковика.

Чтобы идеть на двух стульях, нужно две ... версии сайта, на разных доменах и, видимо, на двух разных языках.

Посевом вируса кто занимается?

18 июня 2011, 08:46

В разделе "Работа для вебмастера", разумеется, а не в разделе "Поисковые системы".

Подскажите, Гугл всегда забивает на Disallow в роботс ?

18 июня 2011, 08:02

bober:
Строки
Disallow: /categories/*
Disallow: /page/*
ничего не закрывают, чтобы закрыть эти директории, уберите звездочки:
Disallow: /categories/
Disallow: /page/

Если бы это было написано лет 10 назад, это было бы справедливо.

Но уже много лет работает и вариант со звездочкой:

/hjshdkfjshf.html
Заблокировано по строке 3: Disallow: /h*

Впрочем, звездочки здесь не нужны, в этом я согласен.

hasugosu:
Уже пару недель, как убрал allow, закрыл все в dissalow http://sex-porn-xxx.com/robots.txt

Но гугл все равно продолжает жрать недоделанный сайт http://google.com/search?&q=site:sex...x.com&filter=0

Ваша проблема в том, что вы не хотите читать документацию на robots.txt, . Ссылки есть в FAQ раздела для новичков.

В вашем robots.txt работает только первая секция из двух строк:

User-agent: *
Host: sex-porn-xxx.com

И то бессмысленная, т.к. нет ни одной директивы Disallow

Во всех остальных блоках нет ни одной директивы User-agent:

поэтому поисковики их пропускают.

Меня удивляют люди, которые столько строчат на форумах, с пеной у рта что-то доказывают, но не читают совершенно нехитрую документацию и не пользуются простейшей проверкой в GWMT, про которую сами много кричат.

XPraptor:
Гугл понимает тег allow только для директив регулярных выражений.
Для обычного управления урлами - он не поддерживает эту директиву как и все остальные боты.

Такого бреда я от вас не ожидал.

Сейчас специально проверил. Разумеется, все работает, без всяких регулярных выражений. Пример был такой:

User-agent: *

Allow: /a

Disallow: /

Проверил URL /kjshdkfjshf.html - Заблокировано по строке 3: Disallow: /

Проверил URL /akjshdkfjshf.html - Разрешено в строке 2: Allow: /a

Все просто. И все работает.

hasugosu:
Я выложил сайт с вот таким роботсом:
User-agent: *
Allow: /$
Disallow: /*

Не знаю регулярные это выражения, или не регулярные но значить они должны следующее - индексировать только главную, не индексировать все остальное

Все правильно написали. Звездочку в Disallow лучше убрать, она там всегда и так подразумевается.

P.S. Ну и срач с бредом развели на пустом месте, ну вы даете, кошмар. kimberlit один отбивался, уважаю :).

Апдейт поисковой базы 15.06.2011

17 июня 2011, 19:46

samimages:
я уже более полугода не могу удалить две мертвые страницы... плюнул уже)))

Что значит мертвые? Какой код они отдают? 404 или как?

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Kost