Помогите с robots.txt

12
Melitopol
На сайте с 18.03.2011
Offline
96
1027

Помогите пожалуйста.

Как в robots.txt запретить индексацию страницы раздела site.ru/internet/ но чтоб индексировались новости этого раздела site.ru/internet/novosti.html

В яндекс хелпе смотрел и этого не понял.

Shessmaster
На сайте с 15.10.2007
Offline
240
#1

User-agent: Yandex

Allow: /

Disallow: /internet

Allow: /internet/novosti.html

Melitopol
На сайте с 18.03.2011
Offline
96
#2

а если к примеру в разделе будет 100 страниц новостей, что придется каждую страницу вписывать в робот.тхт?

Allow: /internet/novosti.html

Allow: /internet/novosti-1.html

Allow: /internet/novosti-2.html

Allow: /internet/novosti-3.html

...............

А по другому никак нельзя?

Megaindex_PM
На сайте с 31.07.2013
Offline
9
#3
Melitopol:
а если к примеру в разделе будет 100 страниц новостей, что придется каждую страницу вписывать в робот.тхт?
Allow: /internet/novosti.html
Allow: /internet/novosti-1.html


User-agent: *
Disallow: /internet
Allow: /internet/novosti
Персональный менеджер по SEO от MegaIndex: тут (https://www.megaindex.ru/manager/)
DiAksID
На сайте с 02.08.2008
Offline
236
#4

Allow: /internet/novosti или Allow: /internet/novosti* по желанию (одно и то же)

пройдут все, которые с этого начинаются. Allow и Disallow воспринимаются как шаблоны, а не конкретные пути (хотя шаблон может подходить и только к одному конкретному файлу).

ЗЫ: "Allow /" нафиг не нужен, это идёт по умолчанию....

show must go on !!!...
Melitopol
На сайте с 18.03.2011
Offline
96
#5

Это понятно, но novosti.html novosti-1.html novosti-2.html novosti-3.html это я так придумал...

На самом деле страницы будут с разными именами, например pogoda.html, putin.html, gfdgdfg.html, fhfdg.html... и все эти страницы будут в разделе site.ru/internet/

Как тогда быть? :)

IL
На сайте с 20.04.2007
Offline
435
#6
Melitopol:
Как тогда быть?

meta robots (тэг в коде) использовать для списка новостей.

... :) Облачные серверы от RegRu - промокод 3F85-3D10-806D-7224 ( http://levik.info/regru )
Melitopol
На сайте с 18.03.2011
Offline
96
#7

нашел в другой подобной теме ответ

Добавьте в robots.txt

Allow: /internet/*.html

Disallow: /internet/

Так можно?

siv1987
На сайте с 02.04.2009
Offline
427
#8

Disallow: /internat/$

- запретит индексацию страницы /internat/

- и резрешит индексацию страниц /internat/любые_символы

DiAksID
На сайте с 02.08.2008
Offline
236
#9
siv1987:
... - и резрешит индексацию страниц /internat/любые_символы

что-либо "разрешать" Disallow не может никогда и никак, здесь по факту - всего лишь "не запрещает"...

siv1987
На сайте с 02.04.2009
Offline
427
#10
DiAksID:
что-либо "разрешать" Disallow не может никогда и никак, здесь по факту - всего лишь "не запрещает"...

По факту - запрещает конкретный адрес. Следовательно разрешая не запрещая другие адреса этой маске. Для себя можете сформулировать это предложение как угодно.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий