PHP скрипт для управления META ROBOTS и Canonical

S
На сайте с 24.11.2010
Offline
26
832

Предлагаю принять участие в тестировании и доработке скрипта для автоматического управления индексацией сайта.

скрипт: metarobots.php

Позволяет с помощью файла управления metarobots.txt

Задавать для наборов страниц параметры мета тега robots

и проставлять link rel="canonical"

Управление тегами происходит с помощью команд в текстовом документе metarobots.txt по логике схожей с файлом robots.txt

Так к примеру, набор команд:

Canonical: *index.php* : +/

Canonical: *.html* : +html

Disallow: *?*

Позволяет в CMS Joomla склеить все страницы пагинации и запретить индексацию страниц отличных от формата ЧПУ, а также задать каноническими все документы .html

Скачать скрипт и прочитать полную спецификацию вы можете по ссылке:

meta robots php

Также интересно, какие еще возможности хотели бы видеть вебмастера в таком инструменте?

TF-Studio
На сайте с 17.08.2010
Offline
334
#1

А не проще использовать изначально правильную CMS, где не нужно городить кучу вещей, чтобы получить элементарные вещи?

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
S
На сайте с 24.11.2010
Offline
26
#2

1. Извините но я пока не видел не одной CMS которая позволяет гибко настраивать meta robots и canonical.

Указывать для каждой страницы настройки индексации вручную я не считаю корректной работой.

2. Также не стоит забывать о самописных системах.

3. Конечно можно все подробно описать разработчику, но к сожалению разработчики не всегда выполняют ТЗ дословно.

Использование подключаемого скрипта позволяет минимизировать необходимость лезть в код при настройке индексации и контролировать весь процесс с помощью обычного текстового файла.

siv1987
На сайте с 02.04.2009
Offline
427
#3

Довольно жестковый скрипт (comanda, znachenie, zapret; (($comanda)and($znachenie))!='' ???).

Логику тогда уже надо было делать более схожей с robots.txt.

В конце по умолчанию считается любое количество символов без указания звездочки.

Постановочные символы - * и $ (конец строки)

Путь указывается от корня

Disallow: /index.php?

Canonical: /*.html : +html (+ вообще убрать)

Shatamba:
1. Извините но я пока не видел не одной CMS которая позволяет гибко настраивать meta robots и canonical.

Гибко по вашему это для каждой странице прописать канонический адрес?

Shatamba:
Указывать для каждой страницы настройки индексации вручную я не считаю корректной работой.

Кто вам сказал что в кмс это делается вручную? Даже если и захотеть, сделать это довольно сложно когда адреса генерируются динамически.

TF-Studio
На сайте с 17.08.2010
Offline
334
#4

Shatamba, вы просто суть не улавливаете.

CMS просто изначально не должна создавать дубли и отдавать нужное (контент, коды) по нужным адресам.

S
На сайте с 24.11.2010
Offline
26
#5

siv1987, По логике спасибо, вы правы нужно подстроить логику под оригинальную robots.txt , также я подумываю реализовать поддержку User Agent.

В плане гибкости.

По моему удобно и достаточно гибко одной строкой в текстовом документе управлять всей индексацией и rel canonical. Я не встречал такого ни в одной CMS.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий