Проги-сканеры выдают 503, но сайты работают. В чём дело?

12
I
На сайте с 29.07.2015
Offline
2
3669

Здравствуйте. Хочу просканировать один из своих сайтов (remontturbin.com.ua) программами Xenu и Screaming Frog. Но при запуске сканера, SF сразу выдает error 503, а Xenu - temporarily overloaded..

Хотя сайт при этом открывается. Подскажите где копать, раньше сканировал нормально. Предполагаю, что с .htaccess что-то не так... Хотя, не сканируется и совершенно свежий сайт, в котором SEO ещё и "не пахло" - http://tenti-karkasi.com.ua/, а также точно также отвечает сайт, который давно не трогался, но seo проводилось в свое время и сканировался нормально - http://uzh-turbo.com.ua/ . Буду очень признателен за помощь.

P.S. Единственное, что наводит на мысль - у этих сайтов один хостер, ukraine.com.ua, за несколько лет проблем не возникало. Стоит ли доставать техподдержку и каким образом аргументировать, ведь сайт работает!! Спасибо.

[Удален]
#1
itconsult:
Здравствуйте. Хочу просканировать один из своих сайтов (remontturbin.com.ua) программами Xenu и Screaming Frog. Но при запуске сканера, SF сразу выдает error 503, а Xenu - temporarily overloaded..
Хотя сайт при этом открывается. Подскажите где копать, раньше сканировал нормально. Предполагаю, что с .htaccess что-то не так... Хотя, не сканируется и совершенно свежий сайт, в котором SEO ещё и "не пахло" - http://tenti-karkasi.com.ua/, а также точно также отвечает сайт, который давно не трогался, но seo проводилось в свое время и сканировался нормально - http://uzh-turbo.com.ua/ . Буду очень признателен за помощь.
P.S. Единственное, что наводит на мысль - у этих сайтов один хостер, ukraine.com.ua, за несколько лет проблем не возникало. Стоит ли доставать техподдержку и каким образом аргументировать, ведь сайт работает!! Спасибо.

А если в robots.txt убрать Disallow: / что-нибудь меняется?

I
На сайте с 29.07.2015
Offline
2
#2
Topvisor:
А если в robots.txt убрать Disallow: / что-нибудь меняется?

Дык, нет в robots Disallow корня... Во что есть, если ещё не посмотрели:

User-agent: *

Disallow: /administrator/

Disallow: /bin/

Disallow: /cli/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /layouts/

Disallow: /libraries/

Disallow: /logs/

Disallow: /modules/

Disallow: /tmp/

Host: remontturbin.com.ua

Sitemap: http://remontturbin.com.ua/sitemap.xml

S
На сайте с 05.01.2013
Offline
40
#3

В броузере вы в один поток смотрите, а проги в сколько потоков жрут? Может хостинг слабенький?

[Удален]
#4
itconsult:
Дык, нет в robots Disallow корня... Во что есть, если ещё не посмотрели:

User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cli/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /tmp/
Host: remontturbin.com.ua
Sitemap: http://remontturbin.com.ua/sitemap.xml

Скрин не делал, но корень был в Disallow

+ какие-то комментарии в самом начале.

Вот сейчас вы это всё почистили. Всё равно 503 софт показывает?

DV
На сайте с 01.05.2010
Offline
644
#5

Скорее всего в nginx настроено limit_conn_zone, и поделом, чтобы не DDoS'или.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
SI
На сайте с 03.12.2007
Offline
130
#6
itconsult:
... Хотя, не сканируется и совершенно свежий сайт, в котором SEO ещё и "не пахло" - http://tenti-karkasi.com.ua/

$ curl http://tenti-karkasi.com.ua/robots.txt


# If the Joomla site is installed within a folder such as at
# e.g. www.example.com/joomla/ the robots.txt file MUST be
# moved to the site root at e.g. www.example.com/robots.txt
# AND the joomla folder name MUST be prefixed to the disallowed
# path, e.g. the Disallow rule for the /administrator/ folder
# MUST be changed to read Disallow: /joomla/administrator/
#
# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/orig.html
#
# For syntax checking, see:
# http://www.sxw.org.uk/computing/robots/check.html

User-agent: *
Disallow: /
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
-= Онлайн сервисы =-
[Удален]
#7

Тот самый robots.txt c запретом корня.

I
На сайте с 29.07.2015
Offline
2
#8
seogearbox:
В броузере вы в один поток смотрите, а проги в сколько потоков жрут?...

Проги жрать не успевают, так как сразу после старта выдают эрор. В настройках пробовал потоки уменьшать до 1-го, та же беда..

seogearbox:
...Может хостинг слабенький?

хостинг ukraine.com.ua, сижу на нём более пяти лет, постоянно радует своим развитием, ранее проблем не было. В панели управления хостингом - MySQL -> Медленные запросы - Медленные запросы не обнаружены. Там же нагрузка на web сервер, цитирую:

Запросы на сайт
Оранжевая линия отображает количество запросов статической информации, такой как картинки, видео, JavaScript, Flash и.т.д. Синяя - количество запросов для получения динамической информации, которая формируется скриптами PHP, Perl, Python. В большинстве случаев синяя линия отображает количество просмотренных страниц на вашем сайте. Обработкой статической информации занимается очень быстрый сервер nginx. Динамические страницы формируются с помощью сервер Apache, который умеет вызывать интерпретаторы языков программирования PHP, Perl и других. В статистику по нагрузке попадают только те запросы, которые проходят через сервер Apache. Если количество запросов на Apache составляет более 50% от количества запросов на nginx, то это говорит о возможных проблемах с сайтом. Такими проблемами могут быть: CMS, которые статическую информацию формируют через скрипты, слишком большая посещаемость вашего сайта роботами или же неправильные настройки виртуального хоста.

View Screen Capture" />

Скрины вроде не страшные )

[Удален]
#9
itconsult:
Проги жрать не успевают, так как сразу после старта выдают эрор. В настройках пробовал потоки уменьшать до 1-го, та же беда..

хостинг ukraine.com.ua, сижу на нём более пяти лет, постоянно радует своим развитием, ранее проблем не было. В панели управления хостингом - MySQL -> Медленные запросы - Медленные запросы не обнаружены. Там же нагрузка на web сервер, цитирую:

View Screen Capture" />
Скрины вроде не страшные )

Роботс кривой, хостинг не при чем :)

Уберите Disalow: / и взлетит сразу.

На этот раз скрин: http://ipic.su/img/img7/fs/image.1438195156.jpg

I
На сайте с 29.07.2015
Offline
2
#10
Topvisor:
Скрин не делал, но корень был в Disallow
+ какие-то комментарии в самом начале.

ничё не чистил на изначално проблемном сайте - remontturbin.com.ua

robots как был так и остался.

Topvisor:
Вот сейчас вы это всё почистили. Всё равно 503 софт показывает?

503, проверил - так как решения пока нет.

---------- Добавлено 29.07.2015 в 20:49 ----------

ребята, читаем вместе моё сообщение

Хочу просканировать один из своих сайтов (remontturbin.com.ua) программами Xenu и Screaming Frog. Но при запуске сканера, SF сразу выдает error 503, а Xenu - temporarily overloaded..

Все остальные сайты как дополнение к решению.

Сайт http://tenti-karkasi.com.ua намеренно закрыт от индексации, так как сайт молодой, слеплен на скорую руку и не уникальный.

Смотрите robots сайта remontturbin.com.ua !!!! там нет Disallow корня!!!

---------- Добавлено 29.07.2015 в 20:52 ----------

Topvisor:
Роботс кривой, хостинг не при чем :)

Уберите Disalow: / и взлетит сразу.
На этот раз скрин: http://ipic.su/img/img7/fs/image.1438195156.jpg

Специально убрал Disallow / из robots http://tenti-karkasi.com.ua - не взлетел!!

---------- Добавлено 29.07.2015 в 20:55 ----------

DenisVS:
Скорее всего в nginx настроено limit_conn_zone, и поделом, чтобы не DDoS'или.

А как это определить? Беседа по душам с хостером?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий