Установил "Максимальное кол-во одновр. загружаемых страниц" на 1. Ничего не изменилось, осталось прежнее количество ошибок.
Сегодня начал проверять тексты и опять на каждом тексте море ошибок (10 - 15 шт.):
[11:54:12] Возникла ошибка при загрузке страницы из запроса №13-2 (5046 миллисек.): ( Не удается прочитать данные из транспортного соединения: Соединение разорвано. )
[11:54:18] Возникла ошибка при загрузке страницы из запроса №10-1 (12406 миллисек.): ( Не удается прочитать данные из транспортного соединения: Соединение разорвано. )
С соединением всё отлично, скорость стабильно 40 мбит, только что проверял по speedtest.net - никаких проблем нет. Настройки программы за последнее время не менялись. В чем может быть проблема?
Сегодня при пакетной проверке каждого текста, вылетает очень много подобных ошибок. Что это значит? (по 3-7 подобных ошибок на тексты размером по 700 знаков)
[11:36:46] Возникла ошибка при загрузке страницы из запроса №10-3 (7234 миллисек.): ( Не удается прочитать данные из транспортного соединения: Соединение разорвано. )
[11:38:52] Возникла ошибка при загрузке страницы из запроса №46-1 (18609 миллисек.): ( Не удается прочитать данные из транспортного соединения: Соединение разорвано. )
Хорошо, понял, что лучше-бы оставить редирект навсегда.
Но, так и остался вопрос, какой вариант из двух верный?
Denis11036, От уменьшения страниц и увеличения таймаута, результат не меняется, уже проверял. Данные ошибки всё равно появляются в одинаковом количестве. (хоть 10 кол-во страниц ставлю, хоть 4).
Что эти 3 параметра нужно менять, я и сам знаю, только на результат это не оказывает влияния.
lesss, спрашиваю, потому что, возможно, такое количество ошибок абсолютно нормальное, и они ВСЕГДА будут присутствовать в проверках.
[13:38:08] Возникла ошибка при загрузке страницы из запроса №10-3 (44953 миллисек.): http://www.miniputy.ru/child_girl/age_9_12_year/catalog/ ( Время ожидания операции истекло. )
[13:49:30] Возникла ошибка при загрузке страницы из запроса №24-2 (40015 миллисек.): http://shalun24.ru/?menu=cat01_arh02.php ( Время ожидания операции истекло )
Когда проверяю страницы, которые не успели загрузиться, в 99% случаев они грузятся нормально и очень быстро. Вопрос: Почему тогда etxt пишет, что "Время ожидания операции истекло"? Специально, проверял доступность страниц в момент наступления данной ошибки, так что данные страницы абсолютно доступны.
Скорость интернета хорошая 40 mbit.
Настройки:
Таймаут для каждой странички - 40
Кол-во одновременно скачиваемых страниц - 10
P.S.
Таких ошибок в среднем 1-3 на проверяемый текст в 500 - 700 знаков.
Иногда, страницы выдающие ошибку имеют очень большое количество текста, но они спокойно загружаются за 1-5 секунд, а для каждой отдельной странички выделено аж 40 секунд!
superf,
На мой взгляд, такие страницы вредны тем, что:
1. Поисковые боты всё равно тратят на них определенную часть времени, в следствии чего, нормальным страницам остается меньше времени для сканирования.
2. Такие страницы могут попадать в индекс поисковых систем, а по сколько они не содержат фактически никакой информации, то это уж точно не прибавляет сайту балов в лице поисковых систем.
Так же, на эти страницы (если они попали в индекс) могут приходить пользователи, и тут же уходить с них - а это, в свою очередь ухудшает показатель поведенческого фактора.
3. Вполне вероятно, что на этих страницах title'ы, description, keywords могут совпадать с новыми страницами, что порождает своего рода дубли.
Вот, на мой взгляд, некоторые грешки, которые могут вызывать данные страницы.
Если Битрикс пишет в браузере "Элемент не найден" или "Каталог не существует" и т.п. - это еще не значит, что данные страницы выдают ошибку 404 (Not found).
Дело точно не в этих двух словах, дело в настройках Битрикс. Мой совет, обратитесь к программистам, которые у вас занимаются доработками по Битрикс, и они, настроят сервер на выдачу корректных заголовков ответов. (например, если страница не существует, выдавать ошибку 404)
Как вы уже верно подметили, данную надпись выдает Битрикс, но это совершенно не означат, что при этом сервером выдается ошибка 404 (Элемент не найден). Данная страница вполне нормально может отдавать ошибку 200 Ок - поэтому поисковики думают, что это обычная существующая страница.
Указанная вами страница http://www.svetoch34.ru/price/27/1512/index.php?SECTION_ID=1582&ELEMENT_ID=259623 как раз и возвращает 200 Ок.
1.Как вариант, можете определить у "старых" страниц общие присущие им параметры в url, и запретить данные страницы в Robots.txt
2.Либо, заказать программистам, чтобы на все старые адреса (уверен их тип можно определить и обобщить) выдавалась ошибка 404.
3.Либо, от обратного, чтобы на все адреса, кроме существующих сейчас на сайте, выдавалась бы 404 Not found. Как то так...
cska73, для начала почитайте:
/ru/forum/365295
/ru/forum/183081
http://devaka.ru/articles/seo-beginning
http://www.seowit.ru/
Из книг, можно начать с:
Видимость в интернете. (Шэри Тероу. ISBN 978-5-93286-141-7)
Продвижение сайта в поисковых системах. (И.Ашманов, А. Иванов. ISBN 978-5-8459-1155-1)
Думаю, после прочтения предложенной информации, вы уже сами поймете, где вам нужно углубить знания, что нужно подтянуть.
И, конечно же, не забывайте о практике - без этого никуда.
Самые известные программы для проверки уникальности текстов:
Etxt Антиплагиат (есть клиент, есть on-line проверка)
Advego Plagiatus (только клиент, устанавливается на ваш компьютер)
Можете также глянуть on-line сервис text.ru.