Новая, уникальная программа для перелинковки сайта и проверки площадок

E1
На сайте с 26.05.2010
Offline
69
#1241
Kostushko:

В программе должен быть массив в котором хранятся текущие не загруженные страницы - нужно всего-то сосчитать количество этих страниц и вывести. Если они в одном массиве то это что-то типа count(array_url) и всего-то, если массив более сложный то добавится пара-тройка строк кода. В общем, то что я прощу абсолютно реально, просто и быстро реализуемо - если вы считаете что это не так - попытайтесь понять о чем я говорю.

На самом деле в программе нет подобного массива. Обход ссылок осуществляется рекурсивно, и поэтому программа "не знает" длины очереди. Нашла ссылку - прошла по ней если ее еще нет в базе и так пока не обойдет всю глубину вложенности.

Возможно именно из-за этого возникают "глюки" при большом объеме страниц на сайте или большой вложенности (/page1/page2/page3/page4/page5/page6/.../pageN). Во второй версии мы полностью изменили алгоритм обхода сайта, поэтому там такая функция реальна и в конечном итоге будет реализована.

Программа настройки перелинковки сайта: купить на сайте (http://www.page-weight.ru/).
L!mur
На сайте с 26.06.2006
Offline
176
#1242

exp131 конец месяца ноября - что там с обещаниями выпустить к этому моменту новую версию?

10'000 руб/сутки на SEDv4 «MobyDick»! (/ru/forum/comment/12653555) Нужен трафик? Купи «SED» (http://www.sedv4.ru) 5'000 руб/сутки на SEDv3 (/ru/forum/comment/11641425) Для работы с Twitter только TwiFarmv3! (/ru/forum/839117)
Sterh
На сайте с 15.06.2006
Offline
226
#1243
L!mur:
exp131 конец месяца ноября - что там с обещаниями выпустить к этому моменту новую версию?

Парсер готов. Сейчас решаем некоторые технические нюансы. Если и дальше все пойдет по плану, то к 20-м числам декабря выпустим парсер и маленький модуль тех. анализа в закрытое бета-тестирование (будет доступен только покупателям текущей версии).

Модуль перелинковки обрастает все новыми и новыми наворотами, поэтому его выпустим уже ближе к концу января следующего года, как раз, когда будут выловлены и исправлены баги парсера (если таковые найдутся).

Программа для настройки внутренней перелинковки сайта: купить (http://www.page-weight.ru/) Проверка внешних ссылок на сайт (https://backlink.page-weight.ru) (когда Ахрефс дорого) Возьму на продвижение пару магазинов, & SEO консультации (/ru/forum/987866) для сложных случаев.
L!mur
На сайте с 26.06.2006
Offline
176
#1244

Sterh то есть новые обещания и перенос еще на несколько месяцев... :)

A
На сайте с 18.12.2009
Offline
98
#1245
1. нафига качать эти картинки-страницы, если и так же понятно что это именно картинка и на ней не будет никаких ссылок ни внешних ни внутренних?
Sterh:
1. А это кому как. Кто считает, что не нужно подобные ссылки и страницы обрабатывать - закрывает их в настройках

я спросил именно нафига КАЧАТЬ?

я не против, что нужно ОБРАБАТЫВАТЬ такие страницы-картинки. ведь если вес сайта на неё утекает, то надо об этом знать и что-то по этому поводу думать

но зачем же ЗАКАЧИВАТЬ картинку из интернета (тратится время и трафик), если заведомо известно что со страницы-картинки ТОЧНО никаких ссылок уже не будет???

QComment (http://qcomment.ru/ref/303810) лучший сервис для отзывов, лайков, комментариев
J
На сайте с 06.04.2011
Offline
82
#1246
Sterh:


Почему как бы? Ссылка на страницу есть, урл страницы есть - значит это и есть страничка.



1. А это кому как. Кто считает, что не нужно подобные ссылки и страницы обрабатывать - закрывает их в настройках. Кому нужно - не закрывает.
2. Поставить другой скрипт, что бы не было конструкции <a href>

А подскажите, как правильно закрыть такие конструкции <a href> с картинкой, чтоб вес зря не уходил неизвестно куда? Если в роботсе запретить индексацию картинки, это решит проблему утечки веса?

L
На сайте с 25.11.2011
Offline
13
#1247

Подскажите, программа определяет "ссылки относительно текущего документа"?

Прогнал сайт через программу и похоже, что все относительные ссылки вида "../bb.html" попали в "битые" с описанием ошибки "Исключение во время запроса WebClient." Т.е считаются ссылки только вида "/aa/bb.html", а ссылки вида "../bb.html" в ошибках.

Получается, что для сайтов, где урлы ссылок имеют неполный адрес программа бесполезна? Или, что-то можно настроить?

Sterh
На сайте с 15.06.2006
Offline
226
#1248
Jigo:
А подскажите, как правильно закрыть такие конструкции <a href> с картинкой, чтоб вес зря не уходил неизвестно куда? Если в роботсе запретить индексацию картинки, это решит проблему утечки веса?

Через ява-скрипт или XML Закрытие в роботс не поможет.

legora:
Подскажите, программа определяет "ссылки относительно текущего документа"?
Прогнал сайт через программу и похоже, что все относительные ссылки вида "../bb.html" попали в "битые" с описанием ошибки "Исключение во время запроса WebClient." Т.е считаются ссылки только вида "/aa/bb.html", а ссылки вида "../bb.html" в ошибках.
Получается, что для сайтов, где урлы ссылок имеют неполный адрес программа бесполезна? Или, что-то можно настроить?

Исключение во время запроса WebClient. - это сервер отбивает. Установите паузу между запросами при парсинге.

MoMM
На сайте с 16.06.2006
Offline
727
#1249

>1000, закрываю

ТС может начать новую "серию".

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий