Раз ссылка есть - значит будет считаться. Или закройте картинки в настройках в исключениях.
А непонятки - как раз из-за "лишних" ссылок. А вообще вес страницы зависит от количества и качества входящих ссылок, а не исходящих. Т.е. с самой "весомой" страницы может и 100 ссылок уходить.
Через ява-скрипт или XML Закрытие в роботс не поможет.
Исключение во время запроса WebClient. - это сервер отбивает. Установите паузу между запросами при парсинге.
Парсер готов. Сейчас решаем некоторые технические нюансы. Если и дальше все пойдет по плану, то к 20-м числам декабря выпустим парсер и маленький модуль тех. анализа в закрытое бета-тестирование (будет доступен только покупателям текущей версии).
Модуль перелинковки обрастает все новыми и новыми наворотами, поэтому его выпустим уже ближе к концу января следующего года, как раз, когда будут выловлены и исправлены баги парсера (если таковые найдутся).
Единичка - вес страницы по умолчанию. Т.е. сам факт наличия страницы дает ей вес, равный 1.
Другой вопрос, если ссылок 0, то как она их нашла :)
Роботс глючный, увы, не всегда корректно обрабатывает исключения. Поэтому исключения лучше забивать в настройках.
<a class="highslide" onclick="return hs.expand(this)" href="images/foto/kupalniki-panache1676.jpg"><img src="images/foto/small/kupalniki-panache1676.jpg" /></a>
Почему как бы? Ссылка на страницу есть, урл страницы есть - значит это и есть страничка.
1. А это кому как. Кто считает, что не нужно подобные ссылки и страницы обрабатывать - закрывает их в настройках. Кому нужно - не закрывает.
2. Поставить другой скрипт, что бы не было конструкции <a href>
2 Kostushko
Я вас понял... посмотрим, может что и придумаем. Мысль действительно интересная.
С чего это вдруг это одна и та же страничка? Разные УРЛы - разные страницы. Если они 100% совпадают, то это дубликат. И ПС их не склеивают, а записывают в очередь на АГС.
Программа эти страницы будет считать как разные страницы
То, что Вы просите сделать не реально. У программы нет конечного списка страниц. На каждой странице могут быть новые ссылки, которые еще не учитывались.
Однако если Вы знаете количество страниц на сайте, то можно это количество сравнить с отображаемым в процессе парсинга - тогда будет ясно, сколько еще осталось.
2 uipi Ваши вопросы звучат примерно так:
1) Хочу поехать отдыхать. В какую сумму мне это обойдется?
2) Насколько хорошо я отдохну, и как оценить степень отдохнутости?
3) На сколько долго мне хватит накопленной отдохнутости?
А почему её нет, знаете?
Как уже ответил Str256 - цифры как таковые значения не имеют. Они лишь иллюстрируют как распределяется сес по сайту и в каких пропорциях.
Если говорить очень грубо, то цена вырастет раза в два. Но там будет несколько иные принципы формирования стоимости софта для пользователя.
Но опять же повторюсь:
Каждому покупателю текущей версии будет предоставлена скидка в размере её текущей стоимости (600 руб.). И при выходе второй версии нужно будет только доплатить разницу.
Фактически да.. собственно отсюда и куча разговоров о том, закрывать или не закрывать меню, как правильно закрывать и т.д.
Тут еще вопрос целесообразности перелинковки. На маленьких сайтах, гду в меню включены ссылки на все страницы, можно особо и не заморачиваться.
Чем больше по объему сайт - тем больший эффект будет от перелинковки.
Нет, демки нету.
Картинки и прочее я обычно закрываю в настройках... возможно не правильно, но вот еще со старых времен отпечаталось в голове, что по картинке вес не передается... На счет doc, pdf - не знаю и врать не буду :)
Она берет все ссылки, просто потом удаляет дубли. Есть мнение (спорное отчасти), что две одинковых ссылки (УРЛа) с одной страницы не берутся, а берется только одна, первая по коду.