Да, продаю. Условия в самом первом посте - кошелек и сумма та же :)
Не секрет - не знаю ;) Сейчас заняты другим. Как только закончим, вернемся к программе (есть наработки, но они заморожены).
ЗЫ: на большом проекте в ручную моделировать все равно хлопотно...
Нет такой приблуды. Т.к. схему можно нарисовать (и разобраться в ней), когда страниц 20-30 на сайте... ну до ста при упертости. Если страниц больше, то схема начинает напоминать клубок ниток, и толк от неё стремиться к нулю.
Это не трудно. В списке изменений значится ;)
Это недоработка. Удалять действительно лучше обе ссылки.
Мыло мне в личку напомните - вышлю обновление.
Просто удалите программу и распакуйте вновь из архива.
Еще раз хочу напомнить:
Программа не предназначена для больших сайтов!!! Она просто их не спарсит или зависнет при обсчете.
Очень часто кол-во страниц на сайте определяют по индексу Яндекса или Гугля. Но наиболее реальное количество страниц сайта показывает Рамблер - он жрет все, как и программа. И если Яндекс может показывать порядка 1500 страниц, то Рамблер десятки тысяч для одного и того же сайта.
Все время забываем подправить "Ссылко" :)
Если картинка стоит как элемент дизайна, т.е. просто как img src, то ничего никуда не утекает. Если картинка оформлена как ссылка, т.е. заключена ы <a href>, то естественно потечет.
Я считаю, что два одинаковых УРЛа будут "клеятся", т.е. считаться как один. При чем независимо от анкора. Просто поставьте себя на место парсера. Идет он по страничке, собирает УРЛы, тут ему попадается тот, который уже был - так зачем его в базу писать? Только место занимать.
Опять же, принцип рекомендации. Я могу сказать, что дядя Вася хороший жестянщик один раз и этого будет достаточно. Могу сказать это десять раз - но дядя Вася от этого в десять раз лучше не станет.
Ну и третий аргумент - человеческое восприятие (хотя это мое имхо). Если с одной страницы ведут на другую несколько ссылок, пусть и с разными анкорами, я воспринимаю это как спам. Возможно, разработчики алгоритмов тоже так считают :)