_Apbeiten30_, вы собрались делать дорвейщика из чьего-то клона ? :)
Все, думаю, на отзывы взял достаточно, тем более что это пока просто для себя. Постараюсь по-быстрому все сделать. Постерок, скиньте в лс тематику и/или оригинал.
Веб, точнее сканер cureit! и у меня на компе видит в проге троян. На вирустотале файл проверяют 37 разных антивирусов, и нахождение вируса одним только вебом скорее позволяет предположить глюк самого веба, нежели несостоятельность всех остальных антивирусов. И еще, я тут погуглил, тоже глюк с этим трояном, вирлаб определил ложное срабатывание. Короче, не вижу повода для беспокойств.
Закинул архив на вирустотал, один только др.веб нашел BackDoor.Click.origin, все остальные показали, что архив чист. Думаю, или веб глючит, или это апофеоз паранои его разработчиков.
Раз пишет Not Found, значит работает, просто такого файла нет, теперь просто скидывай нужные скрипты в www-директорию и запускай.
Да... неприятная ситуация. Для узконишевых тематик 20 страниц, конечно, хватит, но для более популярных ниш нч остаются недоступными... :шожеделать: :(
VertrigoServ - аналог денвера, устанавливается в три клика, далее скидываем скрипты в директорию www и запускаем - что сложного ?
Vertrigo Serv попробуйте, тоже хорошая сборка.
С таймаутом в 20 сек парсит нормально :) "Стоп-слова" я удаляю прогой секатор, удаляя все латинские символы.
В проге кейвордкипер удаляем строки, содержащие слова с корнем "дет", "дец" и т.п.
Спасибо за парсер, если не затруднит - добавьте, пожалуйста, возможность ставить ограничение "от" и "до" на количество запросов.