_Nic_, вас не только рамблер банит, но и яндекс, причины то в другом...
Не красиво себя так вести.
http://www.nicwebn.com/2007/06/08/addurl-yandex/#comments
_Nic_, и как они могли попасть в Бан если они были не проиндексированы, что то это похоже больше на чёрный пиар, мы с Вами сегодня общались в icq судя по всему, от туда то всё и пошло, вообщем жду ваших обьяснений.
_Nic_, укажите Ваш email и wmid.
не помню от Вас никакой покупки, так же я готов предоставить код любому человеку понимающему в php с хорошей репутацией - аддурл значит бан?
Artisan, Вы уверены что у заказчика найдутся деньги на такой парсинг? :) Давайте не будем бросаться в крайности а приведём реальные примеры.
Artisan, И?
в чём проблемы?
Парсер выдачи гугла в чём проблемы?
Artisan, Не говорите глупостей пожалуйсто.
Если хватило место под сайт почему не хватит места для того что бы его распарсить?
Я сталкивался со всякими вариантами, в день я обрабатываю 5000 новостей, определяю дубликаты выделяю главные новости, обсчитываю функцию популярности для персонажей по частоте их упоминаймости и представьте себе мои скрипты работают на виртуальных хостингах, я продумал их и на этом форуме и на других и они работают.
Что бы не быть голословным приведите мне пример сайта который по Вашему мнению не может быть слит в мою БД.
edogs, готов выполнить Вашу работу по переносу.
Artisan, Аргументируйте.
Коль пошла такая пьянка, раскрою тему до конца.
Написан парсер, доставать могу всё что угодно целыми сайтами.
Есть уже готовые базы(Праздники, исторический даты, имена, сонники, новости, рецепты, музыкальные архивы, база яндекс.маркета с картинками т.д.)
Есть готовые работы, есть примеры сайтов которые работают полностью на парсерах.
P.S. Из лучших работ - база яндекс.маркета - почти 2 млн. записей.
База mp3fun - со всеми жанрами исполнителями альбомами и обложками альбомов.
Кому интересно - в личку.
humbert, распарсю - слово-то какое.
Регулярными выражениями? - Индекс как поддерживаете актуальным?
P.S. У самого все проекты написаны на парсерах, тупо интересуюсь.