Опа! То, что нужно. Спасибо.
Как всё хитро спрятано. :)
Весьма наивный вывод. ;)
Я бы сделал так - если один и тот же фрагмент из книги одинаково распознают хотябы 2 пользователя - можно считать фрагмент верным. Иначе возможен существенный процент ошибок и опечаток.
Как я понял, предлагается 2 каптчи - одна для проверки, с известным результатом; и в случае верного распознавания первой, принимается результат второй, без заведомо-известного результата, т.е. фрагмента из книги.
PS: сама идея использования сёрферов в качестве каптча-распознавателей не нова. :) Слышл даже прикол на умаксе про монетизацию CH-трафа. :D
Вообщем да, саппорт - молодцы. Еслиб не пришлось дублировать письмо из емэйла - было бы вообще замечательно.
Самый кривой ВДС из всех, что мне пришлось повстречать.
GCC и make отсутствуют в стандартной поставке ПО; но это, казалось бы, не беда - бери и ставь всё из репозиториев без лишней мороки. Беда в том, что yum в стандартной поставке вообще не работает, выдавая какие-то кривые ошибки.
Решил вопрос с саппортом, но осталось неприятное впечатление от потраченного времени.
Я конечно извиняюсь за возможную резкость высказывания.
Но по-моему такое резюме...
...годится только для секретарши :) (судя по всему, акцент на дизайне не делается, так что фотошоп не шибко красит картину).
Почти... Если DOM не использовать - могут всплыть некоторые подводные камни...
У меня есть готовый, отточенный тестами, php-скрипт, с заданием глубины парсинга страниц, с переходом по HTTP-редиректам, приведением русских тайтлов к единой кодировке и фильтром пропускаемых URL'ов по вхождению строки (например - расширению).
Могу скинуть линку на тему с отзывом заказчика (писался в качестве тестового задания, но доработки из моих идей) и сделать тестовый парсинг.
За полтиник зелёных отдам. :)
Поскольку php-скрипт будет работать с удалённого сервера - не вижу особого резона в экономии трафика.
Но, если Вам нужно выкачивать гигабайты тайтлов в день :) - могу дописать модуль для обработки страниц в gzip.
Саппорт оказывается ответил (что-то невнятное), но почему-то на мэйловском ящике через POP3, позавчерашние письма отобразились только сейчас...
Они там шутят чтоли? Какой адалт? Там обычные знакомства были, объявления по которым в Рамблере показываются на ура (по кею, вообще никак не связанным с сексом)... Удалил и пересоздал одну из компаний вчера - на этот раз она заработала.
Похоже, легче пересоздавать идентичные компании по несколько раз, нежели пытаться общаться с саппортом.
Вот так некомпетентные модераторы бегуна пожирают наше время и нервы...
Ничего кроме источников не ограничено.
Нет. Пробовал.
Иногда её вообще нет, но даже когда она есть - моего объявления нет.
А иногда, даже когда по запросу в Рамблере есть объявления конкурентов, по ссылке "все объявления" вообще выдаёт "Извините, нет объявлений."
-=Tex=-, смотрю в выдаче Рамблера, т.к. в источниках - только поисковые системы.
Места - многие на первом. Некоторые чуть ниже. Конкуренции особой по тем запросам нет. Геотаргетинг отключён, поэтому IP не имеет значение.