Очень правильная мысль!
Кстати, отпадает проблема прокси серверов, которые не поддерживают POST запросы.
Он лучше всего работает как дор под гуглю :). Шучу. Но в каждой шутке есть доля шутки.
Тут надо сделать поправку на то, что я живу в Украине, как следствие к гуглу больше внимания... А вот для индексации в гугле или перенаправления трафика с гугла на нужный сайт лучше всего работает вонг - наверное как самый трастовый для Гоши. Но это опять-же глазами браконьера... все зависит от методов работы, под одни методы лучше один сервис, под другие - другой.
Разница есть. Особенно когда есть гора неуникальных элементов и будет гора уникальных, значение которых мы предсказать не можем.
Впрочем мой пост сводился больше к тому, что если нужен чистенький текст - то нужно затачивать под конкретный сайт/сайты - не будут универсальные решения красиво работать.
По поводу алгоритма толкового под универсальный парсер - я уверен что даже если его спалят, то ТС просто не сможет его реализовать.
А чего тема в дорвееводстве-то?
Если ТС сплог хочет - то этого валом и читабильность там совершенно не обязательна.
Если нужна читабельность и красиво выдранные статьи , то это не в дорвееводство писать надо :). Тогда лучше почитать про регулярки.
Незабываем о том, что сапу в последнее время сильно таращило. Если код был установлен стандартными методами, то вполне возможен вылет сайта из-за часто лежащих диспенсеров сапы. Сайт при этом тупит 6 секунд, соответственно вечно торопящийся яшко считает что сайт лежит.
Опробовал работу с tor. В принципе все работает, вот только назвать это работой язык не поднимается - это больше на СЕО ананизм похоже. В общем смысла в этом не вижу. Если юзать прокси, то серьезные - с гарантированной скорость и не спаленные в инете...
Хм, оно-то, конечно, да, особо ежели... но вот интересно как повел бы себя Вонг при подобном поведении Макса :). А Вонг сейчас самый мерзкий и , пожалуй, самый нужный сервис. а как повел бы себя Вонг я в принципе представляю :)
Это я поленился язык переключить :)
https://www.torproject.org/
В чем приятность - в качестве проксей выступают юзерские машины.
Что это дает по сравнению с обычными прокси, которых за пол часа можно напарсить ведро? Не исключено, что точно так-же парсят эти прокси и сервисы класса вонга. Конечно банить юзера по признаку "он зашел через прокси" никто не станет, но начислить за это штрафных баллов могут.... При достижении определенного порога штрафных баллов - бан юзера.
Только чур параноиком не обзывать :).
Важно принципиальное согласие :).
Если при тестах постинга через ТОР все пройдет нормально, то проверки для модулей я сделаю - у меня они готовы, надо только отшлифовать . Важно чтоб не пришлось после каждого апдейта Закладочника их перекраивать :).
Отдохнул хорошо... одно плохо - сейчас немогу заставить себя работать :-( .
З.Ы.
Заглянул в пару акков мистера Вонга, в которые постил по своей схеме 3 недели назад - все живы, все нормально... правда в них всего 1-2 ссылки.
Думаю тактика должна быть несколько иной.
Регистрировать аккаунты нужно через ТОР, тут-же под тем-же ИП активировать и постить. ТОРом менять ип ("Использовать другой ним") и повторять всю операцию (по необходимости).
Частая смена ИПов например при регистрации один, при активации другой, при постинге третий нежелательна.
Постинг с одних и тех-же ИПов нежелателен. Использование бесплатных проксей нежелательно :).
Вот только никак не соберусь проверить связку Закладочник+ТОР. Но я сделаю над собой усилие :) обещаю :)
BrokenBrake, в свете возможной необходимости пользования прокси весьма желательно достоверно определяnm запостилось сообщение или нет. Заготовку под это дело я в коде видел, понимаю почему это отключено... но может сделать эту опцию задаваемой через конфиг файл? Хотите знать достоверно - напишите true , хотите побыстрей - оставьте false ...
Ссылки с гавноанкорами есть везде. И будут они ровно до тех пор, пока есть гавнооптимизаторы.
Большой плюс ксапы в том, что модерацию не пройдут доры. ИМХО по последствиям для сайта-донора ссылка на дор на порядок хуже чем ссылка с гавноанкором.
Очень жду от сапы фарма списка стоп слов, но не уверен что дождусь. Так что пополняю потихоньку ручками.
Вообще-то кспа это не тупой клон другой биржи (как стало популярно в последнее время). В ней есть свои фишечки.
Дя ВМ это продажа внутренних дальше УВ3. Ведь очень мало СДЛ с 4800 страниц до УВ3 :).
Хорошо это или плохо, а также о качестве реализации можно спорить долго, но суть не в том.
Она просто другая :).