Кей Коллектор или СловоЕб(но только с вордстата)
А вы пробовали ПОДУМАТЬ?
Да ладно, зачем обучать, просто просто поделись деньгами, за 15 лет можно было насобирать на пару островов в Средиземном море 😂
Ну так возьми и проанализируй те сайты.
- Если контент не уник, то значит просто стырили с другого сайта
- Если контент уник, но не читаемый, то нагенерированный.
- Если уник и читаемый, то либо сами писали, либо наняли рабов.
Насчёт того как задампить контент в цмс, то тут уже насколько хватит вашего полёта мысли
- Можете сами написать конвертер/парсер
- Можете использовать готовые решения например Zerber(сам не пробовал)
- Можете использовать макросы типо зенопостера
Насчёт ТИЦ и RP, то их не обязательно самому поднимать. Сейчас вполне реально перехватить жирный дроп.
Есть программа для разборки морфологии(стимер).
https://tech.yandex.ru/mystem/
Но вот чтобы сама правила морфологию, это в ряд ли. По каким признакам она должна ориентироваться? Как программа решит морфология какого слова правильная?
Да и если задуматься... Если, есть возможность строить морфологически согласованные предложения, почему бы гугл не сделал это?
Без проблем, нанимаешь программиста, он тебе используя SOAP пишет свой дорген или допиливает существующий. Только вопрос в том, будет ли это целесообразно. Дор это большое кол-во страницы, чем сложнее двиг, тем больше требуется ресурсов, умножь это на кол-во доров и получишь приличные затраты финансов и времени на развёртывание.
А что значит выстрелит дор? Сегодня он выстрелил, завтра закатался... Стоит ли заморачиваться?
Ну если вдруг, у тебя получится ОООЧЕНЬ качественный дор к которому не будет санкция, берёшь Content Downloader или любой другой парсер, парсишь свой дор и загоняешь в какую хочешь CMS.
Верно:) Правда галка стояла, просто профиль пандоры не сохранил.
Просто вы не пытаетесь найти позитивные стороны.
1)Выгребая мусорный трафик, дорвейщики поставляют дополнительные лиды партнёрками, цпа, магазинам и т.д. Помогая кому-то выживать, а кому-то развиваться. Развивающиеся цпс, партнёрки и магазины, привлекают в сеть новых инвесторов.
2)Подливая дополнительных лидов, снижается конкуренция и стоимость лида. Казалось бы, а что в этом хорошего. А то, что некоторые инвест проекты, которые были не рентабельные или находились на гране рентабильности, становятся рентабельными, значит инвесторы охотнее вливают деньги.
3)Так же, создавая дополнительную конкуренцию, заставляют весмастеров занимающихся белой оптемизацией, шевелиться и улучшать свои сайты.
TopperHarley, Спасибо, не заметил! Не могли бы вы ещё уточнить, у меня почему-то в пакетном режиме, в отдельных папках не создаётся проект хрумера, только в общей папке.
Пробовал включит опцию DisablePackSelfLogs=1, не помогло.---------- Добавлено 31.03.2015 в 17:10 ----------
Наоборот при больших размерах БД, включают ХТМЛ кеширование(ну или мемкеш если кешировать не много), тем более вы на платном хостинге, заплатите на 50р больше и пользуйтесь SSD жескими.
Ну как вариант, если вам очень хочется загнать пандору в sql, можно нагенерировать шаблоны с разметкой например:
<!-- [BLOCCONTENT] -->Тут содержимое для сохранения в БД<!-- [/BLOCCONTENT] -->
Потом проходите скриптом по шаблонам, парсите эту разметку и дампите в sql.
А дальше делаете index.php и .htaccess для вывода.
Если бы не "лига зла", рунет бы до сих пор существовал в состоянии зародыша.
На одних энтузиастах далеко не уедешь. Нет монетизации -> нет желания создавать -> мало сервисов завлекающих пользователей и скорее всего не качественные из-за низкой конкуренции -> нечего делать в интернете -> маленькая аудитория -> нет смысла инвестировать -> нет монетизации.
Так, что нет худа без добра ☝