Зачем им искать спамеров? Безперспективняк - гораздо проще взять за жопу скупщиков трафика. 🚬 Что в общем-то и происходит.
Да им пофиг на это мошенничество и пофиг на бабки пользователей, они тупо теряют аудиторию за счет постоянных взломов и надоедливого спама, а это уже их бабки. 🚬 Более того, постоянная война с массовыми взломами, латаниями дыр и чисткой - занимает массу времени, а время тоже деньги. ☝ Вот-так, вот.
😂 Мдя, редкостный бред. Что курил? 🚬 А каждый мужчина является насильником? :) Инструмент-то имеется... :D
«Зри в корень» © Козьма Петрович Прутков
Дорвеи это обыкновенный сайт - не больше, не меньше. Просто инструмент для привлечения трафика, цели могут быть разные. 🙅 Не нужно путать причины и следствия, а так-же теплое с мягким. 😂
С спамом vkontakte все несколько сложнее, спам фигня - там-же идет дикий и беспощадный лом аккаунтов, а это веселая статья с возможными вариациями.
Охренеть. И во сколько раз? 🚬 На автомате можно горы свернуть - главное правило залил, заспамил, забыл - причем для ру середину можно выкинуть - залил, забыл. Делай больше и кидай дальше. Сидеть и дрочить на пять дорвеев это мазохизм - руками надо нормальные сайты делать. ☝
Наши руки не для скуки. 😂 Лучший дорген это notepad.exe? И не заскучаешь? 😂😂😂
В общем я успешно запутался как ты там и чего в каком порядке будешь фильтровать. :) Спать хочу.
У меня схема вырисовывается такая,
1 проверяется со всеми, после проверки дубли нах (или пометить) потом 1 в папку проверено, дубли (если нужны) в папку дубли
Потом 2 проверяется, но база с чем проверяем меньше ;) 1(уже проверенной) там нет и дублей нет 🚬
Потом 3 проверяется, но база с чем проверяем меньше ;) 1 и 2 там нет и дублей нет...
И так далее.+++
Короче база с чем сравниваем с каждой проверкой все меньше и меньше. Дубли в дублях, проверенное в проверенном.
Я правильно просчитал? Одно и тоже по несколько раз дрюкаться не будет. ☝
p.s.
За трое суток много дублей зафильтровалось из 6к?
Ну как-то так. :) На пачки разбивать по размеру - кстати пачку статей можно пихать в один файл, по статье на строчку + array_unique() + и потом не задрачиваться - открыл, закрыл, записал - массивами оно веселее работается.
Перед чисткой на шинглы, явные дубли прибить - ибо нефиг! Искать одну херню в другой быстрее функцией strstr. И это - удалить переносы строк, лишние пробелы, пустые теги (если есть ;) ) Меньше лишней дряни, быстрее работа пойдет.
Это вычисление каждый раз происходит? Можно для начала втупую считать количество символов и если статья намного короче или длиннее нафига шингами сравнивать? 🚬
Как вариант отсортировать по весу, чтоб большое с мелким не сравнивалось. 🚬
Еще можно предварительную сверку по первым 5-10 словам бахнуть, чтоб отсеять явные дубли.
Кстати, под этот проект реально выделено много миллионов рублей и еще в начале лета за деньгами мало кто приходил, ну не верил никто в такую халяву. А сейчас даже очереди образовались. Но во многих регионах и городах лимиты на этот год вычерпали, продолжение банкета обещают на следующий год. :2cents:
Ну вобщем-то частично уже да. 🚬 По крайней мере по мелочам уже аккуратнее докапываются.
Вот недавно нарвались на штраф, (лесники чудили за перестройку бани в природоохранной зоне) но хитро в портоколе написали - начали писать - "в результате проверки", а потом переделали - "проезжали мимо и случайно увидили". То есть проверки не было, это они случайно запалили. 😂 Чтоб потом отписки не писать, никаких проверок - штатная работа. 🚬
Нет, не кредит - отчитываться надо в течении года-полутора (платить налоги) - если все ок. (работа пошла в рамках б.п.) то возвращать не надо.
Сумма 60 т.р. как раз сумма пособия безработному за год - короче чтоб не держать на шее пачку дармоедов надеются, что хоть частично занять народ предпренимательством. 🚬
Дают на все подряд - клетки кроликам, оцифровку видеокассет, швейные машинки. Получить не сложно, откаты не берут.
Пивасик зачетный. 🍻 Это Крым 2006 - кураж-байрам. Девушка тоже в теме, жена дорвейщика. 😂
Во, покатушки дорвейщиков и домик где тусовались дорвейщики. 🚬
:)