leo3331

leo3331
Рейтинг
154
Регистрация
07.01.2007

business-net, такая идея была в голове, но не хватило мозгов реализовать в реальность...

Очень-очень буду благодарен если объяснишь как реализовать такое :)

трое суток я так примерно сказал, я не проверял, обрубил....

Кароче мне больше отдыхать нужно....

я думал фишка в том что если

x = y на 4%

x = z на 4%

где x, y, z = 3 разных статьи

не факт что:

y = z на 4% и выше...

Из этого следует, что если хочу наибольшее кол-во статей на выходе... нужно удалить x, а не y и z

Я такую схему уже обдумывал... подумал что блин y и z статьи могут быть разных размеров и поэтому может и не быть 4% между ними... А тут если смотреть относительно x, то оно никак меньше не может быть 4 этих %

или это у меня тож уже мозги не работают )) ночь не спал блин

leo3331 добавил 07.11.2009 в 11:47

нада спать идти , вечер утра мудренее ))

leo3331 добавил 07.11.2009 в 11:52

нет, Ярик, твоя схема не катит, y и z могут быть похожи просто разными кусками текста с x, а между собой быть уникальными, во как я думал (c)

по сути эт я сморозил... я проверяю со всеми не провереными на дублит статьями...

а если сделать так:

1 с 2

затем эти 2 с третьей.... кароче по сути по ходу будут удаляться дубли... и меньше статей буит проверяться с каждой новой статьей

и в итоге чтобы уменьшить общее кол-во страниц.... брать и по 100 статей к примеру поразделять пачками и их между собой проверить так уменьшим общее кол-во страниц

falkhan, :) именно этот скрипт с этого сайта я и юзаю ;)

leo3331 добавил 07.11.2009 в 08:23

переделал чуток

Alexander123456:
Проверить сами файлы на дубликаты вначале. Искать по сочетанию "Duplicates remover" программ полно всяких, как платных и так и нет.

всмысле на 100% дубли? не понял....

Ярик, тебе отдельный респект, второй раз помог 🚬

leo3331 добавил 07.11.2009 в 07:36

Как вариант есть идея, проверить 3к статей между собой затем к ним добавить еще 3к не чищеных и уже каждую из очищеных сверять непосредственно с новыми статьями... таким способом обойдем очень много проверок не нужных....

leo3331 добавил 07.11.2009 в 07:41

хм, логично конечно же вторые 3к статей между собой тоже проверить перед проверкой двух таких пачек

xumukys:
Я же говорю не спамлю, ток по закладкам прогнал...

закладки это не спам?

BLACK_DANTE:
на форуме ленивому нубу

ахахаха Геракакл бля

leo3331 добавил 05.11.2009 в 22:31

Sefirim:
Пора уже говорить и потом с нубов сразу деньги сбривать. Да и не пойму ТСа, это же все так очевидно, к чему вопросы?

Я не работал кроме знакомства и адалта ни с какими тематиками...

Очевидное, для того, кто знает.... К примеру раньше доры банились, а щас норм живут и очивидно почему... тебе дор покажи если ты никогда с ним не работал ты скажешь почему он не в бане?

а "билеты" - это что за они? :)

Есть те кто не по адалту доры делает?

Дайте плз список тематик наилучших по объему трафика, которые можно слить на http://click-click.ru/

К примеру "знакомства"....... какие еще есть?

Всего: 656