business-net, такая идея была в голове, но не хватило мозгов реализовать в реальность...
Очень-очень буду благодарен если объяснишь как реализовать такое :)
трое суток я так примерно сказал, я не проверял, обрубил....
Кароче мне больше отдыхать нужно....
я думал фишка в том что если
x = y на 4%
x = z на 4%
где x, y, z = 3 разных статьи
не факт что:
y = z на 4% и выше...
Из этого следует, что если хочу наибольшее кол-во статей на выходе... нужно удалить x, а не y и z
Я такую схему уже обдумывал... подумал что блин y и z статьи могут быть разных размеров и поэтому может и не быть 4% между ними... А тут если смотреть относительно x, то оно никак меньше не может быть 4 этих %
или это у меня тож уже мозги не работают )) ночь не спал блин
leo3331 добавил 07.11.2009 в 11:47
нада спать идти , вечер утра мудренее ))
leo3331 добавил 07.11.2009 в 11:52
нет, Ярик, твоя схема не катит, y и z могут быть похожи просто разными кусками текста с x, а между собой быть уникальными, во как я думал (c)
по сути эт я сморозил... я проверяю со всеми не провереными на дублит статьями...
а если сделать так:
1 с 2
затем эти 2 с третьей.... кароче по сути по ходу будут удаляться дубли... и меньше статей буит проверяться с каждой новой статьей
и в итоге чтобы уменьшить общее кол-во страниц.... брать и по 100 статей к примеру поразделять пачками и их между собой проверить так уменьшим общее кол-во страниц
falkhan, :) именно этот скрипт с этого сайта я и юзаю ;)
leo3331 добавил 07.11.2009 в 08:23
переделал чуток
всмысле на 100% дубли? не понял....
Ярик, тебе отдельный респект, второй раз помог 🚬
leo3331 добавил 07.11.2009 в 07:36
Как вариант есть идея, проверить 3к статей между собой затем к ним добавить еще 3к не чищеных и уже каждую из очищеных сверять непосредственно с новыми статьями... таким способом обойдем очень много проверок не нужных....
leo3331 добавил 07.11.2009 в 07:41
хм, логично конечно же вторые 3к статей между собой тоже проверить перед проверкой двух таких пачек
закладки это не спам?
ахахаха Геракакл бля
leo3331 добавил 05.11.2009 в 22:31
Я не работал кроме знакомства и адалта ни с какими тематиками...
Очевидное, для того, кто знает.... К примеру раньше доры банились, а щас норм живут и очивидно почему... тебе дор покажи если ты никогда с ним не работал ты скажешь почему он не в бане?
а "билеты" - это что за они? :)
Есть те кто не по адалту доры делает?
Дайте плз список тематик наилучших по объему трафика, которые можно слить на http://click-click.ru/
К примеру "знакомства"....... какие еще есть?