firacet

firacet
Рейтинг
68
Регистрация
23.07.2008

То что ПСы могу определить дубликаты картинок это понятно, а вот интересно что они подумают при анализе вот этих картинок, насколько они идентичны, на ваш взгляд?

Спасибо!

Очень, для меня, интересное обсуждение получается.

fromnull:
А как скрипт генерирует картинки?

Скрипт генерирует с помощью GDlib,

использую множество вариантов, точки, линии, круги, на каждей стадии свое размытие, заливки итд.. тоесть случайность довольно большая.

А насчет того, что ПС определяет дубли картинок, так это уже давно так и есть, определяет.

Насчет того - влияет ли это на выдачу или нет, трудно сказать, необходимо проводить много "чистых" экспериментов, лучше уж подстраховаться, ведь скрипт которые нарисует уник. картинку не так уж и трудно написать.

aktuba:
Ну его не сложно написать. Хоть десктопный, хоть серверный...

Насчет серверной я сильно сомневаюсь в скорости обработки ПХП, да и у меня есть наборы своих скриптов которые позволяют делать выборки, чистить и сортировать данные, но очень хотелось бы иметь некое переложение которое позволит делать это все БЫСТРО и что-бы на выходе получалась хорошая, чистая база по которой сразу можно генерит сами знаете что.

Тоесть я более склоняюсь к тому, чтобы иметь некий десктопный продукт, который бы работал с базовой, ну к примеру firebird как олсабмитер.

За фронтенд годов заплатить или обменяться на собраную базу.

В качестве примера, очень подходит фронтенд к базе постухова к которому докрутить некоторые фильры, алгоритмы которых я смогу предоставить. После них получаеться очень хорошо чищенная база тематических кеев.

Сам на десктопных языках не програмлю, только на серверных, пхп перл итд.

Может есть смысл написать обработчик данных на си и к нему приписать управление на PHP, тогда думаю скорость должна быть на высоте.

В базе уже 25 000 000 уникальных кусских кеев, есть предложения по фронтенду как у Пастухова?

Ну если кому надо, могу сделать выборки по вашим словам, как будет свободное время. Только чистить не буду, просто выборку уникальных ключевиков.

Вообщем если хотите, пишите что надо ( только не много - 2,3 основных ключевиков ), так-же скажите с кол-во минимальную частотность и надо ли эту частотность вам в txt сохранять.

Чего, никому не нужны уже 14 000 000 кеев?

Люди, сори что не совсем в тему, вообщем есть база рус. кеев, 11 086 763 уников, лежит в mysql содержит частотность.

Самому делать к ней фронтенд все никаки руки не доходят, может у кого-то есть готовое решение, проги или скрипты, которые бы позволили оперативно делать выборки, чистить, сортировать итд... ? С меня база с вас фронтэнд.

Для себя сделал приметивненькие скриптики, но очень уж не удобно, хотелось бы AllInOne

Со своей стороны еще могу подогнать отличный скрипт (алгоритм) для чистки кеев, с большой базой ненужных( адалт) слов.

Если есть что предложить, пишите в личку.

Вот выборка по самым частотным запросам :)


id;key;count;date
9497483;"порно";903260;"2008-12-02"
9539086;"секс";170148;"2008-12-02"
612173;"пластиковые окна";161421;"2008-11-10"
3647748;"погода";156799;"2008-11-13"
5980268;"знакомства";151533;"2008-11-14"
3955134;"порно фото";146801;"2008-11-13"
9921715;"одноклассники.ру";145688;"2008-12-02"
3698551;"игры";140300;"2008-11-13"
3808883;"музыка";140290;"2008-11-13"
10068157;"сонник";135689;"2008-12-02"
2163978;"эротика";129503;"2008-11-11"
1813389;"работа";98276;"2008-11-11"
980887;"дом 2";92951;"2008-11-11"
236486;"из рук в руки";75694;"2008-11-10"
9497484;"бесплатное порно";67908;"2008-12-02"
3955135;"фото";64551;"2008-11-13"
4838190;"картинки";63559;"2008-11-13"
3634169;"порно видео";63016;"2008-11-13"
8336244;"гороскоп";62056;"2008-11-16"

Спасибо и еще раз сори.

Готов предоставить трафик.

Укажите стоимость 1к и кол-во трафика которое готовы выкупать?

Вот как раз завалялся парольчик на летитбит: 680929173

На здоровье ;)

http://advertix.ru/key.txt

Вот немного чищеных НЧ кеев.

Решили все таки и самому доров поделать? 🍻

Всего: 588