- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Отсортировал, но в лоб не пойму что мне с этим делать
в общем чуда не случилось, сортировка по расстоянию разбрасывает эти элементы в разные места, совсем не рядом, но делает это быстро :)
http://stackoverflow.com/questions/9703762/libpuzzle-indexing-millions-of-pictures
решена почти аналогичная проблема, суть в том чтобы сигнатуру бить на слова и хранить эти слова (это "законно" с точки зрения автора либы), т.е. откуда даже с помощью бд, можно найти похожие картинки, т.к. некоторые слова будут идентичны, это то, что я успел понять из ссылки выше
Я понял, мне нужно создать еще одну базу. Разделить это на слова и потом искать схожесть по этим словам. База конечно будет не хило весить :)
Я понял, мне нужно создать еще одну базу. Разделить это на слова и потом искать схожесть по этим словам. База конечно будет не хило весить
попробуйте, только наверное не базу, а 1-2 таблицы
попробуйте, только наверное не базу, а 1-2 таблицы
я просто выразился не совсем верно :)
я просто выразился не совсем верно
ок, только пишите как идут дела, надо добить задачу.
ок, только пишите как идут дела, надо добить задачу.
Ну я чуток выпил уже, так что завтра продолжу.
Долго делал различные способы.
Создал все по методу http://stackoverflow.com/questions/9...ns-of-pictures
Есть сигнатуры, есть сигнатуры разделенные на слова.
Как теперь сделать запрос mysql на выборку похожих ?
К примеру имеем переменную с сигнатурой
$sig = "сигнатура"
Прочитал все сообщения и ничего не понял. Начну писать, а вы подправьте.
Насколько понимаю, нужно просто найти дубли, не повесив сервер. Моя лень заставляет считать себя новичком в php. Главное поймите суть и укажите, если концепция не в ту степь.
Чтобы сэкономить ресурсы, делать будем в несколько проходов, с каждым разом уменьшая количество строк при выборке.
1. В таблицу добавим поле дата_месяц (d0901).
2. Таблицу с сигнатурами назовем sig
3. Первый элемент, по которому будем сверять, его id будет прописан совпадениям для группировки.
4. После прохождения каждого запроса обновляем страницу и повторяем действия ранее. С каждым разом количество полей сокращается, т.к. есть условие выбрать с пустым полем d0901.
$ids=$_SESSION[ids]; // здесь будем хранить id групп. Дописать substr последней запятой.
$res=mysql_query("SELECT * FROM sig WHERE `d0901`='' AND `id` NOT IN ($ids) LIMIT 1"); о переменной $ids позже
$row=mysql_fetch_assoc($res); // взяли элемент для сравнения.
$res2=mysql_query("SELECT * FROM sig WHERE `d0901`=''"); //
while ($row2=mysql_fetch_assoc($res2)) {
if ($row2[sig]==$row[sig]) {$res3=mysql_query("UPDATE sig SET d0901='$row[id]' WHERE id='$row2[id]'");} // если есть совпадение, запишем id группы. Группа - id элемента $row[id], первого запроса в начале скрипта
}
$res4=mysql_query("UPDATE sig SET d0901='$row[id]' WHERE id='$row[id]'"); //
$_SESSION[ids]=.','.$row[id];
// сделать редирект на ту же страницу
}
Гонять по всем новостям конечно же геморойно, как вариант посмотрите в сторону функции PHP из коробки:
http://php.net/similar_text
---------- Добавлено 10.01.2015 в 02:57 ----------
Еще есть статья на хабре об алгоритме поиска не явных дубликатов:
http://habrahabr.ru/post/65944/
---------- Добавлено 10.01.2015 в 03:02 ----------
Есть вариант еще круче, он уже без PHP совсем:
http://stackoverflow.com/questions/9870913/php-mysql-select-where-similar-textx