- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В общем стоит передо мной следующая задача. Имеются тексты объемом 200 - 20000 знаков. Требуется поставить в соответствие каждому тексту некий хэш, таким образом, чтобы если тексты отличаются несущественно, то есть количеством пробелов, запятыми, порядком нескольких слов или наличием нескольких слов, то хэш был бы одинаковым.
Как это можно сделать?
попробуй с помощью http://www.php.net/similar_text
думаю что поможет, в свое время я имена пользователей при регистрации сверял, чтобы спам отбить )
Попарное сравнение делать нельзя. Слишком много текстов. Нужен именно хэш.
Синглы юзай.
удалено ога!
Где-нить тут: http://yandex.ru/yandsearch?text=%F8%E8%ED%E3%EB%FB&clid=14002&yasoft=barff
спасибо :)
шинглами или супершинглом весьма просто, как сказал Miha Kuzmin (KMY)
у Яндекса на сайте есть хорошая информация - http://company.yandex.ru/articles/
Где-нить тут: http://yandex.ru/yandsearch?text=%F8...2&yasoft=barff
шинглами или супершинглом весьма просто, как сказал Miha Kuzmin (KMY)
у Яндекса на сайте есть хорошая информация - http://company.yandex.ru/articles/
Большое спасибо!