- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Поиск по сайту и поиск по похожих, это две разные вещи!
Ну давайте ещё раз что ли повторю: поиск по сайту уже есть, уже работает, уже настроен. Качество поиска устраивает. Вы создаёте проблему там, где её нет от слова вообще.
Вам тогда вообще никакой дополнительный модуль не нужен, всё у вас уже есть: просто обязуете контентщика проверять свой тайтл через имеющийся поиск. Если поиск хорошо настроен, он уже должен выдавать схожие материалы, причем отсортированные по убыванию схожести. Ну, или если поиск не годен, доработайте прежде поиск, а потом при желании на сохранение документа повесьте обработчик события с проверкой схожести через простой запрос к имеющемуся поиску.
В вашем случае нормального решения "из коробки" быть не может, но решение может быть простым, если у вас действительно поиск уже нормально настроен на ВАШ контент.
---------- Добавлено 31.07.2018 в 11:15 ----------
Т.е. после ввода тайтла контентщиком или при сохранении документа обработчик должен посылать в сфинкс запрос типа: "Какой то тайтл"~5, где 5 - количество допустимых перестановок слов, плюс к тому настроить параметр грязи (т.е. сколько слов или какую долю можно опустить), а потом высвечивать контентщику окошко с результатами. Т.е. вам нужно лишь в форме редактирования документа реализовать дополнительное взаимодействие с поиском. Это уже несколько иное ТЗ.
просто обязуете контентщика проверять свой тайтл через имеющийся поиск
Всё, что рассчитано на человеческую надёжность - не надёжно :)
Это уже несколько иное ТЗ.
Да это вообще не было ТЗ с самого начала. Я очень сильно удивлён, что если эта фича и есть готовая, то она не шибко известна. Т.е. я был уверен, что запостю тему и знающие битриксоиды ткнут меня в пяток решений. Т.е. я прям в шоке 🍿
Если дела обстоят именно так, то, походу, реально придётся писать ТЗ, ну и там уже думать про критерии похожести, свистелки и колокольчики.
toxic steel, определение схожести всегда было нетривиальной задачей, особенно на больших объемах данных. Решений может быть множество - от примитивных до очень сложных, плюс к тому решение зависит от ваших требований и специфики данных. Например, если вы захотите считать схожими фразы типа "Где подстричь пуделя" и "Выбор парикмахерской для собаки", то решение простым не будет и тем более не будет решения "из коробки".
"Где подстричь пуделя" и "Выбор парикмахерской для собаки"
Да нет же, мне тупая совершенно похожесть нужна, бывает в ленте подряд идёт несколько новостей с заголовками, отличными в 1-2 слова. Ну как тут было в примере:
Сергей Собянин поздравил московских метростроевцев.
Сергей Собянин поздравил работников МВД.
Сергей Собянин поздравил студентов.
Сергей Собянин поздравил коммунальщиков.
Сергей Собянин поздравил москвичей и гостей столицы.
И так подряд несколько штук.
Вот пусть контентщик синонимы перебирает: " Сергей Собянин" - "Мэр Москвы", "Градоначальник" и т.д.
Опять же - это варнинг для человека, а не запрет на публикацию. При ложном срабатывании его можно просто проигнорировать. Я имел дело с простыми, топорными решениями на других CMSках и нет никаких проблем, чуда они не делают, но польза очень даже есть.
Да нет же, мне тупая совершенно похожесть нужна
В вашем случае наверно всё же лучше и проще сфинкс использовать, коль он уже имеется. После набора тайтла идет запрос к сфинксу и результат публикуется в окошке. Как-то так.