Нужна фича для Битрикса: "уже есть статья с похожим названием"

12
toxic steel
На сайте с 28.12.2007
Offline
175
1289

Коллеги, нужен плагин для Битрикса, который при публикации новости/статьи на сайте выводил бы варнинг для контентщика, что на сайте уже есть статья/новость с похожим названием и ему надо придумать другое.

Есть отличные, недорогие рекламные места на агрофоруме (http://farmerforum.ru/viewtopic.php?t=1725)! Клуб истинных ценителей денег (http://coinshunter.ru/).
_
На сайте с 24.03.2008
Offline
381
#1

Отличная идея... "похожесть" как планируете определять :) ?

toxic steel
На сайте с 28.12.2007
Offline
175
#2

А как вы обычно определяете что одно название похоже на другое? Там есть одинаковые слова, думается?

Мне не нужно заумное решение, просто варнинг для контентщика. Когда идёт событийная лента, часто новости выходят с практически идентичными названиями, хочется больше разнообразия.

Даже для старенького phpBB была такая фича 🍿

S
На сайте с 30.09.2016
Offline
469
#3
toxic steel:
А как вы обычно определяете что одно название похоже на другое? Там есть одинаковые слова, думается?

Например:

Сергей Собянин поздравил московских метростроевцев.

Сергей Собянин поздравил работников МВД.

Московских метростроевцев пригласили в Кремль.

Работники МВД провели обыски у московских метростроевцев.

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.
toxic steel
На сайте с 28.12.2007
Offline
175
#4

И?

Я не очень понимаю что вы хотите мне этим показать/доказать.

Для любой практически CMSки есть модули (а для большинства и не по одному) показа похожих новостей на самой странице новости. Например.

Не смущает?

Почему тогда тот же подбор похожих новостей аджаксом при вводе названия новости вас смущает?

В Битриксе есть Сфинкс, ну вот пусть он и думает какая из новостей похожа. По сути это поиск по сайту с набором ключевых слов, где область поиска ограничена только названиями публикаций.

_
На сайте с 24.03.2008
Offline
381
#5
toxic steel:
И?

И чё из этого по вашему мнению должно быть похожим, а что нет? И почему...

---------- Добавлено 30.07.2018 в 13:10 ----------

toxic steel:

В Битриксе есть Сфинкс, ну вот пусть он и думает какая из новостей похожа. По сути это поиск по сайту с набором ключевых слов, где область поиска ограничена только названиями публикаций.

В чём тогда ваша проблема ?

Неужели допилить в битрикс в одно места одну проверку столь непросто ?

toxic steel
На сайте с 28.12.2007
Offline
175
#6
И чё из этого по вашему мнению должно быть похожим, а что нет? И почему...

Я уже ответил на этот вопрос. Есть Сфинкс, качество поиска по сайту на основе Сфинкса в рамках этой задачи меня вполне устроит.

_SP_:
Неужели допилить в битрикс в одно места одну проверку столь непросто ?

Я не битриксоид от слова совсем. На знакомой мне CMS я бы допилил. Скорее всего, знал бы название модуля, или запилил бы свой.

Спасибо, что апаете тему, но я не понимаю ваш неконструктивный скепсис. Выглядит так, как будто я ракету в космос на Битриксе отправить решил.

B
На сайте с 13.02.2008
Offline
262
#7

toxic steel, вам, кстати, правильно указали на расплывчатость термина "схожесть". Вам прежде всего необходимо определить критерии схожести. Без этого нет смысла что-либо обсуждать.

Далее... сфинкс? И это просто? Честно говоря с финксом не работал, но работал с эластиксёрч. Там сотни взаимосвязанных параметров, настройка такого монстра - это весьма нетривиальная задача. Но повторюсь, пока неопределены требования к схожести, нет предмета обсуждения. Может быть вам какая-нибудь частотность важна или наоборот мешает, может быть у вас какой-нибудь словарь ключевых слов и фраз есть, усиливающих сигналы (а может быть его только предстоит создать?)... и т.д. и т.п.

Но это для большого объема. Для малого количества материалов и при минимальных требованиях наверно можно и "мешком слов" обойтись без всяких сфинксов.

---------- Добавлено 30.07.2018 в 22:49 ----------

Sitealert:
Например:
Сергей Собянин поздравил московских метростроевцев.
Сергей Собянин поздравил работников МВД.
Московских метростроевцев пригласили в Кремль.
Работники МВД провели обыски у московских метростроевцев.

Да просто всё :)

Пропускаем заголовки и базу фактов через нейронную сеть, выявляем семантические связи, т.е. строим математические семантические модели, потом определяем их схожесть... если модели схожи, выдаем предупреждение... Математический аппарат выношу за скобки...

S
На сайте с 30.09.2016
Offline
469
#8
toxic steel:
Для любой практически CMSки есть модули (а для большинства и не по одному) показа похожих новостей на самой странице новости. Например.
Не смущает?

Не смущает. Это совсем другое. Для этого существует механизм ключевых слов, так называемых тегов. И они совершенно не обязательно связаны с заголовками. И обычно вообще не связаны. Статья может называться "Утро в лесу", и речь там может идти про туристов или про жизнь медведицы с медвежатами. Соответственно в "похожих новостях" она будет показываться по прописанным тегам "туризм" или "дикие звери".

toxic steel
На сайте с 28.12.2007
Offline
175
#9
borisd:

Далее... сфинкс? И это просто? Честно говоря с финксом не работал, но работал с эластиксёрч. Там сотни взаимосвязанных параметров, настройка такого монстра - это весьма нетривиальная задача. Но повторюсь, пока неопределены требования к схожести, нет предмета обсуждения. Может быть вам какая-нибудь частотность важна или наоборот мешает, может быть у вас какой-нибудь словарь ключевых слов и фраз есть, усиливающих сигналы (а может быть его только предстоит создать?)... и т.д. и т.п.

Ну я в общем то привык, что на старте любая задача по Битриксу сначала превращается в проблему.

Ну давайте ещё раз что ли повторю: поиск по сайту уже есть, уже работает, уже настроен. Качество поиска устраивает. Вы создаёте проблему там, где её нет от слова вообще.

Не смущает. Это совсем другое. Для этого существует механизм ключевых слов, так называемых тегов.

Есть отличная фраза: "если у вас в руках только молоток, то любая задача - это гвоздь". Отлично сюда подходит.

Вы сформулировали предложение таким образом, что как будто бы утверждаете, что описанный вами способ реализации - единственно возможный. К счастью, это не так. Вывод записей по тегам и подбор похожих через поиск - это два возможных варианта решения. Способ, про который вы говорите - абсолютно точно не единственный.

Psionik
На сайте с 16.04.2013
Offline
44
#10
toxic steel:
Ну я в общем то привык, что на старте любая задача по Битриксу сначала превращается в проблему.

Ну давайте ещё раз что ли повторю: поиск по сайту уже есть, уже работает, уже настроен. Качество поиска устраивает. Вы создаёте проблему там, где её нет от слова вообще.

Любая задача превращается в проблему, если она сформулирована(поставлена) никак. Поиск по сайту и поиск по похожих, это две разные вещи! Отрицая это, вы сами создаёте проблему, сливая работу одного механизма под все случаии.

toxic steel:

Есть отличная фраза: "если у вас в руках только молоток, то любая задача - это гвоздь". Отлично сюда подходит.

Куда уместней "Нужно отличать палец от жопы";

[PHP, MYSQL, JS, BASH, APACHE, HTML, CSS, Yii, MODX, 500 rur hour]
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий