Найти и удалить запросы, которые являются частью другого запроса

P
На сайте с 03.09.2014
Offline
19
689

Всем привет.

Вожусь несколько часов уже с огромным семантическим ядром.

Отфильтровать одинаковые запросы (купить окна, окна купить) в кей колллекторе просто, это да.

Подскажите пожалуйста, кто знает, как найти и почистить фразы, которые входят полностью в другие фразы:popcorn:

например есть фразы:

купить синих слонов москва доставка

купить слонов москва

купить слонов

Фразы "купить слонов москва" и "купить слонов" полностью входят в фразу "купить синих слонов москва доставка". Мне надо что бы осталась только "купить синих слонов москва доставка".

Вроде бы понятно объяснил:rolleyes:

Спасибо всем кто откликнется:)

Яндекс не Тимошка, видит немножко.
YaanGle
На сайте с 06.09.2011
Offline
155
#1

А если в запрос является частью другого, но слова в нём в другом порядке?

Можно попробовать так:

1. Запросы копируем в эксель.

2. Задаем функцию, которая для каждого запроса будет искать его вхождение в общем массиве по маске, и выводить в ячейке напротив запроса итоговое количество совпадений.

3. Сортируем запросы по полученному столбцу - все, у кого количество >1 удаляем.

:)

P
На сайте с 03.09.2014
Offline
19
#2
YaanGle:
А если в запрос является частью другого, но слова в нём в другом порядке?

Можно попробовать так:
1. Запросы копируем в эксель.
2. Задаем функцию, которая для каждого запроса будет искать его вхождение в общем массиве по маске, и выводить в ячейке напротив запроса итоговое количество совпадений.
3. Сортируем запросы по полученному столбцу - все, у кого количество >1 удаляем.

:)

с пунктом №2 надо разобраться😂

Stripe
На сайте с 05.09.2006
Offline
222
#3
Сайты от 30р почти по любой теме или наполнение ваших сайтов (/ru/forum/887821) дешевым контентом. Базы товаров и контента (http://nakovalnja.ru). Вечные ссылки за 1$ или 30р. (/ru/forum/741397)
P
На сайте с 03.09.2014
Offline
19
#4

Программа полезная, раньше не натыкался. Спасибо!

Почитал возможности, пока не могу понять как с её помощью решить мою задачу😕

GM
На сайте с 17.09.2012
Offline
64
#5

алгоритм шинглов

Теперь наша партнерская программа приватная (/ru/forum/836186)
M0
На сайте с 24.07.2009
Offline
192
#6

Notepad++

Строки -> Сортировка по ...

вроде поможет немного упростить задачу

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий