Список фраз, как убрать уточнения?

Ч
На сайте с 16.12.2010
Offline
345
1057

Привет!

Есть список фраз:

зеленый крокодил

зеленый и вкусный крокодил

крокодил зеленый и большой

зеленый крокодил секреты приготовления

Надо оставить только зеленый крокодил, как общее для всех фраз.

Чем можно это сделать?

[Удален]
#1
Четверьг:
Привет!
Есть список фраз:
зеленый крокодил
зеленый и вкусный крокодил
крокодил зеленый и большой
зеленый крокодил секреты приготовления

Надо оставить только зеленый крокодил, как общее для всех фраз.

Чем можно это сделать?

Можно так попробовать

http://www.youtube.com/watch?v=Gv_q6mbdEe8

PS После того как фильтр применился, нажал Enter :)

Ч
На сайте с 16.12.2010
Offline
345
#2

Topvisor, приветствую, пользуюсь вашим сервисом для съема позиций!

ПРоделал эту манипуляцию, но не получается:

во- первых, вашим методом надо фильтровать по общей маске- зеленый крокодил. Но, мы то не знаем, что она общая, нам как раз это и надо выяснить.

Во- вторых, порядок слов. Такой метод оставляет фразу "крокодил зеленый и большой". А она нам не нужна, т.к. при парсинге вордстата она и так вылезет по сбору фраз по фразе зеленый крокодил.

Или я что-то не так делаю?

ПС: в КейКоллекторе тоже как-то не понял как такое можно сделать.

[Удален]
#3
Четверьг:
Topvisor, приветствую, пользуюсь вашим сервисом для съема позиций!

ПРоделал эту манипуляцию, но не получается:
во- первых, вашим методом надо фильтровать по общей маске- зеленый крокодил. Но, мы то не знаем, что она общая, нам как раз это и надо выяснить.

Во- вторых, порядок слов. Такой метод оставляет фразу "крокодил зеленый и большой". А она нам не нужна, т.к. при парсинге вордстата она и так вылезет по сбору фраз по фразе зеленый крокодил.

Или я что-то не так делаю?

ПС: в КейКоллекторе тоже как-то не понял как такое можно сделать.

Я не совсем понимаю логику.

У нас как раз таки и предусмотрен учет порядка слов, чтоб не убрать лишнего во время фильтрации.

+ у нас нельзя задать условия для получения данных из любого источнка (Вордстат, Adwords).

Вы сразу получаете все результаты и работаете с ними.

И да, если

Есть список фраз:
зеленый крокодил
зеленый и вкусный крокодил
крокодил зеленый и большой
зеленый крокодил секреты приготовления

Надо оставить только зеленый крокодил, как общее для всех фраз.

Убираете одну фразу "зеленый крокодил" и всё тогда.

Всё просто.

Возможно это я усложняю :)

Ч
На сайте с 16.12.2010
Offline
345
#4
Topvisor:
Убираете одну фразу "зеленый крокодил" и всё тогда.

Так ее как раз надо оставить, а остальные убрать. Зеленый крокодил- более общая фраза, чем остальнве. Вот она мне и нужна.

А убрать надо уточнения.

ФРазы пересекаются между собой, в том виде, как я написал в стартпосте.

Мне надо выбрать более общие фразы. Те, которые присутствуют во всех других фразах.

[Удален]
#5
Четверьг:
Так ее как раз надо оставить, а остальные убрать. Зеленый крокодил- более общая фраза, чем остальнве. Вот она мне и нужна.
А убрать надо уточнения.

ФРазы пересекаются между собой, в том виде, как я написал в стартпосте.
Мне надо выбрать более общие фразы. Те, которые присутствуют во всех других фразах.

На столе лежит шесть красных яблок и одно зеленое.

Вы хотите убрать красные яблоки и оставить одно зеленое.

А я предложил вам отделить зеленое от красных.

Отделяете от красных зеленое яблоко и у вас

Четверьг:
Зеленый крокодил- более общая фраза, чем остальнве. Вот она мне и нужна.

только зеленое и останется.

А уточнения

Четверьг:
А убрать надо уточнения.

будут лежать в другой корзине.

Ч
На сайте с 16.12.2010
Offline
345
#6

Блин, может, конечно, я туплю или мы о разных вещах говорим, но в видяхе вы забиваете фразу "зеленый крокодил", как маску для фильтрации.

Но, прикол в том, что имея большой массив разных фраз (где не только зеленый крокодил, но и красный бегемот, и шестокрылый шишкотряс и куча других фраз), вы заранее не знаете, по какой именно фразе надо фильтровать.

Надо автоматически вычленить общие фразы и дать их как результат выборки.

ПС: пока выяснял, вопрос уже стал неактуальным, но мало ли на будущее опять понадобиться такое...

Объясню, зачем это было надо.

Собирали мне выборку из Пастуова по фразам. Изначально у меня список был такой:

зеленый крокодил
зеленый и вкусный крокодил
крокодил зеленый и большой
зеленый крокодил секреты приготовления

Но, зачем парсить фразы:

зеленый и вкусный крокодил
крокодил зеленый и большой
зеленый крокодил секреты приготовления,

если парсинг фразы:

зеленый крокодил

и так выдаст все оставшиеся фразы с участием базовой, т.е. получится лишняя работа.

А в ТЗ было много фраз, не только про крокодила, поэтому вручную их группировать- не рационально.

[Удален]
#7
А в ТЗ было много фраз, не только про крокодила, поэтому вручную их группировать- не рационально.

Теперь понятно. Я думал у вас только крокодил :)

MIND
На сайте с 08.03.2007
Offline
238
#8

Четверьг, дайте больше примеров исходных фраз в личку. Попробуем прислать Вам результат, если получится.

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
Ч
На сайте с 16.12.2010
Offline
345
#9

MIND, отправил.

Нужен не результат, а метод, сервис такой обработки.

!FrykT
На сайте с 14.05.2007
Offline
120
#10

У меня есть самописный PHP-класс для поиска таких вхождений (с учетом морфологии с помощью mystem или phpMorphy), могу дописать скрипт (под требования в первом посте) за небольшую плату. Класс позволяет искать различные вхождения, в т.ч. и с перестановкой слов местами, может не учитывать предлоги, союзы и т.д.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий