Как приводить ключи к единому морфологическому виду?

[Удален]

11 февраля 2014, 18:10

1190

Подготавливая ключи для директа столкнулся с проблемой.

Ключи:

телефон nokia

и

телефоны nokia

для директа видятся как одинаковые.

Каким софтом (сервисом) можно привести все ключи к единому виду? В данном случае (телефоны nokia) привести к виду (телефон nokia).

ЖБ

56

Жека Базаров

11 февраля 2014, 20:00

#1

Встречный вопрос: а зачем это делать?

Мой ответ: это лишнее.

Если для использования в шаблонах, то нормально читается и так, и этак.

Создание рекламных компаний () Яндекс.Директ, Google.AdWords, Бегун С Новым Годом! (/ru/forum/577775) с новыми клиентами

160

promomaniac

12 февраля 2014, 11:12

#2

При использовании ключа "телефон nokia" показы будут и по "телефоны nokia", если не стоят дополнительные правила, например, кавычки.

Меня смущает, что колода плохо перетасована, но лишь до тех пор, пока мне не придет хорошая карта. © Джонатан Свифт.

210

Масяня

12 февраля 2014, 13:21

#3

promomaniac:
При использовании ключа "телефон nokia" показы будут и по "телефоны nokia", если не стоят дополнительные правила, например, кавычки

Учите матчасть!

Оператор " " (кавычки). Позволяет учитывать в подсчете показы только по этому слову (фразе) и всем его словоформам, и не учитывать показы по запросам, содержащим словосочетание с заданным словом.
http://help.yandex.ru/direct/?id=990419

и на всякий случай:

Словоформа
Словоформа, термин, обозначающий конкретное слово в конкретной грамматической форме. Например "городов" — С. родительного падежа множественного числа существительного "город". Всякая грамматическая парадигма слова есть система его С., и в реальных высказываниях всякое слово, относящееся к грамматически изменяемым (см. Словоизменение), выступает в определённой С. В советском языкознании теория С. разрабатывалась А. И. Смирницким, развивавшим взгляды Ф. Ф. Фортунатова, А. М. Пешковского, В. А. Богородицкого. Он различал в содержательной структуре С. три момента: индивидуализирующий (лексический), выражаемый корнем слова, типовой (конкретно-грамматический) и собственно формальный (обобщённая грамматическая форма), выражаемые, например, окончанием в С. "городов".
http://slovari.yandex.ru/словоформа/БСЭ/Словоформа/

1

Яндекс-Директ. Ручная работа. (http://skyboom.ru/price.php)

160

promomaniac

12 февраля 2014, 15:18

#4

Масяня, да, вы правы. Кавычки не исключают словоформы.

[Удален]

12 февраля 2014, 17:58

#5

Видимо не правильно сформулировал вопрос или непонятна задача.

Есть собранные ключи. Среди которых есть - для примера возьмем (телефон nokia и телефоны nokia). Все эти ключи экспортом пойдут в директ через xls. Но зачем мне два объявления в которых будут одинаковые ключи. Двойные ковычки не причем, а с оператором "!" пользоваться не планирую. Вывод, нужно такие дубли убрать, вопрос, каким софтом это можно сделать?

Добавление и уточнение ключевых Передача идентификаторов фраз в Яндекс.Директ вводит расширенный формат

QM

177

q_metainfo

12 февраля 2014, 20:30

#6

Специализированного софта не знаю. В принципе, можно было написать парсер c использованием библиотеки типа phpmorphy, если вы надеетесь, что ложных срабатываний не будет и все словоформы распознаются корректно.

Либо (как вариант) взять старый добрый эксель, отсортировать по алфавиту все ключи - и глазками просмотреть все соседние ячейки (телефон нокия и телефоны нокия будут в соседних строках).

Неудобно, да (особенно на большом количестве слов). Да, нужно будет написать формулу, которая вырежет подстроку начиная со второго (третьего, четвёртого) слова.

Весьма рекомендую посмотреть на объём работы и подумать, нужна ли вообще автоматизация и не будет ли быстрее ручками сделать:

13 Excel-граблей, на которые Как устроены поисковые системы Поиск поддоменов сайта в

210

Масяня

12 февраля 2014, 21:44

#7

q_metainfo:
Либо (как вариант) взять старый добрый эксель, отсортировать по алфавиту все ключи - и глазками просмотреть все соседние ячейки (телефон нокия и телефоны нокия будут в соседних строках).
Неудобно, да (особенно на большом количестве слов). Да, нужно будет написать формулу, которая вырежет подстроку начиная со второго (третьего, четвёртого) слова.

Еще вариант - берем старый добрый эксель, автозаменой меняем "телефоны" на "телефон", потом удаляем дубликаты (Раздел Данные). Сработает, если много однотипных запросов, типа телефон сони - телефоны сони, телефон нокия - телефоны нокия... А если запросы совсем разные (игрушка - игрушки, кубик - кубики, кукла - куклы), то ой:(

Третий вариант, если запросов не очень много (около ста, скажем), то загоняем их в прогнозатор Директа, он сам лишние склеит и оставит один запрос.

Если запросов много, то используем симбиоз варианта 1 и варианта 3. Т.е. в экселе сортируем запросы по алфавиту, чтобы словоформы одного запроса оказались рядом в списке, и засовываем в прогнозатор кусками.

2

Максимальный охват семантики Раскрутка интернет-магазина Не верю в толк

[Удален]

13 февраля 2014, 05:40

#8

Руками не вариант. Объемы большие, даже на "перечитать разок" уйдет много времени, а править еще сложней. Тем более будут не просто кукла, куклы, а кукольный, кукольная, кукольные....

Кому интересно.

Нашел софт - mystem приводит все словоформы к исходному виду, довольно удобно.

Группировщик ключевых слов для Новая партнерская программа Яндекса А тот ли трафик

Что делать, если ваша email-рассылка попала в спам

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов