Как приводить ключи к единому морфологическому виду?

[Удален]
1162

Подготавливая ключи для директа столкнулся с проблемой.

Ключи:

телефон nokia

и

телефоны nokia

для директа видятся как одинаковые.

Каким софтом (сервисом) можно привести все ключи к единому виду? В данном случае (телефоны nokia) привести к виду (телефон nokia).

ЖБ
На сайте с 19.11.2008
Offline
56
#1

Встречный вопрос: а зачем это делать?

Мой ответ: это лишнее.

Если для использования в шаблонах, то нормально читается и так, и этак.

Создание рекламных компаний () Яндекс.Директ, Google.AdWords, Бегун С Новым Годом! (/ru/forum/577775) с новыми клиентами
promomaniac
На сайте с 10.03.2011
Offline
160
#2

При использовании ключа "телефон nokia" показы будут и по "телефоны nokia", если не стоят дополнительные правила, например, кавычки.

Меня смущает, что колода плохо перетасована, но лишь до тех пор, пока мне не придет хорошая карта. © Джонатан Свифт.
Масяня
На сайте с 16.06.2005
Offline
210
#3
promomaniac:
При использовании ключа "телефон nokia" показы будут и по "телефоны nokia", если не стоят дополнительные правила, например, кавычки

Учите матчасть!

Оператор " " (кавычки). Позволяет учитывать в подсчете показы только по этому слову (фразе) и всем его словоформам, и не учитывать показы по запросам, содержащим словосочетание с заданным словом.
http://help.yandex.ru/direct/?id=990419

и на всякий случай:

Словоформа
Словоформа, термин, обозначающий конкретное слово в конкретной грамматической форме. Например "городов" — С. родительного падежа множественного числа существительного "город". Всякая грамматическая парадигма слова есть система его С., и в реальных высказываниях всякое слово, относящееся к грамматически изменяемым (см. Словоизменение), выступает в определённой С. В советском языкознании теория С. разрабатывалась А. И. Смирницким, развивавшим взгляды Ф. Ф. Фортунатова, А. М. Пешковского, В. А. Богородицкого. Он различал в содержательной структуре С. три момента: индивидуализирующий (лексический), выражаемый корнем слова, типовой (конкретно-грамматический) и собственно формальный (обобщённая грамматическая форма), выражаемые, например, окончанием в С. "городов".
http://slovari.yandex.ru/словоформа/БСЭ/Словоформа/
Яндекс-Директ. Ручная работа. (http://skyboom.ru/price.php)
promomaniac
На сайте с 10.03.2011
Offline
160
#4

Масяня, да, вы правы. Кавычки не исключают словоформы.

[Удален]
#5

Видимо не правильно сформулировал вопрос или непонятна задача.

Есть собранные ключи. Среди которых есть - для примера возьмем (телефон nokia и телефоны nokia). Все эти ключи экспортом пойдут в директ через xls. Но зачем мне два объявления в которых будут одинаковые ключи. Двойные ковычки не причем, а с оператором "!" пользоваться не планирую. Вывод, нужно такие дубли убрать, вопрос, каким софтом это можно сделать?

QM
На сайте с 25.01.2010
Offline
177
#6

Специализированного софта не знаю. В принципе, можно было написать парсер c использованием библиотеки типа phpmorphy, если вы надеетесь, что ложных срабатываний не будет и все словоформы распознаются корректно.

Либо (как вариант) взять старый добрый эксель, отсортировать по алфавиту все ключи - и глазками просмотреть все соседние ячейки (телефон нокия и телефоны нокия будут в соседних строках).

Неудобно, да (особенно на большом количестве слов). Да, нужно будет написать формулу, которая вырежет подстроку начиная со второго (третьего, четвёртого) слова.

Весьма рекомендую посмотреть на объём работы и подумать, нужна ли вообще автоматизация и не будет ли быстрее ручками сделать:

Масяня
На сайте с 16.06.2005
Offline
210
#7
q_metainfo:
Либо (как вариант) взять старый добрый эксель, отсортировать по алфавиту все ключи - и глазками просмотреть все соседние ячейки (телефон нокия и телефоны нокия будут в соседних строках).
Неудобно, да (особенно на большом количестве слов). Да, нужно будет написать формулу, которая вырежет подстроку начиная со второго (третьего, четвёртого) слова.

Еще вариант - берем старый добрый эксель, автозаменой меняем "телефоны" на "телефон", потом удаляем дубликаты (Раздел Данные). Сработает, если много однотипных запросов, типа телефон сони - телефоны сони, телефон нокия - телефоны нокия... А если запросы совсем разные (игрушка - игрушки, кубик - кубики, кукла - куклы), то ой:(

Третий вариант, если запросов не очень много (около ста, скажем), то загоняем их в прогнозатор Директа, он сам лишние склеит и оставит один запрос.

Если запросов много, то используем симбиоз варианта 1 и варианта 3. Т.е. в экселе сортируем запросы по алфавиту, чтобы словоформы одного запроса оказались рядом в списке, и засовываем в прогнозатор кусками.

[Удален]
#8

Руками не вариант. Объемы большие, даже на "перечитать разок" уйдет много времени, а править еще сложней. Тем более будут не просто кукла, куклы, а кукольный, кукольная, кукольные....

Кому интересно.

Нашел софт - mystem приводит все словоформы к исходному виду, довольно удобно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий