Словарь синонимов для поиска на сайте

Владимир
На сайте с 10.07.2006
Offline
134
282

Подскажите, пожалуйста, где можно найти или как сделать (например, спарсить) качественный словарь синонимов для реализации продвинутого поиска по сайту?

В сети валяется несколько словарей, например различные версии словаря Абрамова. Но это адский компот: по ощущениям там половина матерных и жаргонных слов, а нормальные слова имеют такие связи, которые для поиска не применимы, например: книга | кирпич, брикет, труд, диван... :psyho:

Сначала пробовал вычищать эту помойку из 250 тыс. слов и 450 тыс. связей вручную, но потом в тоске забил.

Если у кого-то есть готовая качественная вещь готов купить за разумные деньги. Что я подразумеваю под качеством: небольшой словарь 3-5 тыс. общеупотребительных слов и связей в базовой форме без поэзии и сомнительных аналогий (см. выше).

Так же для тех же нужд ищу словарь популярных западных брендов и варианты русского перевода, например:

nissan | ниссан, нисан

Если кто-то озадачен тем же вопросом готов поделиться своими наработками и скооперироваться для получения годного продукта:

_
На сайте с 24.03.2008
Offline
357
#1

Из гугла напарсить не вариант ?

Владимир
На сайте с 10.07.2006
Offline
134
#2

Поясните, пожалуйста, где в гугле можно напарсить русские синонимы?

Devvver
На сайте с 02.07.2008
Offline
627
#3

Tvolod, в словаре смотрели?

https://yandex.ru/dev/dictionary/

У яндекса можно парсить

https://translate.yandex.ru/?utm_source=slovari&lang=ru-en&text=%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%B0

Мой блог. Все о создании сайтов,Seo и СДЛ (https://devvver.ru/) А вот это блог о жизни в Таиланде и Паттайе (http://tourwebring.com). Еще о Таиланде (https://tailand-gid.org).
angel57
На сайте с 01.04.2014
Offline
129
#4

Вот бренды, вроде тока шмотки и косметика https://porusski.me/2016/11/30/014-proiznosim-nazvanija-brendov/

Владимир
На сайте с 10.07.2006
Offline
134
#5
Devvver:
Tvolod, в словаре смотрели?
https://yandex.ru/dev/dictionary/
У яндекса можно парсить
https://translate.yandex.ru/?utm_source=slovari&lang=ru-en&text=%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%B0
Посмотрел. Тут слишком широкий разброс синонимов. Как раз та проблема, которую я описывал у Абрамова - слова, которые в разговорной речи иногда могут быть синонимами, для предметного поиска абсолютно разные сущности.
Впрочем, если есть API, то можно спарсить хотя бы для того, чтобы наложить ограничения сверху - если нет у Яндекса, то удалить и у меня. Хоть и не сильно, но делу может помочь. 🙄

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий