Videoson

Рейтинг
26
Регистрация
10.06.2007
matias:
наверняка те, кому нужно, уже наняли людей для написания-подбора ручной базы синонимов и близких по смыслу выражений..
а когда напишут более-менее ровную базу синонимов - не думаю, что выложат в открытый доступ за бесплатно.. филологи-то не за бесплатно трудятся..

Анриал ИМХО... 200 тыщ слов в русском языке, представьте себе задачу поиска абсолютного синонима хотя бы к 10% слов - это 20 тысяч слов... а теперь попробуйте на время найти абсолютные синонимы хотя бы к 100... смею вас уверить, что это займет у вас не 1 день... а теперь умножьте все на 200, а потом на стоимость работы...

komap:

Синонимами два слова являются только в каком-то контексте.

ЗЫ точку зрения komap'а поддерживаю...

Слава Шевцов:
Скорее морфология куплена у одного производителя. Интересно, это морфология от KEVa?

по словам стоконы - это их морфология, но продавать за 30 копеек они её отказались...

а обсуждать стоимость существенно более 10 кб я не стал...

ЗЫ ни одна система синтаксического разбора русского языка не разбирает корректно более 25% текста, что маловато мягко говоря... а уж про омонимию можно вообще пока промолчать...

Andrey Ogarok:
Кроме вышеуказанной ссылки информация по синтаксическому анализу имеется на сайтах http://aot.ru/docs/synan.html , http://www.asknet.ru/Technology/Tsyntax.htm . Также поищите информацию о LinkGrammar - синтаксический анализатор английского языка, имеется и его аналог для русского.🚬

сравните 2 странички: http://www.asknet.ru/Technology/Tdictionary.htm и http://stocona.ru/technology/sciencearticle7.aspx и найдите 8 отличий...

кто у кого "помыл" базу?

Parasol:
Привет, сделал простейший синонимайзер. Рэндомом подставляються синонимы слова.
Вот скрипт: http://www.seobase.org.ua/syn.php

Сейчас поставил ограничение 800 символов. Потом как доведу до ума сделаю полноценный, бесплатный онлайн сервис.

Пожалуйста, напишите что необходимо доработать/изменить?

Спасибо!

чтобы довести это до ума необходимо 5-6 человеко-лет... 🙄🙄🙄

OZE:
т.е. по сути получается, что у вас производится морфологический и синтаксический (а возможно и семантический) разбор текста?
а как быть с техническими текстами, которые изобилуют терминами и сокращениями, и иногда в них встречаются формулы?

получается, что они круче Яндекса 🚬 🚬 🚬

Rick:
Если не секрет, на основании чего сделано такое умозаключение?


Логика простая: размещайте тематические ссылки. Тематика - понятие определенное, честность-нечестность - относительное.
Если у Вас строительный сайт, но он находится поисковиком по фармацевтическому запросу из-за того, что на нем размещена ссылка на какую-то "медицину" - Вы спаммер. Ссылки на Вашем сайте ведут к искажению серпа. Отсюда санкции - автоматом или по стуку.

Маленький ньюанс - Яндегз до сих пор не умеет автоматом определять тематичность контента... тока ручками 🚬

Всего: 77