Гениальный синонимайзер

B
На сайте с 23.10.2006
Offline
170
#51
Dzhem:
Я ж писал, база ихняя. Или вы хотели чтоб я за 2 дня составил сам базу приличную и очень хорошую?
Да, пока по 1 слову
Базу будем улучшать, надо время... в первую очередь - программный код

Я к тому что гениального ещё ничего нет, когда будет ? - не терпится посмотреть.

Dzhem
На сайте с 24.04.2008
Offline
77
#52
bimcom:
Я к тому что гениального ещё ничего нет, когда будет ? - не терпится посмотреть.

Как вы видите, работы ведутся. Потерпите, все будет :)

Кстати спасибо за поправку что проверяется по 1 только слову. Поправил.

АвтоДиректолог (https://autodirectolog.ru) - Правильное создание и ведение кампаний в Yandex Direct
Linyli
На сайте с 24.06.2008
Offline
47
#53

Есть ли какие-то наработки в плане работы с омонимами? Насколько я могу судить, в разработке синонимайзеров это один из главных камней преткновения.

Dzhem
На сайте с 24.04.2008
Offline
77
#54
Linyli:
Есть ли какие-то наработки в плане работы с омонимами? Насколько я могу судить, в разработке синонимайзеров это один из главных камней преткновения.

С базой еще не работал. Сделал систему добавления вводных слов в начале предложения, внутри предложения и в конце предложения, добавил по несколько выражений для теста, они обводятся светло-голубым цветом. Сейчас делаю систему авторизации. Неавторизованным пользователям будет ограничение в кол-ве текста, авторизовавшись ограничений не будет. Так же авторизованные пользователи могут добавлять, удалять слова с базы, но, естественно, я буду модерировать их действия. Таким образом у каждого пользователя будет возможность работы с базой. Будут так же модераторские учетные записи, модераторы смогут модерировать изменения, которые внесли другие пользователи. То что добавят сами модераторы - модерироваться не будет. На создание того что описал выше - думаю дня 2-3 уйдет. Далее пробегусь во всем форумам СЕОшников и буду рекламировать.

В успешности проекта уверен на 200%, через месяц уже равных ему проектов не будет, в этом абсолютно уверен. Модераторы, и все те, кто будет учавствовать в развитии проекта - будут получать в системе баллы. За каждое действие будет начислено то или иное количество баллов, ну или вычтено, - все будет зависить от модераторов. Далее баллы можно будет перевести в деньги и вывести, или же потратить их в проекте.

Linyli
На сайте с 24.06.2008
Offline
47
#55

Dzhem, так а с омонимами как? Омонимы - это такие слова, которые пишутся одинаково, а значение имеют разное. Соответственно, и синонимы у них разные.

Удивительно
На сайте с 07.07.2009
Offline
215
#56
Linyli:
Dzhem, так а с омонимами как? Омонимы - это такие слова, которые пишутся одинаково, а значение имеют разное. Соответственно, и синонимы у них разные.

Косой {кто} косой {чем} косо {как} косил {что делал} сено на косе {на чем}.

Вы думаете, это кто-то корректно обработает? :D

Качественная семантика недорого ( https://moab.tools/ )
Linyli
На сайте с 24.06.2008
Offline
47
#57

Удивительно, ну, это уж совсем крайности :)

Dzhem
На сайте с 24.04.2008
Offline
77
#58
Linyli:
Dzhem, так а с омонимами как? Омонимы - это такие слова, которые пишутся одинаково, а значение имеют разное. Соответственно, и синонимы у них разные.

Для начала их придется исключать из базы. После сбора достаточного количества текста слова будут не просто добавляться. Перед добавлением любое слово будет проходить проверку, для определения его истинного смысла. Для этого какраз-таки нужно очень большая текстов всяких которые буду парсить с поисковиков. Еще точный алгоритм не придумал, но чтото роде следующего: есть фраза: "Очень хочу есть, сейчас бы чего-нибудь вкусненького". Есть база с миллионами различного рода предложений. Программа ищет совпадение с нашим выражением в этой базе, не полное совпадение конечно, а совпадение по нескольким словам, примерно как отображается выдача яндекса, совпадения полного нет но слова встречаются. Так вот. Выбираются самые релевантные позиции в базе. к примеру "хочу съесть чего-нибудь вкусненького". есть - имеется, есть - съесть. Вытаскиваем из этой базы словоформы слова есть, (есть, съесть, ем) и т. д. по этим словоформам определяется истинное значение слова. По нем ищутся синонимы. Если истинное значение найти не удалось - не меняется.

Все что описано в этом топике мной - все реально реализуемо. И я добьюсь этой поставленной цели, чего бы она мне не стоила. Согласен, все трудности еще впереди. Но без них скучно :)

Dzhem добавил 13.02.2010 в 15:57

Удивительно:
Косой {кто} косой {чем} косо {как} косил {что делал} сено на косе {на чем}.
Вы думаете, это кто-то корректно обработает? :D

Искусственный Интеллект. Обработает, еще как обработает. когда вы в яндексе вводите выражение косой заяц вы же не получаете результат косил косой, хотя во втором больше совпадений:)

А говорите не обработает :)

FANTiK123
На сайте с 30.12.2008
Offline
76
#59
Linyli:
Dzhem, так а с омонимами как? Омонимы - это такие слова, которые пишутся одинаково, а значение имеют разное. Соответственно, и синонимы у них разные.

омонимы можно привязать к словам идущим вместе с ними в базе, после этого не будет не корректных замен.

Универсальный парсер контента для создания интернет-магазинов (http://sbfactory.ru/?p=600) и не только ;)
Linyli
На сайте с 24.06.2008
Offline
47
#60

FANTiK123, это не всегда работает, тут нужно использовать несколько разных подходов, проверено ;)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий