Гениальный синонимайзер

B
На сайте с 23.10.2006
Offline
170
#41
Dzhem:
Желательно конечно купить одну громадную хорошую базу

Не правильно :) лучше купить 100 маленьких, но узкотематических.

Linyli
На сайте с 24.06.2008
Offline
47
#42
громадную хорошую базу

так не бывает :)

B
На сайте с 23.10.2006
Offline
170
#43

Черт сейчас потыкал в кнопку ВПЕРЕД, так оно ещё и разные замены делает - если потыкать почаще можно на такой шлак наткнуться )

Dzhem
На сайте с 24.04.2008
Offline
77
#44
bimcom:
Черт сейчас потыкал в кнопку ВПЕРЕД, так оно ещё и разные замены делает - если потыкать почаще можно на такой шлак наткнуться )

Подождите пару минут, сейчас база переконвертируется, потыкаем :)

Dzhem добавил 12.02.2010 в 17:02

bimcom:
Не правильно :) лучше купить 100 маленьких, но узкотематических.

Вопрос в том - где их купить... Я готов тратиться на этот проект)))

Dzhem добавил 12.02.2010 в 17:05

Переключил синонимайзер на новую базу))) Намного лучше)))

Надо залить еще несколько баз и сделаю систему исключения слов с базы, а то некоторые слова жесть просто, к примеру база - основа есть портал - кушить портал.

Dzhem добавил 12.02.2010 в 17:32

На пару часиков отрублю синонимайзер. доработаю выдачу и залью еще базы :)

Dzhem добавил 12.02.2010 в 19:42

Улучшил алгоритм работы скрипта, теперь намного быстрее работает, поправил несколько багов, завтра - послезавтра усовершенствую алгоритм синонимации, чтоб синонимировалось почти все.

Пока отключил ключевики, толку от них все равно нет пока что, только на вопросы наталкивает.

На сегодня вот результат, можете синонимировать))) База нормальная, правда требует тоже очистки и добавления новых слов.

Завтра сообщу про новые результаты :)

АвтоДиректолог (https://autodirectolog.ru) - Правильное создание и ведение кампаний в Yandex Direct
Linyli
На сайте с 24.06.2008
Offline
47
#45

База действительно требует очистки, но вы же с этим справитесь? ;)

Будем ждать дальнейших результатов...

Dzhem
На сайте с 24.04.2008
Offline
77
#46

Ну чтож, выкладываю))))

1. Оптимизировал код по полной программе, работает раз в 5 быстрее чем раньше.

2. Поставил каптчу, а то смотрю любители появились F5 жать и запросами долбить базу :)

3. Приделал морфологию. В данный момент работает только с ключевиками. добавляет все склонения, падежи и т. д. Вскоре будет применен для увеличения базы синонимов.

4. Появилась новая фишка: добавление дополнительных фраз в текст.

5. Поправил все проблемы с ключевиками, терь можно ключевики вводить, но пока ключи, состоящие из 1 слова, вводим через запятую

6. Увеличил ширину блоков, а то неудобно было :)

Вроде как все описал))) Продолжение ждите завтра.

Кто не знает адрес - вот: http://allsynonyms.ru/

FANTiK123
На сайте с 30.12.2008
Offline
76
#47

вот с этого сайта когда берешь текст результат выходит каракули, исправьте плиз

FANTiK123 добавил 13.02.2010 в 10:36

очень знакомая база....используется у вас :) от smartrewriter похоже она и вставка (синим которая выделяется) слов реализована именно из его продукта

Универсальный парсер контента для создания интернет-магазинов (http://sbfactory.ru/?p=600) и не только ;)
Dzhem
На сайте с 24.04.2008
Offline
77
#48
FANTiK123:
вот с этого сайта когда берешь текст результат выходит каракули, исправьте плиз

FANTiK123 добавил 13.02.2010 в 10:36
очень знакомая база....используется у вас :) от smartrewriter похоже она и вставка (синим которая выделяется) слов реализована именно из его продукта

Да, базу купил у разработчиков smartrewriter. Так же вставки тоже у них взял, но немного доработал, вставки качественней чем в smartrewriter. База будет пополняться и новыми словами и всеми их словоформами, то момента, пока в базе будут все слова, которые можно заменить на чтото.

Каракули сейчас гляну, решу вопрос, спасибо

B
На сайте с 23.10.2006
Offline
170
#49
Dzhem:
вставки качественней чем в smartrewriter

Вставки пока не тестировал - т.к. для меня текст превращается в бред, Но вот алгоритм работы с заменами у них получше реализован.

Например:

Оригинал:
Не менее важным видится ученым и придание искусственному мясу вкуса живого.
allsynonyms:
Не наименее принципиальным видится ученым и придание искусственному мясу вкуса живого.
smartrewriter:
Более принципиальным видится ученым и придание искусственному мясу вкуса живого.

Наверное это связано с тем что у смарта встроена обработка биграмм, и если память не изменяет то и триграмм текста, а у вас, похоже, по 1му слову.

PS.

Такое ощущение что у вас весь продукт - это заслуга базы смарта - т.к. сколько текста не попробовал 99% - получается одинаковое, даже в 1% хуже чем у смарта)

Dzhem
На сайте с 24.04.2008
Offline
77
#50
bimcom:
Вставки пока не тестировал - т.к. для меня текст превращается в бред, Но вот алгоритм работы с заменами у них получше реализован.
Например:



Наверное это связано с тем что у смарта встроена обработка биграмм, и если память не изменяет то и триграмм текста, а у вас, похоже, по 1му слову.
PS.
Такое ощущение что у вас весь продукт - это заслуга базы смарта - т.к. сколько текста не попробовал 99% - получается одинаковое, даже в 1% хуже чем у смарта)

Я ж писал, база ихняя. Или вы хотели чтоб я за 2 дня составил сам базу приличную и очень хорошую?

Да, пока по 1 слову

Базу будем улучшать, надо время... в первую очередь - программный код

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий