Linyli

Linyli
Рейтинг
47
Регистрация
24.06.2008

Сколько строк в базе?

Есть ли разные формы одного слова?

База общетематическая, или все-таки есть какой-либо уклон?

kolyan73, зря Вы так. Автор программы имеет право распоряжаться ей так, как считает нужным. Любой софт кому-то достанется бесплатно. В конце концов, скорее всего, перед выпуском программы он бесплатно дал ее потестить своим знакомым. Это разве плохо? Кроме того, вы же не возмущаетесь, когда видите в магазине скидку на продукт, который год назад купили за вдвое большую сумму?

seoBB:

Вывод (по результатам других текстов): на 1000 знаков при 25%-й замене в среднем идет 1 ошибка.
Личное мнение: в рамках текущих и грядущих алгоритмов Яндекса 25% это очень мало.

Спасибо большое за то, что обнаружили ошибки, будем бороться :)

Процент замен действительно пока не велик, но каждый день база пополняется, так что мы уверены, что это лишь временный недостаток.

vtomas, да, пожалуй, вы правы :) Удалим.

FANTiK123:
Пожелание.
Хотелось бы чтоб в текстах больше заменялось узконаправленных слов, а не только широко используемые слова.
Считаю, что более эффективно будет наполнение в начале одну из тематик, чтоб замена доходила до 30%. Потом переходить к наполнению к наполнению другой тематики. А ту так получается я вижу замены только общеупотребляемых слов, а узконаправленные слова так и остаются.

пока все...желаю вам удачи!!!

Боюсь, если мы сейчас возьмемся за какую-то конкретную тему, некоторым придется ждать появления интересующих их тематик годами. :)

Работая с тематическими базами, мы стремимся, в первую очередь, не к замене всех на свете слов, а к адекватной работе с контекстом статьи. К примеру, чтобы в тексте про беременность слово "плод" заменялось на слово "эмбрион", а в тексте про фрукты - на слово "фрукт".

В последние два дня мы усиленно устраняли всевозможные баги и наводили порядок в базах, поэтому теперь:

- все работает немного быстрее, чем раньше;

- скорректирован подсчет замен в случае работы со словосочетаниями;

- подключена возможность замены словосочетаний, содержащих знаки препинания, что значительно расшило круг наших возможностей.

В базы было добавлено несколько сотен слов и словосочетаний. Мы стараемся по мере сил обрабатывать все тексты, отправленные нам через фидбек, и они нам все еще нужны - пока что это единственный способ вылавливать неадекватные замены и восполнять пробелы в базах. Спасибо всем, кто помогает нам развиваться!

Следите за обновлениями, они будут совсем скоро!

Что в данном случае подразумевает термин "первоначальная раскрутка"? Настораживает такой бюджет.

Если я вас правильно понимаю, инвестору сначала достаточно зарегистрировать домен и хостинг, а вы на нем сделаете перспективный проект за процент от дохода, так?

Мексиканец, точной даты сейчас называть не хочется, наша склонность к перфекционизму не дает нам выпустить сервис на всеобщее обозрение в нынешнем состоянии. Пока мы надеемся, что сможем открыть сайт где-то через неделю-две, но обещать ничего пока не будем.

vtomas, у нас в планах есть создание тематических баз на заказ, но это еще совсем на стадии планов. :)

Дело в том, что те базы, которые мы сейчас делаем для сервиса, каждый сможет использовать через наш же сервис и это будет бесплатно. А если кому-то будет нужно что-то более специфическое, мы тоже сможем что-то предложить, но уже в индивидуальном порядке.

Zero-xack:
По данным Центризбиркома, в списки избирателей включены 36 млн 576 тысяч 763 человека. По данным Центризбиркома Украины, 36 млн 576 тысяч 763 украинцев смогут проголосовать на выбор


По таким Центризбиркома, в списки избирателей включены 36 млн 576 тыс. 763 человека. По таким Центризбиркома Украины, 36 млн 576 тыс. 763 украинцев смогут проголосовать на выбор


а так в общем нормально всё. 11 процент замен, тематику определил верно.

Zero-xack добавил 17.01.2010 в 16:36
неверно определил тематику. статья была про музыку, а определило "что он как-то связан с попугаями". Отправил вам.

Большое спасибо! Текст получили и работаем. Тема уже определяется верно, соответствующая база синонимов в процессе составления :)

Всего: 621