- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Приобрёл базу у ТС. Качество соответствует описанию. Это мой первый опыт работы с синонимами, просто интересно как это работает. Первое впечатление - положительное, текст получается читабельным, и по большей части уникальным. Жду обновления базы.
ТС, большое спасибо!!! Я даже не ожидал - прислал обновление базы синонимов. По описанию теперь в базе присутствует морфология и 373751 строк!!!
Кто еще не купил - советую.
Успешно прошло обновление базы.
Теперь в базе 373000 строк, весит 8.82 Мб.
База при обновлении была немного изменена следующим образом. Добавлены все формы прилагательных. Например если в базе прилагательное
отделочный|облицовочный
Было добавлено под этой строкой следующие строки:
отделочного|облицовочного
отделочному|облицовочному
отделочным|облицовочным
отделочном|облицовочном
отделочная|облицовочная
отделочной|облицовочной
отделочную|облицовочную
отделочное|облицовочное
отделочные|облицовочные
отделочных|облицовочных
отделочным|облицовочным
отделочными|облицовочными
(Все повторения отсеяны, если эти строки в базе были.)
То есть все формы прилагательных с учетом морфологии. Не вдаваясь в подробности все формы абсолютно корректны, т.е. слова получаются без ошибок, все окончания правильные.
То же самое с глаголами - добавлены формы прошедшего времени, там где их не было (а все повторения отсеяны).
глагол
пояснять|объяснять
под строкой добавлены строки:
пояснял|объяснял
поясняла|объясняла
поясняло|объясняло
поясняли|объясняли
Напоминаю о том что стоимость базы в 15 wmz действительна только до 20,08,2009г. Кто еще не купил, спешите преобретать.
Приобрел базу в дополнение к своей коллекции.
У меня есть написанный мной скрипт, который проводит аудит баз синонимов, вычищая их от всякого мусора. Так как собираю я базы давненько, то и скрипт уже отлажен очень хорошо. Мусором он считает:
1. Несоответствие времен, падежей, родов (например, мир нельзя тупо заменить на вселенная, так как мир мужского рода, а вселенная - женского). Скрипт распознаёт эту грамматическую информацию, сравнивает и, если она не совпадает - удаляет строку из словаря.
2. Кроме того, скрипт удалил все совпадения слов, синонимов, слов в синонимах и синонимов в словах.
3. Также скрипт удалил все строки, где слова и синонимы представлены двух-, трехсловными (и более) словосочетаниями (мой синонимайзер их не поддерживает, да и добавить морфологические формы к ним автоматически не получается).
4. Скрипт объединил купленную у VkVetal базу с моей, пропуская имеющиеся совпадения (опять же, слов, синонимов, слов в синонимах и синонимов в словах).
Скрипт трудился 8(!) часов.
Результат таков: к моей базе прибавилось 160 тысяч новых строк (всего вышло 260 тысяч). Количество замен, естественно, возросло, но читабельность ухудшилась в несколько раз (проверил на пяти разных текстах). Встречаются курьезные вещи (Карл Маркс кушал прав - в словаре кушал=был).
Вывод: база VkVetal неплоха, но еще есть, над чем трудиться. Дело не в количестве слов и их форм, а в их качестве. Со своей базой базу VkVetal пока объединять не буду - слишком уж ГС получится на выходе (ГС - говносинонимайзер).
Базу купил позавчера...
Начал адаптировать к своему софту (удалять неоднословные и "дефисные" "исходные" синонимы, дополнять "однозначные" синонимы альтернативными вариантами)...
Вчера пришло обновление (дополнение) базы...
Сегодня пришло дополнение базы почти в три раза....
============================================
Всё это, конечно, хорошо, но непонятно - то ли начать заново адаптировать последнюю версию, то ли попытаться "приклеить" дополненные строки к уже подправленной первой версии...
Поэтому хочется посоветовать ТСу (если он собирается каждый день обновлять базу...)
1. предусмотреть альтернативный способ обновления: присылать только добавленные строки, а не всю базу целиком
2. ввести нумерацию версий базы...
3. дополнительно предоставлять какой-либо скрипт для упорядочивания строк в базе (хотя, это элементарно можно сделать, например через Excel, но не каждый сможет/захочет заморачиваться...).
VkVetal, словарь базы общетематический, или с каким-то уклоном (наука, садоводство, туризм....)???
OlegPavlov добавил 18.08.2009 в 17:32
:), Ну что ж, взял из любопытства базу... проверил простенький текст - чистый скан, висит на 4 х сайтах. Пришлось немного поработать ручками - минут 15-20, и генератор выдал пару текстов с уникальностью в 70%% . Если доработать немного "под себя", чтобы ручками совсем не шевелить:), то весьма неплохо.
Идеально подойдёт "новостникам" - не придётся грубо "копипастить"... рекомендую)))
Пришло обновление базы, большое спасибо что не забываете. Прогнал несколько текстов через обновленную базу, качество порадовало, но попадаются еще слова которые не подходят по смыслу к некоторым выражениям, но число их намного меньше чем было в предыдущей версии. За такую базу ставлю твердую 5.
взял базу, быстро удобно без проблем, почти сутки ушли на приведение ее в соответствие с моим синонимайзером после этого проведен легкий тест без добавления своих синонимов я получил 76% по плагиатусу на форекс статье с кучей названий компаний и спецтерминов считаю это вполне достойным результатом, автор молодец, так держать!
ТС, как и кто получает обновления?
Kenrosport, Обновление базы получает каждый кто ее покупает. Поступает уведомление пользователю о том, что успешно прошло обновление базы, и высылается на почту обновленная версия. Обновление базы пользователь получает совершенно бесплатно.
Напоминаю что сегодня последний день, когда стоимость базы составляет - 15wmz.