Два вопроса касательно регистраторов и сателитов:
1. Позволяет ли кто-либо из регистраторов скрывать телефон и e-mail или менять их для одного администратора но разных доменов?
2. Подскажите регистраторов с поддержкой профилей администраторов по типу 2domains и atname?
Отметился.
Пока бесплатно.
Не может сейчас ни один синонимайзер похвастать нормальной читаемость. В том числе и ваш. Какой смысл заявлять то, чего нет? Беглый взгляд человека на текст однозначно определит где написано руками, а где по словарю. Поэтому при всём уважении увы, но прогресса нет:
На входе
На выходе
Собрать же нормальную базу синонимов словосочетаний и предложений вряд ли кому под силу сегодня. Поэтому по моему мнению нужно делать упор не на базу, а на удобство ручной правки после автоматического прогона по словарю. Для ГСов же предложений синонимайзеров не мало.
html это фича. Не нужен html - не используй теги.
10 мб знаменитая база. После приведения её к формату "слово|синоним" в файле образуются около 700 тыс строк. После морфологического прогона - около 12 млн. строк. Помнится когда был маленький, а в Московском планетарии еще не было пинбольного клуба - во дворе оного стоял хитрый девайс, который должны были вращать все желающие. Аттракцион был создан с целью дать понять окружающим насколько большое число один миллион. Не знаю сколько его вращали до меня. Судя по глянцевому состоянию металла этого чудо прибора - вращали уже не один год. Число на циферблате показывало что-то около 300 тыс. оборотов.
Уважаемый ТС, ваш труд будет колоссален. Даже если вы наберете десяток помощников, то кряхтеть придется не один месяц. А стоит ли оно того? До кучи добавлю, что процентов 70 слов из словаря SynMaster и aprok в эту базу не входят, а это одни из лучших баз. Что же тогда получится в результате?
Посмотри уникализатор ниже в подписи.
starki добавил 08.08.2009 в 23:14
Если включить все словари, то уникальность при автозаполнении будет - мама не горюй. Дедушка Даль в гробу перевернется.
starki добавил 08.08.2009 в 23:16
На слово БИТЬ - 721 синоним,
ПИТЬ - 544 синонима,
МАСТУРБИРОВАТЬ - 528 синонимов
Читал и плакал.
Речь про автозаполнение? Сейчас алгоритм следующий - текст делится на предложения. Берутся первые 10 слов предложения и ищется на них синоним. Если не находится - берутся первые 9 слов. Если не находится 8 слов и т.д. до одного. Если синоним найден, то исключается из предложения и берутся следующие после него 10 слов. Потом 9 и т.д. Таким макаром обрабатывается каждое предложение. В результате чем длиннее фраза, тем приоритетнее для нее синоним.
Каково происхождение базы? 340 000 вручную наколотить времени много надо.
Есть ли синонимы на словоформы? Если есть, то вышлите, плз, кусок базы с разными словоформами.
Английский в комплекте за $40?
Ура! Здесь, оказывается, есть люди!
Баг. Поправил. Так и задумано было.
Думал над этим. Пока остановился на том, что рассчитывается процент использования синонимов по отношению к первоначальной фразе. Чем выше процент, тем чаще используется. Соответственно сортировка в списке синонимов происходит по этому проценту. Малоиспользуемые и ошибочные синонимы отодвигаются вниз. Как их потом на полуавтомате удалить - стоит подумать. Возможно действительно сделать напротив каждого синонима кнопку с жалобой.
Такая штука была задумана раньше чем подключение внешних словарей. Будем посмотреть как сервисом пользуются и рассчитываются проценты по синонимам. Если это заработает, то в окно "словари" добавлю поле или выпадающий список для выбора процента автозаполнения. Фактически все для этого уже реализовано. Вопрос проверки эффективности. Проверка эффективности вопрос времени и активности использования сервиса.
Неожиданно получило продолжение тема с попытками взлома. Один из товарищей работал без прокси. Отписал в абузу его провайдеру с выдержками из логов. Как оказалось у оного уже в наличии условный срок по схожим правонарушениям. Теперь провайдер слезно просит написать официальное заявление в милицию чтобы посадить супостата. Сижу, не знаю что делать.
Доработки:
Добавлено выдвигающееся окно со статистикой плотности слов. Возможен пересчет плотности с учетом морфологии.
Тихо сам с собою... Либо сервис не востребован, либо его изначально нужно было делать платным и вытягивать отзывы за полцены. Тяжело дорабатывать, когда нет рекомендаций или сообщений об ошибках. Зато уже несколько раз за неделю пытались взломать. С такой "любовью" встречаюсь впервые. Походу, таки надо уже прекращать со свободным доступом.