starki

Рейтинг
49
Регистрация
13.03.2009

Два вопроса касательно регистраторов и сателитов:

1. Позволяет ли кто-либо из регистраторов скрывать телефон и e-mail или менять их для одного администратора но разных доменов?

2. Подскажите регистраторов с поддержкой профилей администраторов по типу 2domains и atname?

Отметился.

Пока бесплатно.

Не может сейчас ни один синонимайзер похвастать нормальной читаемость. В том числе и ваш. Какой смысл заявлять то, чего нет? Беглый взгляд человека на текст однозначно определит где написано руками, а где по словарю. Поэтому при всём уважении увы, но прогресса нет:

На входе

У въезда на территорию штаб-квартиры НАТО в столице Афганистана Кабуле произошел террористический акт. Начиненный большим количеством взрывчатки грузовик, в котором находился террорист-смертник, попытался проехать на территорию штаб-квартиры НАТО. Однако взорвался у одного из ограничительных блоков, передает Associated Press.
В результате взрыва погибли 3 и получили ранение 70 гражданских лиц, находившихся поблизости в тот момент. Ответственность за взрыв взяли боевики движения "Талибан". Представители движения подтвердили свое участие в организации этого теракта и заявили, что в машине находилось более 500 кг взрывчатки.

На выходе

У въезда на местность штаб-жилплощади НАТО в москве Афганистана Кабуле случился террористический акт. Начиненный большим числом взрывчатки грузовик, в коем разместился террорист-смертник, захотел ехать на местность штаб-жилплощади НАТО. Впрочем взорвался у одного из ограничительных блоков, передает Associated Press. В итоге взрыва погибли трем и возымели ранение 70 гражданских лиц, разместившихся поблизости в тот фактор. Обязанность за взрыв взяли боевики перемещения "Талибан". Адепты перемещения доказали свое участие в организации такого теракта и объявили, что в автомашине разместилось больше 500 кг взрывчатки....

Собрать же нормальную базу синонимов словосочетаний и предложений вряд ли кому под силу сегодня. Поэтому по моему мнению нужно делать упор не на базу, а на удобство ручной правки после автоматического прогона по словарю. Для ГСов же предложений синонимайзеров не мало.

html это фича. Не нужен html - не используй теги.

10 мб знаменитая база. После приведения её к формату "слово|синоним" в файле образуются около 700 тыс строк. После морфологического прогона - около 12 млн. строк. Помнится когда был маленький, а в Московском планетарии еще не было пинбольного клуба - во дворе оного стоял хитрый девайс, который должны были вращать все желающие. Аттракцион был создан с целью дать понять окружающим насколько большое число один миллион. Не знаю сколько его вращали до меня. Судя по глянцевому состоянию металла этого чудо прибора - вращали уже не один год. Число на циферблате показывало что-то около 300 тыс. оборотов.

Уважаемый ТС, ваш труд будет колоссален. Даже если вы наберете десяток помощников, то кряхтеть придется не один месяц. А стоит ли оно того? До кучи добавлю, что процентов 70 слов из словаря SynMaster и aprok в эту базу не входят, а это одни из лучших баз. Что же тогда получится в результате?

Посмотри уникализатор ниже в подписи.

starki добавил 08.08.2009 в 23:14

Если включить все словари, то уникальность при автозаполнении будет - мама не горюй. Дедушка Даль в гробу перевернется.

starki добавил 08.08.2009 в 23:16

На слово БИТЬ - 721 синоним,

ПИТЬ - 544 синонима,

МАСТУРБИРОВАТЬ - 528 синонимов

Читал и плакал.

Nooooo:
Приоритет словосочитаний (это я имел ввиду, когда текст сначала делится на словосочетания и к ним подбираются синонимы, а уже потом к тем словам которые остались, и чем длиннее словосочетание тем приоритетнее) это, на мой взгляд, дает больше "человечности" при замене. Ведь читаемость статьи это даже важнее уникальности. Просто к словосочетанию из 3-4 слов легче подобрать синоним-слово/синоним-фразу которые будут подходить без ручной правки в большинстве случаев.

Речь про автозаполнение? Сейчас алгоритм следующий - текст делится на предложения. Берутся первые 10 слов предложения и ищется на них синоним. Если не находится - берутся первые 9 слов. Если не находится 8 слов и т.д. до одного. Если синоним найден, то исключается из предложения и берутся следующие после него 10 слов. Потом 9 и т.д. Таким макаром обрабатывается каждое предложение. В результате чем длиннее фраза, тем приоритетнее для нее синоним.

Каково происхождение базы? 340 000 вручную наколотить времени много надо.

Есть ли синонимы на словоформы? Если есть, то вышлите, плз, кусок базы с разными словоформами.

Английский в комплекте за $40?

Ура! Здесь, оказывается, есть люди!

Nooooo:
1. было бы удобно когда добавляешь свой синоним то чтобы он после нажатия на + сразу "выбирался", а так приходится закрывать окошко с синонимами и потом снова его открывать чтоб поставить галочку...

Баг. Поправил. Так и задумано было.

Nooooo:
2. предусмотреть чтоб пользователи могли помечать неверные синонимы или синонимы с ошибками, чтобы их потом модератор мог удалить/исправить

Думал над этим. Пока остановился на том, что рассчитывается процент использования синонимов по отношению к первоначальной фразе. Чем выше процент, тем чаще используется. Соответственно сортировка в списке синонимов происходит по этому проценту. Малоиспользуемые и ошибочные синонимы отодвигаются вниз. Как их потом на полуавтомате удалить - стоит подумать. Возможно действительно сделать напротив каждого синонима кнопку с жалобой.

Nooooo:
3. сделать приоритет словосочетаний при автозаполнении (сори если это уже сделано)

Такая штука была задумана раньше чем подключение внешних словарей. Будем посмотреть как сервисом пользуются и рассчитываются проценты по синонимам. Если это заработает, то в окно "словари" добавлю поле или выпадающий список для выбора процента автозаполнения. Фактически все для этого уже реализовано. Вопрос проверки эффективности. Проверка эффективности вопрос времени и активности использования сервиса.

Неожиданно получило продолжение тема с попытками взлома. Один из товарищей работал без прокси. Отписал в абузу его провайдеру с выдержками из логов. Как оказалось у оного уже в наличии условный срок по схожим правонарушениям. Теперь провайдер слезно просит написать официальное заявление в милицию чтобы посадить супостата. Сижу, не знаю что делать.

Доработки:

Добавлено выдвигающееся окно со статистикой плотности слов. Возможен пересчет плотности с учетом морфологии.

Тихо сам с собою... Либо сервис не востребован, либо его изначально нужно было делать платным и вытягивать отзывы за полцены. Тяжело дорабатывать, когда нет рекомендаций или сообщений об ошибках. Зато уже несколько раз за неделю пытались взломать. С такой "любовью" встречаюсь впервые. Походу, таки надо уже прекращать со свободным доступом.

jpg plt1.jpg
jpg plt2.jpg
Всего: 46