- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Вообще-то, все дело в необходимости и достаточности, для дорвеев это конечно многовато, а для каталога статей или банка рефератов вполне достаточно, если же вы желаете ХОРОШОЧИТАЕМую УНИКАЛЬНую статью, Вам придется написать ее самому, или использовать совсем другие вычислительные мощности и абсолютно другие алгоритмы, думаю и людских ресурсов надо раз в 10-15 больше.
Ну я не прошу синтез речи, я всего лишь прошу грамотную замену :)
snoopckuu не останавливается на достигнутом, так что подождем... 🚬
discman13, продолжение следует... :)
Гы, с самооценкой у тебя все нормально, если не дурак хорошенько просмотри, что выдает май скрипт, там все на ладони, я проходил эти этапы, понадобиться совет стукни в личку.
Удачи тебе и всех благ.
Довольно неплохой результат, но база синонимов нуждается в доработке, так как иногда синонимы подставляет не подходящие ни под какие предложения.
Порадовало преобразование: "добро пожаловать" в "идти припереться" :)
посмотрел, прикинул... 15-20 процентов текста ещё можно заменить без значительной потери смысла, но на большее... надо человека или сильно раскорячиться.
Задумка не плохая.
Но, что бы реализовать более менее приличный синонимайзер, ИМХО, требуется не месяцы, а годы упорной работы, еще желательно силами команды.
Вот список проблем Вашего прототипа, которые я вижу на вскидку:
1) Для задач синонимайзера у Вас не база синонимов, а сплошной мусор.
Собственно говоря, база Lingvo базируется на словаре ASIS(r), Тришина, которая тоже для таких задач - сборник мусора.
На данный момент подходящих словарей синонимов просто нет, ни в электронном ни в печатном виде.
Даже в самых лучших словарях указанные слова не являются 100% синонимами, а синонимами, так сказать в зависимости от контекста.
Т.е. в определенном контексте их можно использовать, а в определенном нет. И процент семантических ошибок будет даже не 10% :)
Например, для "быстрый", синонимы - "беглый", "скорый". И получится, например, из "быстрого бегуна" "беглый бегун" :)
2) Помимо базы синонимов у Вас должна быть база фразеологизмов (идиом, устоявшихся выражений), что бы Вы не начали синонимизировать "железная дорога", например.
И не получили в результате "стальная дорога", например.
Кроме того, нужна база всяких пословиц, крылатых фраз и т.д.
3) Проблемы с малым количеством 100% синонимов побуждают расширять их количество за счет синонимичных глаголов, в частности.
Это в свою очередь (впрочем, как и без этого, Вы и без глаголов, как я вижу, с этим столкнулись) влечет необходимость синтаксического разбора.
Морфологический и синтаксический разборы, кроме, собственно говоря, трудозатрат на реализацию несут множество проблем - морфологическая и синтаксическая омонимия, проблемы с именами собственными и т.д.
Еще одна проблема - запятые, без которых правильный синтаксический разбор затруднителен. А кто же Вам в исходных текстах правильную расстановку запятых предоставит.
Ну, и конечно, зарабатывать на этом нужно не 10 000$ в год, выпуская программный продукт, а сотни тысяч долларов, организовывая сервис постатейного перевода, с оплатой 1$ за 2500 знаков, например.
А, учтя еще и семантические связи, можно на выходе получить уже рерайтер. Задача в разы сложнее, но и дохода дающая в разы больше.
Идея заманчивая, и для умных людей вполне реализуемая, правда, как я уже говорил, не в очень короткие сроки.
Я бы и сам, думаю, с успехом, в этом поучаствовал и на уровне организации и на уровне реализации, но проект, так сказать, сильно венчурный.
Я и на более простые вещи, как-то не решаюсь :)
А Вам удачи, на этом не легком пути!
john2007, все верно написал... прямо ТЗ на разработку... и архисложнейшая из описанных задач - омономия и даже не синтаксическая, а морфо...
а имена собственные - туфта на самом деле...
вот сокращения - это да!!!
Одно "Лидера БЮТ Юлию Тимошенко..." чего стоит... попробуйте расшифровать и с глузу не съехать ни разу - "Лидера Блока Юлии Тимошенко Юлию Тимошенко"... брр-р-р...
А ещё "мать любит дочь" - хде здесь подлежащее????
а имена собственные - туфта на самом деле...
На самом деле, не такая простая задача. Если говорить про имена и фамилии, например, не забывая, что они не толко русские бывают.
Как определить какого рода?
Как определить склоняется или нет?
База имен собственных нужна.
Или корпус русского языка, желательно постоянно пополняемый новостями.
Вообще, корпус от многих проблем спасает. Опять же, с учетом того, что сервис делать, а не программный оффлайновый продукт, проблема больших объемов особенно не волнует 🚬
На самом деле, не такая простая задача. Если говорить про имена и фамилии, например, не забывая, что они не толко русские бывают.
Как определить какого рода?
Как определить склоняется или нет?
База имен собственных нужна.
Или корпус русского языка, желательно постоянно пополняемый новостями.
Вообще, корпус от многих проблем спасает. Опять же, с учетом того, что сервис делать, а не программный оффлайновый продукт, проблема больших объемов особенно не волнует 🚬
правда есть одно маленькое, но красивое решение...
ЗЫ и не только база собственных... там дафига чего ещё нужна...
та ну его...
правда есть одно маленькое, но красивое решение...
Делимся! :)