- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
подобная программа пишется минут за 5 - 10.
ну вот, биз испорчен
Просто если там нет не какого логического анализа, а идет просто разрушение шинглов путем переставления слов местами, то подобная программа пишется минут за 5 - 10.
Специально затачивался скрипт под Ворд, чтобы было не более 5% зеленых подчеркиваний.
Я убил на это много времени, не 5-10 минут. Вон L!mur привел ссылку когда это все начиналось - год назад.
Finfuchs просто у ПС, в т.ч. у Яндекса довольно глубокие методы анализа текстов.
http://company.yandex.ru/technology/mystem/
http://www.seonews.ru/events/detail/119707.php
Вот в этом и вопрос - на чем основан метод генератора, как он определяет части предложений, на основе чего он меняет порядок слов, понимает ли он что такое часть речи и умеет ли грамотно менять конструкцию предложений, не ломая основы? Все это вычисляется, так что если уж заморачиваться с этой темой то по полной программе вникать в рус. яз., как это сделала Cognitive Technologies.
Яндекс купил право использовать Программный Комплекс от компании Cognitive Technologies, который предоставляет возможность синтаксического анализа текста. Синтаксический анализ текста необходим для того, чтобы понять, какие отношения связывают слова в словосочетаниях или предложениях. «Применение синтаксического анализатора позволяет проводить сравнение текстов на основе встречаемости в них различных слов и конструкций и разрабатывать методы понимания текстов, извлечения данных из текстов, а также другие приложения», - сообщается в пресс-релизе компании.
Итак давайте разберёмся! 🚬 Что же такое синтаксический анализатор? Здесь сказано, что языковую систему условно можно разбить на уровни:
Предположим что мы справились с пунктуацией и оказались на уровне предложения. Предложение состоит из лексем (слов), а слова из морф (частей слова, таких как корень, суффикс и т.д.), что даёт нам характеристику к какой части речи принадлежит слово. Частей речи в русском языке, с падежами, склонениям и прочим, чуть мене чем дофига http://corpus.leeds.ac.uk/mocky/ru-table.tab
Итак всё готово для синтаксического анализа: осталось узнать есть ли предложение с таким частями речи в языке? Здесь подходит тривиальное решение - база данных.
Собственно я не знаю что такого есть у Яндекса что не доступно простым смертным?
Может это:
В{В}мурелки{мурелка?|мурелки?|мурелок?}шлепают{шлепать}пельсиски{пельсиска?}
P.S.: Это я так понимаю собственная разработка яндекса, которую они всё таки решили не использовать 😂
В том и прелесть русского языка, что можно переставлять слова в предложении, не теряя смысла.
Прелесть языка русского и в том, что в предложении слова переставлять можно, смысла не теряя.
Языка русского и в том прелесть, что слова можно в предложении переставлять, не теряя смысла.
В русском языке в предложениях можно попытаться переставить слова (без потери смысла), но с потерей читаемости.
П.С. Шингл шинглом, но если они будут считать части речи внутри предложения?
ТС, как индексируется обработанный текст? есть примеры сайтов в индексе?
ТС, как индексируется обработанный текст? есть примеры сайтов в индексе?
Скинул в личку. Просьба не палить публично, с сайта идет деньга.
Собственно я не знаю что такого есть у Яндекса что не доступно простым смертным?
У Яндекса есть общая картина РУнета, миллионов сайтов, со статистикой, данными по анализу текста различных тематик итд.
Не будем приписывать машине волшебных свойств, но кое-что он все-таки может, например отлавливать такие тексты.
У Яндекса есть общая картина РУнета, миллионов сайтов, со статистикой, данными по анализу текста различных тематик итд.
Не будем приписывать машине волшебных свойств, но кое-что он все-таки может, например отлавливать такие тексты.
Я тебе в личку написал, глянь плс.