- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Ну для цепей Маркова не обязательно заниматься нейронными сетями как впрочем и быть "супер-пупер" математиком, достаточно быть программистом уровня выше "школьника-самоучки" (что подразумевает знание математики на уровне "чуть выше школьного") и программа такая создастся с нуля за час. (50 минут подумать/прикинуть и 10 минут написать)
P.S. Я не "дорвейщик", и даже толком и не "сеошник" я программист.
На сколько я понимаю понять текст для людей или нет может только человек.
Гугль пользует другие методы.
Просто у меня есть знакомый, отличный математик/программист.
это хорошо, но и самому бы неплохо знать ...
так вот спроси его, может ли сгенеренный по маркину контент иметь заданную плотность ключевого слова ?
На сколько я понимаю понять текст для людей или нет может только человек.
Гугль пользует другие методы.
Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".
Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".
ага кушают. И никак не могут опредлелить есть там смысл или нету.
Судя по последним патентам гугля, маты кацы всерьёз взялись за автоматические / полуавтоматические генераторы текста. Даже новостные порталы с ограниченным лексиконом и словарным запасом сотрудников страдают... Кроме плотности к. слов гугл отслеживает частоту встречабельности тех или иных фраз в массе текста и может отнести текст к низкокачественному/сгенеренному даже за то что там 2 раза упомянулась фраза которая должна была там появиться с вероятностью 1:1000000.
Скажите, как на данный момент гугл относиться к тексту который был создан по алгоритму цепей Маркова? Он его сразу распознает на текстНеДляЛюдей или нормально проходит?
Эти "дети лейтенанта Шмидта" совсем оборзели. Уже и до раздела "Гугл" со своими бомжацкими вопросами добрались.
вопросы ТС больше соотносятся к разделу Doorways, Hallways, Metatags&Cloaking
Я ещё раз толкну мысль: идеально сгенерированный текст Гугль отловить не в состоянии. Но он в состоянии определить стиль текста и на этом основании определить качество текста. Речь идёт о том, что разговорный, газетный, научный и литературный тексты обладают разными ярко выраженными характеристиками - оборотами, словарным разнообразием, частотой употребления терминов и синонимов к нему, прилагательных, глагольных форм и т.п. и т.д. Более того, Гугль обладает очень большой коллекцией n-gramm, т.е. может делать далекоидущие выводы сравнивая соседние документы с сервера: скажем, слишком обширное использование статистически редких n-gramm в разных документах может служить признаком автогенерированности.
Таким образом, если есть желание максимально продлить успешную жизнь таких текстов, необходимо очень тщательно подходить к обучающим коллекциям. Уж всяко нельзя для этого парсить выдачу, т.к. можно накушаться такого же автогенерённого контента и поставить под угрозу проект с самого начала. Вот как-то так.
а вот например текст написанный малограмотным переводчиком? может даже хуже чем автоматическая переводилка - как такой текс рассматривать гуглу?