Он, скорее всего, имеет ввиду типографские символы, которых полно в непочищенном скан-контенте.
Что-то слабовато для такой супер-тизерки. У меня на серче баланс и то больше 😂
[ATTACH]155276[/ATTACH]
Откровенно слабый сценарий и некудышное актёрское мастерство 😒
Владелец холдингов, заводов, газет, пароходов рвёт попу в чужой теме "с душком" за два косаря деревянных 🤣
Зависит от процентного соотношения повторяющегося текста на страницах дора и уникальной текстовки. Если у тебя генерированного текста на странице кот наплакал, а повторяющиеся на каждой станице пункты меню занимают 50-60% от всего текстового составляющего, то закрыть блоки от индексации будет разумно. Если уникальной текстовки раз в 8-10 больше, чем меню, то пофиг ИМХО.---------- Добавлено 09.09.2016 в 20:26 ----------
Каким образом?
[ATTACH]155164[/ATTACH]
...............................
Это явление, связанное с 1 сентября, просто нужно немного подождать.
Как будет формироваться база в процессе обучения? Тупо наиболее часто встречающиеся слова и обороты? А как же "великий и могучий", в котором присутствует игра слов и прочие фишечки, вроде "во что бы то не стало", в котором слово кардинально меняет значение в зависимости от контекста?
Однако замахнулся ты на искусственный интеллект...
Удачи!
Это был просто пример. А вообще там на ура размножаются новости от культуры и до политики.
Это и не всякий человек-то сможет написать 😂
По моему скромному мнению, добротное размножение на голову выше любой генерации, всех этих цепей Маркова, стыковки по запятым, мешанки из предложений и пр. У меня сотни доров на размноженных текстах, некоторые ушли жить на второй год. Дропаю не из-за бана, а из-за потери актуальности, так как они очень узконишевые. Да, они не банятся, а медленно умирают (постепенное выщёлкивание страниц из индекса) из-за никудышних ПФ. Но мне не выгодны хорошие ПФ внутри сайта, так как они снижают конверсию 🙄
Х-м-м, вот сейчас я закину тебе в личку четыре ссылки из Гугл-Ньюс. Там четыре новости об одном событии на разных сайтах. Имеет место быть и размножение, и щадящий синонимайз. Это всё ветви одного дерева. Такие сайты живут годами, а это Гугл-Ньюс - не хухры-мухры...