GreenLis

GreenLis
Рейтинг
106
Регистрация
20.01.2017
Интересы
Агрегация, систематизация и переработка информации
Сержевик #:

У меня практически такая же ситуация на сайтах. Никогда ничего подобного не было, весь контент пишу сам, уникальность проверяю, что все было уникальным. Спама точно нет, доступ на все ссылки, комментарии закрыт. Сайты не развлекательные. Даже реклама от Яндекс только стоит. Ни желтой ни какой либо другой рекламы нет. И вот прилетает такое сообщение, не уникален контент, спам, реклама. Смотрю сайта в поиске нет. Начал им писать. На третий день ограничения сняли, написали, что сбой с алгоритмами. Ок, бывает. Через пару дней прилетает такое же на второй сайт. Опять пишу, доказываю. Ограничения сняли, но молчат. Прошло 2 дня, вчера пришло на почту, что опять спам, реклама... бегу в метрику, там чисто, ничего нет. А сегодня уже ограничения поставили, опять написал им. Жду. Вот думаю, теперь они снимут и через 2 дня на следующий сайт пришлют и так по кругу будет. Очень все это не приятно, выматывает, не даёт нормально работать. 

Первый раз у меня тоже сняли, второй - сказали, условно, "ваш сайт - говно, всё ранжируется правильно, развивайте и учитывайте наши требования", потом молча вернули траф, на третий раз уже прилетела метка и теперь "нам надо проверить алгоритм, это займёт пару недель или больше, вернусь с ответом когда решим".

Лишний раз убедился в правильности сворачивания работы на ру-сегмент сети, не надо теперь с горящей жопой бегать и нервничать. Снимут - хорошо, не снимут - и черт с ним, буржнет кормит стабильно.

nibbl #:


Вопрос - Может ли "улучшенный" алгоритм яндекса подумать это тот говносайт с большим контентом первоисточник, а мы "нехорошие" люди воруем с того сайта куски контента и просто вставляем на свои сайты? 

Бинго. С точки зрения тындекса у них вроде как более структурированный, семантически полный контент. К тому же тындекс очень любит портянки.

borisd #:

Нейронные сети склонны к обобщению. Под неоригинальным контентом яндекс может трактовать не только копипаст и не только поверхностный рерайт, но уже и глубокий рерайт и даже тексты по мотивам других текстов. Т.е. можно предположить, что то, что здесь называют "авторскими текстами" нейросеть яндекса таковыми уже не считает. Выражусь конкретнее: если вы дали задание профессиональному копирайтеру написать статью на какую то тему по образцам, имеющимся в интернете, то такое "творчество" яндекс (возможно) уже не считает за оригинальный контент.

Это всего лишь одно из предположений. Но если это так, то придется радикально менять подходы к созданию контента. Создать по настоящему оригинальный контент (на семантическом уровне) - это очень сложно и дорого (в 10-100 раз дороже "обычного" копирайта).

Емнип, называется "контент не несущий дополнительной ценности"

avangard #:

Яндекс явно сокращает количество сайтов в выдаче. Среди маленьгих очень много явных ГС. 

Дело не в объёме, а в минимальной финансовой независимости. На данный момент это негласно признано основной помехой для исполнения первой функции власти, поэтому предпринимаются меры по исключению возможных эксцессов.

avangard #:

У меня версия следующая.  Как вижу попали относительно крупные сайты.

Не важно статейник или агрегаторы.

Все они агрегаторы какой-то информации. Возможно из-нехватки ресурсов - яндекс будет поддерживать минисайты

по аналогии с соцсетями или дзеном. Как таковы среднекрупные сайты буду рано или поздно удалены.

Версия не адекватна, в ветке было полно народу с маленькими проектами до 1-1,5к\сутки трафа. Просто когда тебе режут долго разрабатываемый серьёзный проект - ты с большей вероятностью лезешь на форум.

martianic #:

Мои 2 копейки. Интересная история с 

Так он мне отказал. Говорит это контент который ведет к потенциальному конфликту... 

Именно поэтому сегодня зарубежом многие смотрят в сторону т.н. "local LLM". Они пока что не обладают полноценной функциональностью Chat-GPT-4, но в плане генерации текстов некоторые модели уже вплотную приблизились до уровня GPT-3.5. Другой вопрос, что для запуска на собственной машине нужны либо пара топовых потребительских видеокарт, либо какая-нибудь A100 на 80гб памяти, либо танцы с бубном в облаке...

Я так понимаю, вопросы о запрещении YandexGPT дообучаться на наших сайтах будут попросту игнорироваться?
Александр #:

У меня на одном из сайтов аж с начала апреля траф с Яндекса стал постепенно падать.
Но я это связывал с тем, что, возможно, Яндекс выкатывает какие-то еще свои обучающие сервисы, а мой сайт, как раз, обучающий / предлагающий примеры решений рабочих задач.

Аналогично, но я тогда связывал падения трафика с началом атаки поведенческими ботами.

Хотелось бы получить ответ относительно запрета для YandexGPT использовать материалы сайта для дообучения и вывода в поиске вместо выдачи.

Dambo #:

Хз, за 12 лет на меня полно ссылок на Пикабу, ЯПлакал, ЖЖ, в соцсетях. 

Это не аргумент, в общем смысле. Возможно вопрос в тематичности доменов ссылочного.

Всего: 487