Проверено, что у поисковика есть проблема туева хуча сайтов с дублированным контентом различной степени переделки - Google

А что Гугл будет делать с генерированным контентом в будущем?

Lor · 2016-03-25T05:16:31.0000000Z

Почитал в интернете про софт для генерации контента. Мне вот стало интересно: современный уровень развития технологий позволяет без проблем генерировать контент, который практически не отличим от написанного человеком(ну, как минимум, слегка выпившим Бардо :) ). Я уже сегодня вижу в интернете кучу "блогов", которые явно сгенерированы. А еще можно добавить кучу инфы совершенно законно и бесплатно. Я видал очень правдоподобные фэйки, которые стоят в топе - сходу и не отличишь, причем, в очень специализированных областях. Что будет Гугл с этим делать уже завтра, если не вчера? Возврат к ссылкам? Поведенческие? Массовое "трастирование"(возможно даже ручное)? Честно говоря, в болтовню про "искусственный интеллект" я не верю - он будет там же, где их G+, очки, машины без водителя и прочие игрушки, на которые они тратят наши деньги. Может сдохнет?! :crazy:

61

hitboss

28 марта 2016, 20:36

#41

богоносец:
Как ранжирующие системы смогут определить — своё вы привнесли или не своё переписали? И уникальность смысла как распознают?

ps О смысле не заботятся вообще например журналисты, судя по новостям о B737-800 например. И Гуглю не до того. Ранжирует не по смыслу. Пользователей устраивает, соотв ПФ...

Свое-не свое по принципу "кого первого проиндесил". Есть источники новостей, например, а есть паразитирующие на этих источниках сайты.

781

богоносец

29 марта 2016, 04:17

#42

Как вычистить паразитов?:

www.google.ru/search?q=катастрофа+ростов

news.google www.google.ru/search?tbm=nws&q=катастрофа+ростов

И сможет ли он отличить у кого первоисточник, а у кого рерайт? Или это для Гугла разные новости?

И со смыслом всё же как дела?

Может ещё про боговдохновенность алгоритмов поговорить?

Дополнительная инфа по пессимизации Стоит ли заниматься рерайтом Новости Google - попал

61

hitboss

29 марта 2016, 09:20

#43

богоносец:
Как вычистить паразитов?:
www.google.ru/search?q=катастрофа+ростов
news.google www.google.ru/search?tbm=nws&q=катастрофа+ростов

И сможет ли он отличить у кого первоисточник, а у кого рерайт? Или это для Гугла разные новости?

И со смыслом всё же как дела?
Может ещё про боговдохновенность алгоритмов поговорить?

ну как же

совершенно ясно, что для гугла первоситочником будет тот сайт, где новости систематически появляются раньше чем на других сайтах.

рерайт гугл уже объединяет в своих гуглоновостях

вот же

https://news.google.com/news/section?cf=all&pz=1&topic=t

если навести мышу на новость, появится стрелочка "показать похожие"

то есть, у каждой новости есть топовый источник и есть "похожие", которые суть рерайт

несмотря на то, что на каждом сайте новость фактически переписана своими словами, гугл умеет определять что эта новость похожа на другие, и умеет объединять похожие новости.

а какие дела со смыслом?

сделать краткую выжимку инфы из текста - какие проблемы? убираем всю "воду" и слова паразиты, получаем чистую инфу. где инфы больше - там скорее всего текст полезнее.

сочетаем метод выжимки смысла + ПФ + траст = получаем ранжирование.

В Google рассказали, как WhatsApp планирует запуск персональной Google: низкий трафик не

929

Присущ

29 марта 2016, 09:46

#44

Пользователю не важно кто первоисточник, а значит и пс, а пул новостников которые могут быть первоисточником для ПС не секрет, тратить ресурсы для точного определения ему не к чему.

Посмотрите похожие новости и ужастнитесь, зачастую там разные, но пользователю на это плевать, а значит и пс. Определить рерайт можно, но не к чему, важно качество текста, а не порядок слов и тут грамотность рулит.

Есть топовые и похожие, но обывателя для которого ПС работает и благодаря наличию которых создает свой бизнес, иинтересует новость и не кто первый.

Прототипы и юзабилити, чтоб продавал и в топ попал Анализ сложившихся бизнес моделей и поиска точек роста Директ — от 2500 р, включая бюджет на клики / Аудит РК до и после запуска — от 5000 р

Google: иногда скопированный контент Как избежать аффилированности сайтов Google о SEO для

949

юни

29 марта 2016, 11:01

#45

Присущ:
Пользователю не важно кто первоисточник

Разве? 10 заинтересованностей.

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит. Пишите в личку.

781

богоносец

29 марта 2016, 14:55

#46

hitboss:
сделать краткую выжимку инфы из текста - какие проблемы? убираем всю "воду" и слова паразиты, получаем чистую инфу.

А со смыслом-то как? Или когда же наконец!

ps А ведь проблема серьёзней, чем кажется. Если пошатнется вера во всемогущество — доходы не возрастут, а расходы на борьбу со спамерами увеличатся.

352

Lor

29 марта 2016, 15:11

#47

hitboss:
совершенно ясно, что для гугла первоситочником будет тот сайт, где новости систематически появляются раньше чем на других сайтах.

Это не работает. Проверено.

Йопез - форум без модераторов. https://yopez.com

781

богоносец

30 марта 2016, 02:58

#48

А если в миллионах голов опровергнуть подобные «совершенно ясно» и «Гугл уже давно умеет»?

(это такой мелочный шантаж)

61

hitboss

30 марта 2016, 07:37

#49

мы говорим не о том, что есть, а о том, что будет

Смотрите, у поисковика есть проблема: туева хуча сайтов с дублированным контентом различной степени переделки - от откровенного шлака/синонимайза до т.н. рерайта, который сводится к изложению существующего текста другими словами.

Для поисковика выдача однотипных, об одном и том же, текстов сплошняком в выдаче не есть гут.

я предположил вариант как поисковик может ограничить поток шлака в выдаче. Для этого ему нужно выбрать один источник, содержащий наиболее полную информацию, а остальные источники забить за 10ю страницу выдачи. Таким образом в выдаче будет более-менее разнообразие, а рерайт как он есть сейчас, без привнесения новой информации, станет бессмысленным.

Там, где контента мало, можно выводить и рерайт; там, где его и так достаточно - рерайт можно прятать.

Я не говорю о понижении в выдаче сайтов целиком (хотя если там %% рерайта будет зашкаливать, почему бы и не опустить сайт полностью), я говорю о ранжировании определенных страниц.

Еще раз, статьи, рассказывающие об одном и том же, переписанные 100500 раз с одной-единственной - забивают выдачу, и не нужны как таковые. Юзеру достаточно одной, любой, чтобы получить нужную инфу. Качество статей же должно проявляться в том, чтобы добавлять ценность информации - не просто переписать, а развернуть тему, добавить доп. инфу. И вместо битвы за уник будет битва за полноту информации. У кого больше инфы по теме - тот и будет выше.

Как-то так.

1

Google: кавычки не спасут Google: цена не влияет Аналитика поведенческих факторов в

929

Присущ

30 марта 2016, 07:44

#50

hitboss, С потоком новостей, к примеру, я интересуюсь в яндексе по заголовкам и снипетам, но читаю новости только на определенных ресурсах, и мне не нужен первоисточник, мне нужно качество изложения и предсказуемый процент политизированности в изложении. Тоесть класть на первоисточник. Тот же интерфакс меня не устраивает, а ведомости устраивают, и не важно кто из них мог быть первоисточником. Большинство также, процент маргиналов ищущих первоисточник не интересен будучи незначительным меньшинством для пс, которое работает на большинство.

пс. А степень подмешивания в серпе около похожих материалов и сейчас ПС сможет отрегулировать без проблем, если на то будет запрос пользователей или коммерческих интересов самой пс.

пс.пс. Получается тема бессмысленна)))

Возможные пробелы в системе можно ли кидать новость Не уник, уник -

Маркетинг для шоколадной фабрики. На 34% выше средний чек

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

А что Гугл будет делать с генерированным контентом в будущем?