А что Гугл будет делать с генерированным контентом в будущем?

hitboss
На сайте с 15.01.2015
Offline
61
#41
богоносец:
Как ранжирующие системы смогут определить — своё вы привнесли или не своё переписали? И уникальность смысла как распознают?

ps О смысле не заботятся вообще например журналисты, судя по новостям о B737-800 например. И Гуглю не до того. Ранжирует не по смыслу. Пользователей устраивает, соотв ПФ...

Свое-не свое по принципу "кого первого проиндесил". Есть источники новостей, например, а есть паразитирующие на этих источниках сайты.

богоносец
На сайте с 30.01.2007
Offline
769
#42

Как вычистить паразитов?:

www.google.ru/search?q=катастрофа+ростов

news.google www.google.ru/search?tbm=nws&q=катастрофа+ростов

И сможет ли он отличить у кого первоисточник, а у кого рерайт? Или это для Гугла разные новости?

И со смыслом всё же как дела?

Может ещё про боговдохновенность алгоритмов поговорить?

hitboss
На сайте с 15.01.2015
Offline
61
#43
богоносец:
Как вычистить паразитов?:
www.google.ru/search?q=катастрофа+ростов
news.google www.google.ru/search?tbm=nws&q=катастрофа+ростов

И сможет ли он отличить у кого первоисточник, а у кого рерайт? Или это для Гугла разные новости?

И со смыслом всё же как дела?
Может ещё про боговдохновенность алгоритмов поговорить?

ну как же

совершенно ясно, что для гугла первоситочником будет тот сайт, где новости систематически появляются раньше чем на других сайтах.

рерайт гугл уже объединяет в своих гуглоновостях

вот же

https://news.google.com/news/section?cf=all&pz=1&topic=t

если навести мышу на новость, появится стрелочка "показать похожие"

то есть, у каждой новости есть топовый источник и есть "похожие", которые суть рерайт

несмотря на то, что на каждом сайте новость фактически переписана своими словами, гугл умеет определять что эта новость похожа на другие, и умеет объединять похожие новости.

а какие дела со смыслом?

сделать краткую выжимку инфы из текста - какие проблемы? убираем всю "воду" и слова паразиты, получаем чистую инфу. где инфы больше - там скорее всего текст полезнее.

сочетаем метод выжимки смысла + ПФ + траст = получаем ранжирование.

Присущ
На сайте с 06.01.2011
Offline
929
#44

Пользователю не важно кто первоисточник, а значит и пс, а пул новостников которые могут быть первоисточником для ПС не секрет, тратить ресурсы для точного определения ему не к чему.

Посмотрите похожие новости и ужастнитесь, зачастую там разные, но пользователю на это плевать, а значит и пс. Определить рерайт можно, но не к чему, важно качество текста, а не порядок слов и тут грамотность рулит.

Есть топовые и похожие, но обывателя для которого ПС работает и благодаря наличию которых создает свой бизнес, иинтересует новость и не кто первый.

Прототипы и юзабилити, чтоб продавал и в топ попал Анализ сложившихся бизнес моделей и поиска точек роста Директ — от 2500 р, включая бюджет на клики / Аудит РК до и после запуска — от 5000 р
юни
На сайте с 01.11.2005
Offline
924
#45
Присущ:
Пользователю не важно кто первоисточник

Разве? 10 заинтересованностей.

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
богоносец
На сайте с 30.01.2007
Offline
769
#46
hitboss:
сделать краткую выжимку инфы из текста - какие проблемы? убираем всю "воду" и слова паразиты, получаем чистую инфу.

А со смыслом-то как? Или когда же наконец!

ps А ведь проблема серьёзней, чем кажется. Если пошатнется вера во всемогущество — доходы не возрастут, а расходы на борьбу со спамерами увеличатся.

Lor
На сайте с 28.05.2004
Offline
352
Lor
#47
hitboss:
совершенно ясно, что для гугла первоситочником будет тот сайт, где новости систематически появляются раньше чем на других сайтах.

Это не работает. Проверено.

Йопез - форум без модераторов. https://yopez.com
богоносец
На сайте с 30.01.2007
Offline
769
#48

А если в миллионах голов опровергнуть подобные «совершенно ясно» и «Гугл уже давно умеет»?

(это такой мелочный шантаж)

hitboss
На сайте с 15.01.2015
Offline
61
#49

мы говорим не о том, что есть, а о том, что будет

Смотрите, у поисковика есть проблема: туева хуча сайтов с дублированным контентом различной степени переделки - от откровенного шлака/синонимайза до т.н. рерайта, который сводится к изложению существующего текста другими словами.

Для поисковика выдача однотипных, об одном и том же, текстов сплошняком в выдаче не есть гут.

я предположил вариант как поисковик может ограничить поток шлака в выдаче. Для этого ему нужно выбрать один источник, содержащий наиболее полную информацию, а остальные источники забить за 10ю страницу выдачи. Таким образом в выдаче будет более-менее разнообразие, а рерайт как он есть сейчас, без привнесения новой информации, станет бессмысленным.

Там, где контента мало, можно выводить и рерайт; там, где его и так достаточно - рерайт можно прятать.

Я не говорю о понижении в выдаче сайтов целиком (хотя если там %% рерайта будет зашкаливать, почему бы и не опустить сайт полностью), я говорю о ранжировании определенных страниц.

Еще раз, статьи, рассказывающие об одном и том же, переписанные 100500 раз с одной-единственной - забивают выдачу, и не нужны как таковые. Юзеру достаточно одной, любой, чтобы получить нужную инфу. Качество статей же должно проявляться в том, чтобы добавлять ценность информации - не просто переписать, а развернуть тему, добавить доп. инфу. И вместо битвы за уник будет битва за полноту информации. У кого больше инфы по теме - тот и будет выше.

Как-то так.

Присущ
На сайте с 06.01.2011
Offline
929
#50

hitboss, С потоком новостей, к примеру, я интересуюсь в яндексе по заголовкам и снипетам, но читаю новости только на определенных ресурсах, и мне не нужен первоисточник, мне нужно качество изложения и предсказуемый процент политизированности в изложении. Тоесть класть на первоисточник. Тот же интерфакс меня не устраивает, а ведомости устраивают, и не важно кто из них мог быть первоисточником. Большинство также, процент маргиналов ищущих первоисточник не интересен будучи незначительным меньшинством для пс, которое работает на большинство.

пс. А степень подмешивания в серпе около похожих материалов и сейчас ПС сможет отрегулировать без проблем, если на то будет запрос пользователей или коммерческих интересов самой пс.

пс.пс. Получается тема бессмысленна)))

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий