Gotthard

Рейтинг
85
Регистрация
07.02.2018
alyaaaska #:

Думаете просто на все подобные страницы 301 проставить будет не лучше? 

Ну... это будет из области предположений... Наверное... Но я бы поддоменами поигрался. Тем более, у меня есть что-то подобное, и это работает (раньше не понимал почему).

Честно - не знаю, нужно смотреть код дальше и анализировать. Но, кажется, по части обработки всяких 301 там нет ничего.

Booch24 #:
Короче говоря, они настолько усложнили систему, что она не работает нихрена.

Не совсем так. Образно, гугл рассматривает страницу с разных точек зрения (тематика, фокус, спам, качество, сайт) и получает набор compressed metrics. По вашему запросу гугл формирует SERP из своего индекса, ранжируя по compressed metrics и добавляя новые страницы, которые пока не ранжировались deep-аглоритмами, основываясь ТОЛЬКО на общих метриках сайта. Так, например, новость из CNN минутной давности попадает в топ-1.

alyaaaska #:

С яблоками в общем примере. В таком случае стоит банально попробовать исключить все инфо страницы с упоминанием главных ключей идущих по комерцу? 😀 Выходит нельзя иметь весомый ресурс который будет охватывать всю нишу от А до Я с инфо и комерцом. Раз тут ползунки взаимозависимы, а не отдельно регулируемые с точки гугла.

На поддомен всю инфо вынесите просто. На основном пишите read more about iPhone's memory, например - и отправляйте на поддомен. На поддомене в конце пишите buy что-то там - и отправляйте обратно.

paules #:
что именно известно с 50-х годов ?

Матстатистика, рекомендую:

https://urait.ru/book/teoriya-veroyatnostey-i-matematicheskaya-statistika-537085

alyaaaska #:
 Не с  рубрики в магазине продажи айфонов инфо\блог\и т.д. страницы на тему автомобильных регистраторов - нет, а соответственно на тему самих же яблок (их ПО, модели, фишки и т.д.). 

Тема "тех же яблок" для гугла - инфо. По инфо продвигаетесь вверх. siteFocus расширяется по инфо. А по ecommerce он зашумляется

Сделайте на поддомене инфо.

Вот собака - тоже думал долго: отчего крупняк блоги делает на поддоменах или отдельных сайтах. До потому что у них инсайд был!! Утекало из гугла давно, только не для всех.

alyaaaska #:
Удивляет именно то, что тематика в целом та же, т.е. расширение идет исключительно тематическое.

Тематика не триггер, это весовой коэффициент. Вот в чем штука!

_fan_ #:

Подскажите пожалуйста, есть ли хороший анализ в сети того, что утекло? Кто-то читал, может где-то видел?

Видео, анализ текстовый, может кто-то разбирал в деталях?

Пока все изучают... Анализ есть, в первом посте топика, но пока неширокий. Смотрим код :)

alyaaaska #:

Парадокс однако) грубо говоря, выходит старания расширить охват по ключам через инфо на комерце сводятся к просадке самих же комерца. А была у кого-то практика как такое исправлять? не в тупую же по-отключать материалы...

Посмотрите на leaks недавний - там явно следует (page embedding, site embedding), что каждая страница оценивается тематически, причем по отношению к остальным страницам сайта и, ЧТО ВАЖНО, по отношению к тематике, одной из 5 констант, причем там не триггер 0/1, а взвешенный коэффициент. Добавляя на сайт инфо-страницы, вы понижаете этот коэффициент для всего сайта, и расширяете тематику (siteRadius), тем самым падая по основной своей теме, но поднимаясь по другой.


In the algo leak, we see that siteFocusScore, siteRadius, siteEmbeddings and pageEmbeddings are used for ranking.

What are they?

  • siteFocusScore denotes how much a site is focused on a specific topic.
  • siteRadius measures how far page embeddings deviate from the site embedding. In plain speech, Google creates a topical identity for your website, and every page is measured against that identity.
  • siteEmbeddings are compressed site/page embeddings.


Как вертать назад - понятно из той же утечки. 20 раз обновить страницы :) хаха.


Почему из индекса выпадают страницы, как тут очень многие жалуются - теперь тоже понятно. Не нужно от тематики отходить далеко! Иначе вы охватите всё, но не попадете в "сотни", ранжируемые ОТДЕЛЬНО. То есть если ваша страница достойна топ-1, но не попала в "сотни", а попала "в десятки тысяч" из-за нечеткой тематики самого сайта - всё, вы никуда не попадете, и GSC вышвершет инфу об индексации тоже. Хотя в хистори вы останетесь. Но только SERP формируется из тех самых "сотен" результатов! А вас там не отобрано с самого начала!

НЕЛЬЗЯ распытяться по тематикам!


PS - с высшей математикой у гуглокодеров полный швах. Кого они там набирают?? Это все известно с 50-х годов прошлого века! Образование нынче - дерьмо.

PPS  - у меня есть два конкурента, огромные компании. Я - средняя. Они меня делают по всем показателям, но одну в топе я обхожу, вторую - в части стран обхожу. Всегда думал - отчего? Я явно хуже их по всем показателям. А потому! Теперь ясно: у меня фокус на топике выше, посколько предложение намного уже. А они и жнец, и на дуде игрец. И им гугл выносит siteFocus. Сейчас в соседней теме начинают говорить - "ой, да мы всё это знали". Хрена лысого вы знали.

PPPS - это из материалов в офиц расследовании:

  • “So when you have a query, you need to go and retrieve documents from the index that match the query. The core of that is the index itself. Remember, the index is for every word, what are the pages on which that word occurs. And so — this is called an inverted index for various reasons. And so the core of the retrieval mechanism is looking at the words in the query, walking down the list — it’s called the postings list — and intersecting the postings list. This is the core retrieval mechanism. And because you can’t walk the lists all the way to the end because it will be too long, you sort the index in such a way that the likely good pages, which are high quality — so sometimes these are sorted by page rank, for example, that’s been done in the past, are sort of earlier in the thing. And once you’ve retrieved enough documents to get it down to tens of thousands, you hope that you have enough documents. So this is the core of the retrieval mechanism, is using the index to walk down these postings lists and intersect them so that all the words in the query are retrieved.”

  • “So that’s — the next phase is to say, okay, now I’ve got tens of thousands. Now I’m going to use a bunch of signals to rank them so that I get a smaller set of several hundred. And then I can send it on for the next phase of ranking which, among other things, uses the machine learning.”

alyaaaska #:

Владимир, а что за старая проблема? Когда перебор с инфо? Поделитесь пожалуйста где подробнее можно почитать 

Вот прямо из недавней утечки:

Google detects how commercial a page is

We know that intent is a heavy component of Search, but we only have measures of this on the keyword side of the equation.

Google scores documents this way as well, and this can be used to stop a page from being considered for a query with informational intent.

We’ve worked with clients who actively experimented with consolidating informational and transactional page content, with the goal of improving visibility for both types of terms. This worked to varying degrees, but it’s interesting to see the score effectively considered a binary based on this description. 

Вот:

  • commercialScore  (type: number() , default: nil ) - A measure of commerciality of the document Score > 0 indicates document is commercial (i.e. sells something) Computed by repository/pageclassifiers/parsehandler-commercial.cc
isugarman #:
Вы все равно будете иметь рейтинг, если предположить, что вы что-то вроде The Verge или Forbes

Это он только сейчас открытие сделал для себя?

Всего: 422