Устройство Матрикснета - информация от Яши

12 3
GE
На сайте с 26.02.2014
Offline
74
7843

Яша тут выдал кое-что про устройство своей самообучающейся шайтан-машины: /ru/articles/41124

Думаю, многим будет не только интересно, но и полезно.

В связи с этим вопрос к знатокам: что из этой информации, по вашему мнению, может помочь в продвижении?

Слабым местом технологии, на мой взгляд, остается привлечение к ее обучению асессоров, которые хоть и работают по четким скриптам, но всё равно не в полной мере абстрагированы от личностных предпочтений "хорошо/плохо", особенно в плане оценки дизайна.

Для начала нужно собрать обучающую выборку, в которой будет набор пар (документ, запрос). Каждой такой паре асессоры ставят оценку – насколько этот документ подходит к запросу. Кроме того, в этой строке – документ, запрос, оценка – еще будут признаки (запросные, документные, документно-запросные).
Аудиты, консультации по SEO. Пишите ЛС.
[Удален]
#1

Анализ документов из ТОПов 10 в разных коллекциях, принимает всё более явный и простой смысл.

Выдумывать что-то новое приходится всё меньше и меньше.

Green_go
На сайте с 01.07.2016
Offline
34
#2

Да ничем это не может помочь. Ради "научного" интереса почитать, что-нибудь по прикидывать можно. А вот разобраться...

Это как с любым кодом - сделать изначально проще, чем разобрать образец и понять как оно работает, да еще что-то допилить там под себя. При этом и познания должны быть, ну как минимум на уровне автора. Добавим сюда тучу нелинейных зависимостей и слоев + фильтров...

Все-равно, что сейчас свалится летающая тарелка, а мы ее захотим быстренько разобрать и понять как к ней пульт от квадрокоптера приляпать, чтобы с него ей управлять.

Алексей Питерский
На сайте с 23.02.2009
Offline
543
#3
Green_go:
Да ничем это не может помочь. Ради "научного" интереса почитать, что-нибудь по прикидывать можно. А вот разобраться...

Это как с любым кодом - сделать изначально проще, чем разобрать образец и понять как оно работает, да еще что-то допилить там под себя. При этом и познания должны быть, ну как минимум на уровне автора. Добавим сюда тучу нелинейных зависимостей и слоев + фильтров...

Все-равно, что сейчас свалится летающая тарелка, а мы ее захотим быстренько разобрать и понять как к ней пульт от квадрокоптера приляпать, чтобы с него ей управлять.

А мы и так хорошо делаем детей...

D
На сайте с 07.11.2000
Offline
184
#4
GlebEGA:
В связи с этим вопрос к знатокам: что из этой информации, по вашему мнению, может помочь в продвижении?

Написать свою самообучающуюся сеть, которая будет обучаться на обученной выдаче Матрикснета.

Николай Письменный
На сайте с 15.06.2009
Offline
223
#5
GlebEGA:

Слабым местом

Настоящее слабое место - то, что все это работает в России... сегодня есть клиенты и покупатели с деньгами, через год может не быть вообще.

Раскрываю все секреты интернет маркетинга на конкретном кейсе (http://ampersant.ru/spravedlivost/): от создания сайта, до итогового результата проекта через год (http://ampersant.ru/spravedlivost/#god). Готовая инструкция как правильно сделать и раскрутить сайт!
Юра Никулин
На сайте с 22.02.2014
Offline
26
#6
nikola32:
Настоящее слабое место - то, что все это работает в России... сегодня есть клиенты и покупатели с деньгами, через год может не быть вообще.

А с чего вы взяли что асессоры это слабое место. Поиск не может производится только по текстовому составляющему. Учитываются и ПФ и корреляции людей. Человек скорее всего будет постоянной составляющей.

Если взять пример - яша запустил с турции поиск для теста, так вот без данных пф и асессеров там ад был. Токое дерьмо выдавало.

mark3000
На сайте с 29.08.2009
Offline
115
#7
GlebEGA:
Слабым местом технологии, на мой взгляд, остается привлечение к ее обучению асессоров

Не думаю, как раз наоборот это может быть сильным местом.

Дело в том, что алгоритмы ПС постоянно изменяются в отличии от контента, который может годами лежать на сайте. Контент конечно в интернете это подавляющее большинство мусора, но есть и действительно качественные статьи, которые не выходит в ТОП только потому что алгоритм ПС на данный момент им этого не позволяет. А в ТОП лезут те, кто попросту лучше оптимизировал статью, при том что не всегда это качественный контент. Асессоры в какой то степени могут в этом помочь улучшить.

Слабое место любой ПС на мой взгляд это развитие, но без этого никак.

LINKOSCOP 4.2 (http://www.interascope.biz/linkoscop-4/) это 100+ функций для работы с внутренней перелинковкой
[Удален]
#8
GlebEGA:
Думаю, многим будет не только интересно, но и полезно.

Интереснее было, когда гугль проиндексировал и выпустил в свою выдачу то, что для яндекса оказалось сюрпризом. [Сам не видел, мне рассказывали, мопед не мой]. И там были циферки рядом с перечнем. И увидели тогда люди силуэт матрикснета, и опечалились.

Суть проста: выборку составляют люди по куче параметров, на этой выборке учат машину, вываливают в буки (раньше, когда деревья были большими и допиливались напильником), тестят / слушают вой оптимизаторов, допиливают, вываливают новый алго в живую выдачу, смотрят выдачу и ПФ на предмет поиска тонкой грани "выдача/нам бабки", подкручивают крутилки алго (обратная связь + ассесоры) и т.д. То есть есть "живая машина", которая выдаёт живую выдачу, а есть "машина в засаде" которую учит "живая машина" и асессоры. И эта "машина в засаде" в какой-то момент внезапно выскакивает, а "живая машина" - прыг в засаду, на обучение. В этот момент на сёрче появляется новая строчка в теме про АП. Иногда несколько тем в разных местах, но все с кучей восклицательных знаков.

Исчо: любые попытки массового влияния на выдачу стали приводить к кратковременным результатам. Потому как то, что выигрывало, через некоторое время становилось "нормой" или "средним арифметическим" и переставало давать преимущество - зверюгу в засаде обучила зверюга в поле.

Если все асессоры поставят паре "запрос-документ" 10 баллов по всем пунктам, то далеко не факт, что в живой выдаче документ будет на первой странице.

A
На сайте с 05.03.2006
Online
241
#9

Я наблядаю странную штуку. Есть некоторые страницы которые были заглушками - типа ишем информацию. Алгоритмы отбросили страницу назад. Через какое то время была добавлена информация. А вот страница так и не вернулась в топ. Ручь идет о Нч. Такое впечатление что если алгоритм отметил ее некачественной больше к ней не возвращается.

[Удален]
#10
avangard:
Есть некоторые страницы которые были заглушками - типа ишем информацию
avangard:
А вот страница так и не вернулась в топ.

10 несогласованностей.

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий