Сайт может угрожать безопасности пользователя, или на нём были обнаружены нарушения правил поисковой системы.

T1
На сайте с 11.05.2014
Offline
63
#141
Если у кого-то будут успешные примеры снятия фильтра, пожалуйста, делитесь информацией по проводимым действиям и комментариям от службы поддержки. Есть ощущение, что фильтр срабатывает крайне неточно и задевает вполне нормальные проекты и Яндекс это признает. Хотелось бы найти какие-то общие признаки для таких проектов. Эта информация могла бы быть многим полезна
T1
На сайте с 11.05.2014
Offline
63
#142
plab #:

А чего они вдруг сейчас озаботились? Под волну фильтров прошлой недели попали не только мимикрия, также даунлойд и малополезный контент, где нарушения авторских прав нередкость.

Ну вот добрались и до этой проблемы. Видимо, масштабы такого сайтостроительства и количество жалоб привесило допустимый порог. Проблеме и придали значимость.

А остальные фильтры дообучили на новых размеченных данных. Цель то всегда одна - повышать качество выдачи. Вычищать некачественные и это непрерывный процесс. Чувствительность фильтра на срабатывание поднимают постепенно. Они и про мимикрию так говорят, что мимикрирующие сайты будут постепенно понижаться в выдачи и дальше. Грубо говоря, сейчас запустили первую и сыроватую версию фильтра, но её допилят на наших примерах в фидбэке.
P
На сайте с 26.04.2010
Offline
369
#143
Tiger10x #:
Вычищать некачественные и это непрерывный процесс. Чувствительность фильтра на срабатывание поднимают постепенно. Они и про мимикрию так говорят, что мимикрирующие сайты будут постепенно понижаться в выдачи. Грубо говоря, сейчас запустили первую и сыроватую версию фильтра, но её допилят на наших примерах в фидбэке.

Зачем допиливать? Проще всех подозрительных фильтровать, а потом модерировать руками тех, кто не согласен. Те, за кем явный грешок, за перемодерацией не обратятся.

Tiger10x #:
Цель то всегда одна - повышать качество выдачи.

Цель яндекса как можно больше зарабатывать самому, при этом не распугав пользователей и не нарвавшись на ФАС и другие нарушения закона. С качеством выдачи это связано лишь отчасти. 

T1
На сайте с 11.05.2014
Offline
63
#144
plab #:

Зачем допиливать? Проще всех подозрительных фильтровать, а потом модерировать руками тех, кто не согласен. Те, за кем явный грешок, за перемодерацией не обратятся.


Это титанический труд уже сейчас (и потом еще в перспективе и фильтр же не один, их десятки видов) и Яндекс всегда придерживался автоматизации процессов. Тем более, их технологичная поисковая платформа на базе машинного обучения позволяет автоматизировать эти процессы. Нужно лишь больше размеченных данных для обучения алгоритмов, а именно примеры ложного срабатывания и примеры корректного. Их задача - повысить точность срабатывания алгоритма и высвободить человекоресурсы.

P
На сайте с 26.04.2010
Offline
369
#145
Tiger10x #:
Яндекс всегда придерживался автоматизации процессов

И поэтому Толока?

Tiger10x #:
Нужно лишь больше размеченных данных для обучения алгоритмов, а именно примеры ложного срабатывания и примеры корректного. Их задача - повысить точность срабатывания алгоритма и высвободить человекоресурсы.

То есть прежде чем выпустить алгоритм в продакшн, он его не тестировал на тех же данных? Данных из метрики и поиска недостаточно? Надо еще нытье вебмастеров послушать? При условии их заинтересованности и субъективизма?

T1
На сайте с 11.05.2014
Offline
63
#146
plab #:

И поэтому Толока?

Ну Толока используется не для прямого воздействия на выдачу или конкретный сайт. Толока используется для разметки данных (т.е. подготовке размеченных данных с оценками качества) для последующего обучения алгоритма. После выгрузки оценок толокеров в "комбайн с машинным обучением" система сама находит общие закономерности и расставляет коэффициенты факторам ранжирования (их, вроде, около 1500). Если тестовая выдача с новым алгоритмом\фильтром по их метрикам улучшилась, то ей раскатывают на весь интернет.

Качество алгоритмов тестируется, конечно, но случаи ложного срабатывания после первого запуска весьма вероятны. Что мы в этой ветке и наблюдаем. Да и опросник в панели появился неспроста. Нативно просят помочь с разметкой данных:)

P
На сайте с 26.04.2010
Offline
369
#147
Tiger10x #:
Что мы в этой ветке и наблюдаем.

Чего мы и не наблюдаем. За 15 страниц никто свой ошибочно блокнутый сайт не показал.

-S
На сайте с 10.12.2006
Offline
1355
#148
Tiger10x #:
но случаи ложного срабатывания после первого запуска весьма вероятны. Что мы в этой ветке и наблюдаем

Я наблюдаю в выдаче по любым тематикам и запросам обилие ГС, маскирующихся под СДЛ, а в ветке оказались все СДЛ?

N3
На сайте с 04.07.2016
Offline
91
#149
plab #:

Чего мы и не наблюдаем. За 15 страниц никто свой ошибочно блокнутый сайт не показал.

а смысл, конкретно вы, увидев мой сайт, можете помочь решить проблему? думаю нет, так зачем мне его показывать?

P
На сайте с 26.04.2010
Offline
369
#150
nash300 #:

а смысл, конкретно вы, увидев мой сайт, можете помочь решить проблему? думаю нет, так зачем мне его показывать?

Чтобы доказать ошибочное срабатывание фильтра. Иначе с большой вероятностью он сработал верно. 

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий