Hkey

Hkey
Рейтинг
222
Регистрация
30.09.2006
Интересы
Java
Appassionato:
А оно походу так и есть :)

В теме относительно новый метод спама.

Смогли бы ассесоры собрать базу в пару тысяч сайтов с этим видом спама - врядли.

Основная масса ассесоров даже близко не знает как устроен поиск - их задача ставить оценку сайту в результатах поиска и всё (есть знакомые). Ассесор звучит гордо, но по сути это IT-чернорабочий.

Appassionato:

Матрикснет для поиска в том виде, в котором он используется Яндексом, вообще не факт, что оправдан. Т.к. все мы видим ГСы в топах, особенно региональных.

В регионах почти все ГСы. Матрикснет оправдан поскольку ассесоры получают намного меньше чем разрабы. И нанять ассесоров легче чем найти хороших разрабов, а разрабов можно перекинуть на разработку других сервисов. Более того, ассесорами проще управлять. Получается экономия денег, админресурса и прогеров.

Appassionato:

Это у нас какой год - 2005-й или 2006-й?😂

В этих годах, скорее всего, 4го шага не было.

Appassionato:
hkey, рассуждаете прям, как сотрудник Яндекса :)

Я рассуждаю, как разработчик.

богоносец:
Обучаемые/настраиваемые олгоритмы... могут иметь отношение и к фильтрам тоже, а не только к ранжированию.

Чтобы обучаемые алгоритмы ввести нужно довольно большая выборка на каждый способ SEO спама. Для некоторых случаев, например покупных ссылок это оправдано и возможно.

Для фильтров применять алгоритмы вроде Матрикснет не оправдано, поскольку параметры по которым определяется спам в разных случаях разные и ответ нужен бинарный да или нет, а не в стиле "с вероятностью в 86.5% эта ссылка непотная".

Вряд-ли у разрабов имеется пару тысяч примеров спама определенного вида, чтобы обучить программу. Особенно если говорить о новых методах как в этой теме. В противном случае, фильтры Яши бы на пару лет отставали от новых тенденций спама. И Яши пришлось бы учить ассесоров как отличить один из видов спама от другого.

Имхо процесс происходит так:

1. К разрабам на стол попадает пару десятков примеров.

2. Они пишут алгоритм, чтобы, скажем, 90% примеров отфильтровывалось.

3. Потом все это прогоняется по базе неспамных сайтов, чтобы исключить ложные срабатывания.

4. Потом фильтр вхолостую прогоняется по нескольким кластерам и проверяются первые несколько сотен срабатываний.

5. Исходя из 3, 4 пишутся исключения.

Для определения какие именно санкции применить Ты последний или -20, может применяться обучаемый алгоритм, поскольку здесь, нужно оценивать множество критериев, например, пользу для пользователей, наличие уникальной инфы и прочее и здесь оценка субьективная, а вот есть ли спам на сайте - это уже объективная оценка. Например, совершил ли ты преступление - есть объективные критерии, а какой тебе срок за это дать - это уже субъективное решение судьи.

vanchello:
Не работает даже с настройками 100 стр. в облаке, пример:
1) сайт1 (облако слева, в сайдбаре)
2) сайт2 (облако справа, в сайдбаре)

Вы что издеваетесь? В вас облако не в первом Диве. А второго облака у вас нет, второй див пуст.


Здесь облако - ХОТЯ ЕГО НЕ ДОЛЖНО БЫТЬ ЗДЕСЬ
<div class='cloud1'>
ЗДЕСЬ ДОЛЖНО БЫТЬ ПЕРВОЕ ОБЛАКО
<span ...>ЕЩЕ<span>
</div>
<div class='cloud2'>
ЗДЕСЬ ДОЛЖНО БЫТЬ ВТОРОЕ ОБЛАКО
</div>
Mega66:

Начал лазить по страницам форума, чтобы посмотреть что получилось. В базе полно ключей, но выводит на всех страницах почему-то одни и те-же ключи.

Для облака есть параметр рандомности

Mega66:

Далее. Некоторые страницы в админке прописаны правильно, а некоторые такого вида /showthread.php%3Ft%3D661 пробую отредактировать URL страницы на /showthread.php?t=661,

Наверное у вас старая версия.

---------- Добавлено 22.02.2012 в 18:04 ----------

worldgaysex:
folder - постоянно разное значение, если так прописать
/*/?pqr
*?pqr
будет работать?

нет, скорее всего в след. версию добавлю

---------- Добавлено 22.02.2012 в 18:11 ----------

bobur0, в последний раз прошу не флудить в моей теме.

богоносец:
Гарантируете, что влияние перелинковки ещё есть?

Перелинковка дает вес и ссылочное не думаю что эти два фактора когда-либо отменят.

богоносец:
Например, они фильтруют и за то, что может уже и не влиять.

Матрикснет к фильтрам не имеет отношения, если бы имел, то фильтров как отдельной сущности не было бы и суппорт ничего не мог бы сказать о "санкциях". Фильтры были бы "гладкими" а не дискретными в стиле ты последний или -20. Более того после введения мартикса - старые фильтры остались.

богоносец:
Или влиять с неопределённым знаком... как там настроится матрикснет, если он есть вообще.

По поводу знаков.

Это позволяет учитывать очень много факторов ранжирования — и при этом не увеличивать количество оценок асессоров и не опасаться, что машина найдет несуществующие закономерности.
...
Другие методы машинного обучения позволяют либо строить более простые формулы с меньшим количеством факторов, либо нуждаются в большей обучающей выборке.

http://company.yandex.ru/technologies/matrixnet/

Добиться этого без знаков для большинства переменных практически невозможно. Хотя знаки могут задаваться на конкретном диапазоне, а после него знак может меняться (переоптимизация). Формула матрикс нета, имхо, должна иметь много ограничений на значения параметров, чтобы не получилась куча голубиных суеверий.

bobur0, вам как новичку на этом форуме дам совет - читайте первый пост темы, перед тем как в нее писать, а то получите -10.000 за один пост и потом пару лет в ноль будите выходить. В первом посте написано откуда данные по НЧ собираются. И не флудите в моей теме, на форуме есть специально для вас раздел "Любые вопросы от новичков".

worldgaysex:

http://domain.com/folder/?pqr=1:666b...b65f53:1:582:1
подскажите как правильно прописать в -Исключенных URL- что бы новые не запоминались и не ставились?
так /?pqr или так /?pqr* или так ?pqr*

/folder/?pqr

Теоритизировать можно до бесконечности. Мы рассуждаем на пустом месте, сабжевый сайт нарушал лицензию Яши сеоспамом, вот его зафильтровали. Вот и вся новость. Каким образом он нарушал - вопрос последний.

Единственный вывод, который можно сделать из этой темы, что у Яши довольно "умные" фильтры.

Если кто-то покажет сайт, который зафильтровали за контекстные ссылки, которые полезны были пользователям, а не просто морду по запросу прокачивали, то можно рассуждать дальше.

---------- Добавлено 22.02.2012 в 02:33 ----------

Kamchess:
Да, ну, .ua - скучно. Чё-нить коммерческое в .ru-сегменте покажите.

Моих лично коммерческих сайтов в ру нет. Покупателей и клиентов сайты я не свечу.

vanchello:
То "ЕЩЕ" просто исчезает со страницы и не появляется пока не обновишь (проверил спецом на двух проектах)

Проверил код. Если кликаешь на "еще" ссылок в облаке становиться больше. Если не стало, значит в вас посадочных страниц меньше чем 20.

Установка на PHPBB

Проверялось на PHPBB3. Для других тоже должно работать. Если не работает пишите на мыло.

Все пункты кроме кода и место его вставки используйте из раздела другие движки.

  • Откройте файл includes/functions.php
  • После <?php напишите

  • global $phpbb_root_path;
    include_once($phpbb_root_path.'/HTracer_Renamed/HTracer.php');
  • Потом в функции page_footer
  • $template->display('body');

    ob_start();
    $template->display('body');
    htracer_ob_end();



---------- Добавлено 22.02.2012 в 01:25 ----------

vanchello:
что-то не работает, выводится такое же облако, с неактивной копкой "ЕЩЕ" внизу...

а если кликнуть на еще?

Всего: 2639