G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
Ceres:
У Вики особый статус - я бы на нее вообще внимания не обращал. Вики в серпе - это как слуга народа с мигалкой в пробке.

Согласен на 100%. Вики всегда имеет некие бонусы в выдаче, возможно не постоянные. Не стоит учитывать страницы из вики в анализах, это только путает.

G00DMAN добавил 08.02.2010 в 16:05

mhz:
den78ru, всё-таки, я бы тоже не стал рассматривать Вики наравне с обычными сайтами. Да и не только отсутствием seo-ссылок она отличается, но и трастом — искусственно или естественно завышенным.

Траст тут ни при чем. В дорогих коммерческих топах кроме вики ничего информационного практически и нет. Индивидуальный бонус и траст - как бы слегка разные вещи.

Поздравляю! :)

mhz:
А продвигали-то какое число? Единственное?


Это вряд ли: тогда бы топы занимали сайты, ранее находившиеся в топ20—30. Де факто в топ10 по некоторым запросам вылезли сайты, своим видом не дающие забыть svyatok. И вылезли они, оставив позади с десяток-другой продвигающихся конкурентов.

Примеров сейчас не найду, но в этом топике было много ссылок на эту тему.

Ну так сайты из 20-30 могли так же получить свою порцию плюх, только меньшую.

А никто не подскажет, на сколько можно убыстрить файловые операции увеличением числа дисков?

У меня сейчас стоят RAID 0+1 4*1Тб, контроллеры встроены в материнские, такие.

Основная цель - чтение большого количества маленьких файлов (парсинг коллекций веб-документов), т.е. скорее всего опен-клоз выжирают много времени. Если увеличивать количество дисков, то будет ли расти скорость и как?

gidronic:
Я тоже придерживаюсь такого мнения (либо ужесточен, либо добавили ещё какой-то фактор к этому фильтру).

Но! Почему тогда вернуло улетевшие 20-го сайты, с которыми ничего не делали? Ведь по сути, если Яндекс глянул на них одним глазом (фильтр 20-25 числа) и ему показалось, что сайт спамерский, то при пристальном взгляде (более жесткий фильтр от 2-го февраля) он должен был их не вернуть, а выкинуть ещё дальше (как это произошло в вашем и моем случае).

Но отдельные сайты же вернулись. И их наверное немало. Вот это непонятно никак. Ну не поменялись же у него критерии оценки в момент наладки и подкрутки алгоритма фильтрации в период с 25 по 2 число...

Как вариант - метрика может быть не одна, а несколько. Т.е. фактически несколько фильтров. Причем при попадании сразу под несколько общий антибонус может не тупо суммироваться, а как-то более жестко увеличиваться. Это бы слегка объяснило разные выдачи по запросам типа "" и другим. Если страница, балансируя на грани, попала только под один из фильтров, то при подкрутке фильтра она может трепыхаться то в топ, то из. Если попала под больше одного - улетает гораздо дальше.

boga@voxnet.ru:
А объем - тоже спам?:) На тошниловку то , похоже наплевать.

Смотря что Яндекс считает "тошниловкой". :)

processio:
А то, что он есть в вебархиве я это видел, но не думаю, что Яндексу это важно. В роботсе можно прописать, чтобы робот с вебархива не скачивал сайт, тогда по вебархиву не определишь дату.
User-agent: ia_archiver
Disallow: /

Яндексу не важен вебархив, у него и своя база имеется. :D

auit:
Что же пришло на смену классическим и понятным факторам, что поднимает в топ неадекват (неадекват по понятиям прошлых лет)?

Ничего не пришло, все осталось как и было. :)

Просто некоторые страницы по некоторым запросам получили антибонус (или несколько разных) к релевантности. За спам.

Жан:
Выскажу еще пару спорных предположений!

- как мне теперь кажется, спам-фильтр как и многие санкции Яндекса накладывается на определенный период времени, например на месяц, любит Яндекс этот срок. Это и объясняет, почему до сих пор не вернулись, bdbd.ru и другие, хотя весь спам уже закрыт. У нас тоже возвратов пока нет хотя порезали тексты очень жестко.

Представляете, если это действительно так чем это грозит, внес изменения и жди месяц чем дело закончится, легко и красиво одним параметром ))).

Многие будут спорить, ведь вернулась часть сайтов, но в мой модели вернулись именно те, которые уже которые не попали бы под новую версию спам-фильтра (т.е. они реабилитированы), даже если бы не меняли ничего они бы вернулись.
Этим можно объяснить, те случаи когда возвращались те сайты, в которых ничего не менялось, пока режут "по живому".

Об этом я писал вчера. И "те случаи" объяснить сложно. Вы предлагаете Яндексу хранить копии наказанных страниц? И если фильтр модифицировался, то проверять все копии и снимать наказание задним числом? Не катит, тем более, что резались конкретно спамные тексты в основном.

Жан:
- использование операторов типа, "запрос", !запрос, !!запрос и т.д., во многих случаях приводит к именно отключению спам-фильтра. Мне кажется, что пока алгоритм оттачивают, рано обращать внимание на эти вещи только потеря времени мы ничего не нароем. Когда все устаканится логика вернется.

Мы может ничего и не нароем, а кто-то догадается и расскажет всем. Обращать внимание стоит. И почему Вы решили, что "логика вернется"? Не исключено, что она и не пропадала никуда. ;)

zZmeIOka:
По-моему, как раз очень даже интересны без лидеров, обремененным ссылочным, трастом и т.п. мелочами ;) фактически в отдельных случаях (сайты без ссылочного в топах) можно наблюдать работу "чистой формулы". Закономерностей только особо не много, можно сделать только слишком общие выводы. И то не окончательные, естественно.

Запросы без большого внешнего анкор-файла всегда можно было подобрать, было бы желание... ;)

zZmeIOka:
камрады, а правильна ли конструкция вида <noindex><noindex></noindex></noindex> ?

Не стоит так делать. :)

zZmeIOka:
не подтверждаются предположения о значимости ролей заголовков и близости ключа к началу страницы.

Для пессимизации или для текущего топа? Текущие топы не интересны, пока у лидеров есть шансы туда вернуться. Вот когда вернется большинство - тогда и можно считать. Значимость тегов <H...> может и есть при ранжировании, но она не значительная. "Близость ключа к началу страницы" - это как? У Яндекса раньше была бонусная метрика по наличию ключа в 1-м и 2-м предложении. Она может и сейчас есть, но, раз бонусная, но тоже незначительная. :)

zZmeIOka:
Больше всего рулят тайтл и траст, особенно в ВК топах. При отсутствии спамного текста, разумеется.

Траст - это где? :D

mhz:
По этим: [запрос -абракадабра], [запрос ~~абракадабра] сайты, в принципе, и должны возвращаться, т. к. запросы изменены и точного вхождения нет.

Логика не очевидная, к тому же часть пессимизированных и по таким запросам стоят там, где доктор прописал. В нигде. :)

G00DMAN добавил 07.02.2010 в 01:51

inetessentials:
и опять в кусты? :)

А ты хотел от Вольфа заявления "Я знаю формулу!", что бы нам всем вынесло моск, как с проверкой силы ссылки год назад? :D

Всего: 1960