Угу. Правильно. И санитарным службам, по логике, там делать нечего. И блюстителям порядка. И медикам. Всяк волен сам распоряжаться своей судьбой... Велкам, wild wild west... ;)
Прочел всё это и задумался... Пожалуй, выскажу, что думаю по поводу... Как все дремуче... Вокруг SEO развелось такое количество около-бизнесов , успешно продающих воздух (ТИЦ, беки, вероятность непота и т.п.) , что просто диву даешься. Пожалуй, соглашусь с Михой, что средний уровень - увы, и ах... Успех ковровых бомбардировок провоцирует людей на мысль, что поймали Бога за бороду, но они не могут даже уловить причинно-следственные связи своего успеха... И начинают плодить откровенно бредовые теории и практики. Чему яркое свидетельство есть данный конкурс.
Таки и подмывает спросить - Lupus, а когда Вы в последний раз были в Европах, за которые Вы так радеете? Не в мечтах, а физически? И попробывали реализовать свое исконное (ни в коем разе не совковое!) право покурить (наплевав на некурящих) в общественном (а не в специально отведенном для курящих) месте?
"Обычная фильтрация" ведь регламентируется каким-то набором правил, не так ли?
Да также, как и при расчете по обычному документу! Каждый уникальный анкор будет образовывать отдельный пассаж со своим весом, расчитанным на основе характеристик доноров, его содержащих. Понятие веса пассажа, кстати, есть в текстовом ранжировании. Пассаж, входящий в тег title ведь весит не так, как текст из body, не так ли? ;) Тем более, что в анкор-файле не нужно искать в пределах документа, все запросы обрабатываются на уровне пассажей, т.е предложений...
Число пассажей в обычном документе тоже может быть довольно большим. Справляется же Яндекс как-то с документами в полмегабайта?
Спамные ссылки должны давиться антиспамовыми модулями. А вот учесть навигационную ссылку из меню при расчете ВИЦ'а, но не учесть в ссылочном - на мой взгляд, вполне логично.
Вы порой так туманны, что трудно подобрать подходящую метрику для адекватной оценки. :) Хотя, сдается мне, у нас просто разница в подходах к исследованиям и интерпретации результатов, хотя, вполне возможно, что инструментарий схож (во всяком случае, я его у вас позаимствовал, надеюсь Вы не в обиде? :))
А зачем там содержать миллионы записей? Миллион уникальных анкоров вряд ли отыщется для какого-либо документа. В анкор-файл можно складывать только уникальные анкоры, и для каждого просто хранить вес как взвешенную сумму ссылочных весов доноров, его содержащих (у меня даже позорения, что не только полные совпадения, а иногда даже точное вхождение подстрок суммируется - но там, наверное, с ссылочными весами сложнее - для каждого термина свой запоминать придется, и с номерами терминов в пассаже как-то выкрутиться надо). Опять же, много чего можно отфильровать на этапе формирования анкор-файла. Не думаю, что в таком случае среднестатистический анкор-файл окажется многим больше среднестатистического документа.
А анкор-файл к ВИЦ'у никакого отношения иметь не должен, вообще-то. Да и тошнота ссылочная, судя по всему, у Вас подразумевается зависящей от общего числа входящих ссылок, не зависимо учитываются ли их анкоры в ссылочном или нет?
Ну, ВИЦ со сквозняков зафильтровать как-раз таки нелогично. А вот ссылочное - вполне.
Ну, буквально на днях я наблюдал учет 14 страниц (из 16 проиндексированных, если верить выдаче Яндекса). Может, конечно, я случайно попал на необычный случай :)
P.S. На всякий случай - вывод об учете основан на анализе числовых характеристик, а не на поглядывании в монитор и поглаживании мышки ;)