Чисто гипотетически если подходить - было бы логично ввести такой фактор, но сделать его ничтожно малым. Т.е малус, который можно получить от плохого линка в десятки-сотни раз меньше бонуса от хорошего.
Ведь если из ссылок на сайт А только 10% в черном списке, а на сайт Б - 90%, то это что-то значит.
Т.е. если даже брать этот фактор изолированно(как в моем примере), он уже может первоначально указать на принадлежность сайта к "Белым" или "черным".
На месте Гуся я непременно бы использовал и эти данные. Пусть не в голом виде, а, например, как "Флаг подозрительности". Как еще в таком случае объяснить то, что сайты попадают в опалу пачками? Почему сайт страдает если его чресчур активно спамить блоги?
И не будьте так уверенны, что Гусь не допустит возможности "опускать" конкурентов. Все мы спокойно живем с феноменом Googlejacking.
Так что возьму на себя смелость утверждать, что 4млн какашек "завалят" даже очень крупного монстра.
Думаю хорошего будет мало.
Особенно, если в тексте ссылок каждой будет Learn to be a turd here!
:)
Насколько я понял есть новости в html формате и их надо перегнать в xml для распространения.
Тогда если известна структура html и она не меняется, то проще самому написать скрипт, который будет парсить. Что-то подобное найти наверное сложно, обычно делают все наоборот. Пишут в xml, потом это все вывешивают в html
По нулям.
Интересное нововведение.
Проще осуществлять контроль. Хорошо для "белых", плохо для черных.
Ergo, Да, причем недавно:)
4 моих страницы уже в G кэше с линками.
Ваших пока только одна.
Так что отвечу на первоначальный вопрос:
Лучше не писать.
Причем тут перл?
Причем тут Backlinks?
Покажите пожалуйста пример страницы где есть линки на Ваш сайт, которые не устраивают
Чем Вам так не понравился польский SEO блог?
Увесистый сайт, ничего противозаконного я на первый взгляд не заметил...
Написать можно, может и уберут, но зачем?
Вполне может быть.
Но гусь не определяет степень "коммерциолизации" контента по ТЛД это 100%. Разграничение типа ком, биз - для коммерции, орг - для органицазций, нет - для остальных - чисто теоретическое. Врядли гусь будет так тупо возвышать одних над другими только из-за того, что лет 5 назад одни задумывались для использования в коммерческих целях, а другие нет.
Для начала: ПР существует для страницы а не для домена - это аксиома.
Что в результате:
1 http://www.glasunow.org/ ПР3 2 BL
2 http://www.russisches-musikarchiv.de/werkverzeichnisse/glasunow-werkverzeichnis.htm ПР 2 0 BL
3 http://www.karadar.com/Worterbuch/glasunow.html ПР3 0 BL
Во-первых - первыйв выдаче - это морда;
ключевик и ничего больше - в имени домена;
сайт посвящен целиком *glasunow*;
у него показываются хоть какие-то бэклинки... список могу продолжить.
Если это все учесть - в выдаче все логично расположено и влияния ТЛД org не видно.