То, что с покупными ссылками и продажными мордами надо было что-то делать - это факт. Вопрос только в том, каким способом поступить. Пока сложно сказать, будет ли носить выбранный Яндексом способ массовый характер или будет произведено просто несколько показательных контрольных выстрелов в "голову" продажным сайтам.
Если эти действия примут масштабный характер, то важно определить, какими общими характеристиками обладают сайты, продающие/принимающие ссылки с морд:
1. Если построить ориентированный граф, где вершины - это морды сайтов, а ребра - это ссылки между ними, то алгоритмически не очень сложно отследить так называемые "черные дыры", в которые входит несколько ссылок и "солнца", из которых выходят ссылки. Устанавливая определенные пороговые значения количества входящих и исходящих ссылок, автоматически можно отслеживать и выявлять "подозрительные" сайты для последующей проверки модератором вручную. Естественно логично предположить существование списков:
а) "доверенных" сайтов, ссылки на которые не считаются спамом (например ссылки с разработанных проектов вебстудии, ссылки на рейтинги, баннерообменники и т.п.)
б) "подозрительных" сайтов, которые были уличены в (продаже/покупке ссылок), реабилитировались, но находятся под присмотром.
в) "забаненных" сайтов - чтоб в расчетах не мешались
г) и другие списки...
2. Часто тематики ссылающегося сайта и принимающего ссылку - не совпадают. Яндекс сейчас обкатывает свой "AdSence" и может определить тематику ссылаюшейся и принимающей страниц, а также посмотреть слова из ссылки, так что если не будут совпадать тематики страниц и т.п., это может стать причиной для записывания обоих сайтов в список для проверки модератором.
3. Наверняка есть какой-то порог вИЦ, начиная с которого морда сайта может оказаться желаемым кусочком для покупки ссылок. Мы вИЦ посмотреть не можем, поэтому для нас основной показатель - ПР. Сайтов - огромное количество. Выставлять их все на проверку - это долго и дорого. Наверняка сначала будут проверены сайты с самыми высокими характеристиками, потом более мелкие, потом еще мельче и т.п.
4. другие критерии
Так что алгоритмически определить "подозрительные" морды и составить список проверки для модератора, в принципе, возможно.
Вопрос о том, как обрабатывать домены третьего уровня и т.п. - стоит отдельно.
Также отдельно стоят вопросы:
а) не пытаются ли этот сайт подставить конкуренты?
б) как быть, если сайт уличен в продаже/покупке вторично?
в) как быть, если ссылки будут продаваться не с морда, а со страниц на одну ступень ниже по ссылочной иерархии сайта? (думаю не надо объяснять, что сложность модели в данном случае усложняется экспоненциально?)
г) др.
Помимо охоты на продажные морды, Яндекс попутно убъет еще одного зайца в виде большого количества студентов-"оптимизаторов", которые принимают оптимизацию сайтов только как покупку ссылок с жирных морд.
Повторюсь - все эти предположения рабочие только в том случае, если охота на продажные_морды/покупающие_сайты началась и будет вестись масштабно.
С уважением,
Сергей Пасечник.
Это слишком гуманно в такой ситуации.
Вы знаете, я не считаю, что сочувствие и милосердие - это плохо.
Плохо то, что иногда это используется в спамерских целях. Был случай, когда с текстом аналогичного содержания рассылался телефон конторы чего-то там продающей. Вот за такое однозначно нужно убивать.
Долго и жестоко.
Не думаю, что это хорошо.
Как говорил Садовский примерно 2001 или 2002 году, нося шапку модератора форума: "Ваши сообщения останутся здесь надолго. Постарайтесь вложить в них максимально полезный смысл." Иногда просто приходится дополнять свои сообщения некоторыми полезными материалами или заметками, обнаруженными несколько позднее. Наличие большого фраз "редактировалось xxx столько-то раз в такое-то время" особенно в первых двух тысячах сообщений этого форума - тому подтверждение. Этот фильтр запрещает такую возможность редактирования, возможно приведет к росту числа мелких дополняющих сообщений.
Опять пропала.
По крайней мере для вчерашнего своего сообщения я ее не вижу.
Поздравляю! :)
Переведите, плз, на русский язык.
Сергей Пасечник, Промо.Текарт
Светлана, мои поздравления!
Вся техническая реализация пробуксует только из-за отсуствия информации о деталях реализации русской морфологии.
Остальное [выделение запросов, проверка позиций и оценивание] с определенными допущениями свободно реализуется алгоритмически и программируется, только стоить будет достаточно дорого (если делать подробно и гибко).
PS.
Станислав, мои поздравления!