Не смешите меня. То что вы сейчас рассказали это указыват только на неправильную сборку страницы или на кривой движок. По этому критерию нельзя определять покупность ссылки. А если ссылки вставляли руками в ХТМЛ?
Я не уверен чту гугл использует этот критерий.
А что, дело благородное. Тематический поиск нужон. Только краулерами своими сайты не кладите.
А теперь про техническую реализацию проекта.
Надо взять много маленьких VPS (как вариант боьшой сервер и порезать его на кусочки, но лучше поначалу много маленьких ВПС) и размазать по ним проект. при этом добиться того что случайное убивание несколькоких из них не приводило к падению всей системы.
Также надо добиться того чтобы добавление еще одной ВПСки в систему приводило к уменьшению нагрузки на все остальные системы.
Так вы построите масштабируемую систему. Это нужно для большого количества запросов.
Мускл + ПХП хорошо, но медленнее чем могло бы быть на других системах. Это некритично поначалу, т.к. систему нужно строить очень распределенную. Например запрос обрабатывается и отсылается на десятки/сотни копьютеров (маленькие ВПСки в вашем случае), они обрабатывают результат и возвращают его в агрегатор, который уже компанует конечный ответ сервера.
При этом разумно поделить запросы на высоко частотные и низкочастотные и сделать для них быструю (маленькую) и медленную (большую) базу данных, или проще говоря некий аналог кеша.
Дальше будет видно кто тормозит и оптимизить эти куски, вплоть до переписывания их на С - оно не очень трудно, т.к. из всего функционала мускла вы будете использовать около 1%. Пеед тем как переписать - почитайте кнутта - много чего умного писал!
Вот както так я бы двигатсья начал.
Опыт показывает что абсолютно неуникальный контент, с оптимизацией, грамотно перелинкованый (плотно), да хорошо подпитаный ссылками имеет высокий ПР, отсутсвие соплей, и неплохой топ, в то время как уникальный контен без перелинковки, и с небольшим числом внешних ссылок норовит спрятаться в сопли и не лезет в ТОП.
Я бы сказал что нет явных методов данного определения.
Сквозняк стоит около года. Сайт донор - хороший сайт с ПР5 и 200К страниц в каше гугла. Содержит немного ссылок из текста (появились вместе с появлением сайта, как естественные ссылки) и два сквозняка на другие сайты, ссылками не торговал.
За время жизни ПР других сайтв не изменился из за этих сквозняков, т.е. как был так и остался у одного 4 у другого 3.
также позициции, количество страниц в индексе и позиции также не выглядят в соответсвии с силой ссылок.
У меня есть сайт с ПР 5 поставил с него пару сквозняков на двигаемые сайты - эффекта никакого...
Статистические данные на основе стука вебмастеров + расположение на странице + релевантность - вот основные критерии.
Все делается в автоматическом режиме. Ручнная проверка маловероятна...
Менял 1251 -> utf8 сайт и траффик не шелохнулись.
Еще одно подтверждение тому что внешние факторы при правильном использовании дают сайту гораздо больше чем првавильно написаный текст на сайте
О вашем новом сайте никогда не писали центральные новостники?