Думаю, что надо поддреживать видимость есстесвенного развия собитий - без сильных скачков.
Песок таким образом вы не обойдете...
Что-то я такого не замечал. Где оно у вас находится?
Мы, конкурентную тему подымали больше года...
ИМХО - покупать на месяц - нету смыла. Да и на 2-а месяца тоже. Мельтешение с покупными ссылками может быть замеченно и наказанно. Опятьтаки ИМХО, планируйте долгострочную компанию.
А на какой срок покупали? 2-а месяца?
Про классификацию... Мы строили разные решения, одно из них построено на нашем продукте Document Comparator - который определяет проксимацию (близость) смыла 2-х и более документов. Тогда решение задачи сводится к созданию базы эталонных документов в ручную «разложенных» по разным темам. Далее, каждый новый документ сравнивается с эталонными тематическими документами, в результате чего получаем веса которые задают степень близости документа к той или иной теме (шаблонному документу или их группе). И можно сказать, что на столько-то % документ близок в одной теме, а настолько % - к другой. Такой салюшен назван у нас категоризатор, демки нету, вот демка (вернее игрушка) компаратора, на основе которой построен категоризатор.
http://comparator.intellexer.com/demo_comp.php
Другое решение называется кластеризатор - определение смысла документа. Часто используется для группировки результатов поиска. Наша тула работает очень похоже на результаты поиска clusty.com (насколько я помню они для AOL батрачили)
Вот как выглядят результаты работы кластеризатора.
http://clusty.com/search?input-form=clusty-simple&v%3Asources=webplus&query=summarizer
Ну и еще одно решение – суммаризация (автореферирование) – задача вытянуть из текста n предложений содержащих передающий основной смысл документа. На основе таких summary намного легче делать классификацию документа.
Для анг. текстов нашу online демку можно посмотреть тут: http://summarizer.intellexer.com/summ_demo_v2.php
Скорее похоже на рекламный манифест. Неудевительно, что утечка произошла.
Может получится так, что однотипные страницы попадут в саплиментал и произойдет это без участия людей
ИМХО, все будет определяться "близостью" контента разных сайтов. Если у вас на первых страницах разных сайтов 2500 символов контента, из них варьируются всего 7-8% текста (названия пород кошек - из вашего примера) - то ничего хорошего тут не получится.
У меня тоже есть однотипные проекты, но я перестраховываюсь и стараюсь, чтобы 90% контента было уникальным.