Заходит скрипт, жрет весь html, заливает на сайт. Чем не парсинг?
Вот именно, но только роли у действующих лиц иные.
Как вариант- прописать абсолютные ссылки, а не относительные, тогда с того сайта будут ссылки на внутряк Вашего сайта.
Как ранжироватся выше копии.
Поищите тему- защита контента по методу Бурундука. Формулировка примерная.
На этом форуме где-то была тема.
Закроете доступ к копированию- не будет копии, яндекс сам копий не создает, проблема отпадет.
Да, есть вариант, что не удастся заблочить копипастера.
Потестил, весьма неплохо :)
Два вопроса-
1. как удалить ключевые слова: удалил из группы, они перешли в удаленные, а как удалить из этой группы?
2. Можно отключить отсев дублированных ключевых слов-
работа ведется в таблице, где происходят некоторые манипуляции и порядок следования слов важен.
При удалении дублей порядок нарушается и приходится вручную сортировать слова.
Ну и общее- при нескольких тысячах слов страницы подтормаживают.
вариант, можно ещё вести поправку- переход на 2-ые и последующие страницы поиска. Например, считаем, что 10% пользователей перейдут с первой страницы далее, тогда для ТОП-10 добавляем поправочный коэффициент 0,9.
Т.е. "!"*0,05*0,9
Учтите еще сезонность. Например взять какой-то месяц за базовый, посмотреть по месяцам(неделям) как менялись показы и вывести поправочные коэффициенты. Но тут из года в год отношения могут меняться.
P.S. поправок на самом деле можно выявить больше :)
Бред тоже бывает уникальным.
по фразам страницы находятся?
Поиск по странице- ищем фразу из последнего поста на странице:
http://yandex.ru/yandsearch?text=%D0%B5%D1%81%D0%BB%D0%B8%20%D1%8D%D1%82%D0%BE%D1%82%20%D1%81%D0%BB%D1%83%D1%87%D0%B0%D0%B9%20%D1%80%D0%B5%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9&lr=2&site=forum.searchengines.ru%2Fshowthread.php%3Ft%3D799650
Фраза не найдена.
С старт поста фраза найдена
http://yandex.ru/yandsearch?text=%D0%98%D0%B7%D0%BB%D1%8E%D0%B1%D0%BB%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9%20%D0%BF%D1%80%D0%B8%D0%B5%D0%BC%20%D0%BA%D0%BE%D0%BF%D0%B8%D1%80%D0%B0%D0%B9%D1%82%D0%B5%D1%80%D0%BE%D0%B2%20%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%D0%B0%20%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B8%D1%85%20%D0%B1%D1%83%D0%BA%D0%B2&lr=2&site=forum.searchengines.ru%2Fshowthread.php%3Ft%3D799650
В сохраненке страницы оба поста присутствуют:
http://hghltd.yandex.net/yandbtm?fmode=inject&url=http%3A%2F%2Fforum.searchengines.ru%2Fshowthread.php%3Ft%3D799650&tld=ru&text=http%3A%2F%2Fforum.searchengines.ru%2Fshowthread.php%3Ft%3D799650&l10n=ru&isu=1&dsn=0&sg=ws30-192.yandex.ru%3A8092&sh=-1&d=114874&src=FT&mime=html&sign=2d882fbb86b277b3fc1a6c30b492d9b8&keyno=0---------- Добавлено 10.07.2013 в 22:59 ----------
что-то меняли?
Mefart, Эксперимент над ссылками с одинаковым адресом
Эксперимент 9-го года, но вроде страница под эксперименты жива, можете посмотреть как сейчас дело обстоит.
Страницы переиндексировались?
Бывает, что закрытие дает результат, а бывает, что позиции стоят как вкопанные.
Есть старые сквозняки, санкций за них нет.
Почитайте про склейку и якорные ссылки.
alekG, кратко- пункт 5 /ru/forum/365295
Как вариант- в Эксели обработать полученный список.