jook

Рейтинг
4
Регистрация
30.01.2002

Я недавно занимался удалением сайта из базы Яндекса и последующей переиндексации.

Проблема была в том, что в базе было около 10000 страниц и робот переиндексировал все очень-очень медленно. Сайт - http://www.foto.ru . Сначала были удалены все промежуточные страницы каталога (списки подкатегорий, листинги товаров и проч), а затем и страницы с товарами. Весь процесс занял более месяца.

Когда в базе осталось 7 страниц против 10000, я в роботс.тхт удалил ненужные строки. Сейчас в базе около 500 страниц.

Добавил оба сайта в марте 2002. Оба сайта коммерческие - инет магазины. ( http://www.foto.ru , http://www.audiomarket.ru ). И ни одного нет англоязычной вевсии! Добавлены в каталог были в течении 2х недель или даже недели.

Далее я зделал цопи/пасте из подготовленного мною вордовского файла:

==============================

Foto.ru – английский

Отправлен

6.03.2002 в 12.35

Категория

Home > Regional > Countries > Russia > Business and Economy > Shopping and Services > Consumer Electronics

Название

Foto.ru

URL

http://www.foto.ru/

Описание

Online catalog of professional and amateur photographic equipment. Over 5000 products: digital, SLR and compact cameras, camcoders, lenses and accessories.

==============================

Audiomarket.ru – английский

Отправлен

6.03.2002 в 12.40

Категория

Home > Regional > Countries > Russia > Business and Economy > Shopping and Services > Consumer Electronics

Название

AudioMarket.ru

URL

http://www.audiomarket.ru/

Описание

Online store of portable electronics: MP3, CD, MD, VideoCD players, headphones, voice recorders and other.

==============================

Fotoclub – английский

Отправлен

6.03.2002 в 12.45

Категория

Home > Regional > Countries > Russia > Arts and Humanities > Visual Arts > Photography > Chats and Forums

Название

Fotoclub.ru

URL

http://www.fotoclub.ru/

Описание

Russian photo community. On site: news, forums, user galleries, articles, FAQ, glossary, camera reviews.

==============================

Сначала я просматривал описания сайтов из аналогичных англоязычных рубрик, делал типа микс - подгонял под общий стиль и все. То же самое проделел и с DMOZ - тоже без проблем.

Сейчас приход с Yahoo - с поиска по каталогу Яху около 50 посетителей для Фото.ру и примерно столько же для Аудиомаркета. Больной процент на фотору идет по сочетанию типа "amateur foto" :)))

И мне тоже пожалста

jook@chat.ru

thanx!

У меня то же самое.

Было 355

Стало 177

Gray

если страницы будут физически существовать во время попыток удаления,
Яндекс не будет их удалять.

А вот и нет. Нужно просто запретить их индексацию в robots.txt. Вот например, что мне вернул яндекс на странице http://www.yandex.ru/removeurl.html : Ваш сайт/раздел http://www.foto.ru/?cat_id будет удален из нашей базы по мере обхода робота.

То есть я приказал Яндексу удалить все страницы, начинающиеся на http://www.foto.ru/?cat_id Теперь их в базе нет. Таким же образом можно и весь сайт удалить.

[This message has been edited by jook (edited 28-02-2002).]

Professor

Яндекс удаляет страницы из базы во время очередного обхода сайта роботом. Получается как раз 2-3 недели.

baranov

А что значит "решал ее постепенно"? У меня проблема в том, что робот до некоторых страниц вообще не дошел и неизвестно когда дойдет. А еще куча старых-престарых страниц, на которых информация устарела. Они в базе без изменения по 2 года лежат. Как я писал, всего проиндексированно около 7000 страниц.

Самый главный вопрос: если сайт удален из базы, возможно ли его потом опять переиндексировать. Адреса страниц во многом останутся те же.

В том то и дело, что по идее То есть чтобы робот бегал по ссылкам, но не индексировал их, писать надо META NOINDEX?

А может еще какие пути есть? Тогда придется наверно делать страницу со списком всех товаров, чтобы именно через нее роботы добирались до конкретных товаров в 1 шаг от главной страницы, а все промежуточные (category, prodlist) запрещу.