1. если SE ВПЕРВЫЕ идет по ссылке А и натыкается на 302-перенаправление на некую ДРУГУЮ страницу (с адресом Б), - что (какой контент) будет "ассоциировано" у него в базе с каждым из этих адресов?
2. если по адресу А проиндексирована некая страница, и с некоторого момента сервер начинает вместо нее отдавать 302-е перенаправление на адрес Б, - как и что будет "ассоциировано" в базе SE?
Как SE "отрабатывают" 302-й код?
(Верно ли, что по команде Redirect в .htaccess Апач отдает 302?)
- я бы не назвал это "обычный комп". "Обычный" для меня - это стоящий в московской квартире с выделенкой ...
- 5 мегабайт в секунду, если я правильно поделил ... это Вы называете "обычный комп с нормальным каналом"?
Сырой материал для лингвистических исследований ...
В первом же файле из первых 6 записей 4 - это две пары одинаковых запросов ВООБЩЕ БЕЗ КЛИКОВ.
Дальше - полно и более длинных таких серий ...
А кто-нибудь понимает, что - в этих АОЛ-овских данных - означают серии из одинаковых запросов (от одного и того же AnonID)?
- по адресу www_site_com/page.html - без search-параметров - страница видна целиком целиком.
... в качестве рубрик выступают те ключевые слова (теги), которые владельцы сайтов указали при регистрации.
- это как бы не совсем то, что я имел в виду ... хотя "автоматизм", безусловно, присутствует: "ключевые слова (теги)" автоматически становятся "рубриками" ...
(И, конечно, я веду речь не о каталоге, в котором нужно регистрироваться, а о таком, который отображает все страницы, до которых дотянулся ... ну или - по своему выбору. Но это, конечно, больше вопрос миссии (позиционирования) проекта, чем технологии.)
_____________________
Яндекс.Новости - кластеризация по персонажам - пожалуй, да.
lermont.ru, эта пока еще не появилась, только обещана. Но на ней ведь свет клином не сошелся!
Кстати, объем ее - 6 DVD - это, видимо, 40-50 Гиг ...