BigBrother

BigBrother
Рейтинг
96
Регистрация
16.06.2006
Должность
Аналитика и управление большими системами
Интересы
Автогонки (на аватаре, как ни странно - я)
Ex - Yandex Spiderman, сейчас рулю системами "умных городов" в куче мегаполисов
lastadm:
BigBrother, ну я про это вроде как раз и написал, чуть дальше по топику.

Кроме прибивания гвоздями - есть "информация" - об этом я тоже писал далее :)
Вероятности слива "полезной инфы" нет даже теоретически?

Есть. Но поможет не сильно и ненадолго.

lastadm:
В стране, где деньги и социальный статус дают индульгенцию за мошенничество в особокрупных и практически любые тяжкие преступления. В стране где коррупция это норма жизни.

Все свято верят в непогрешимость сотрудников Яндекс ))))) Просто идилия какая то, сб у них интересно так же думает?

Да проще все. "Прибить гвоздями" сайт невозможно не столько технологически (хотя тоже та еще задача), сколько организационно.

Если коротко - технически это очень малое число людей сделать может, но проблема в том, что это вылезет на мониторинге (вернее, на разных мониторингах в разных местах) почти сразу - то есть об этом узнает ВЕСЬ поисковый отдел (и не только). И начнет разбираться, откуда такое счастье...

SoaringHawk:
На блоге настроены ЧПУ вида "http://blogdomain.com/2008/01/01/tra-ta-ta/" Т.е. все ссылки в подобном виде.

После текста в каждом посте стоит "постоянная ссылка" в стандартном wordpress-овском виде "http://blogdomain.com/?p=1". Если идти по этой ссылке отдается 301-й на ЧПУ "http://blogdomain.com/2008/01/01/tra-ta-ta/"...

И я не могу понять, почему яндекс в место того, чтобы положить в серп "нормальные" ссылки, выкладывает туда с 301-м редиректом..?

PS Надеюсь понятно объяснил. :)

Не вижу здесь проблемы, честно говоря - содержимое обоих урлов для пользователя одинаковое.

А на какой из этих типов, кстати, ссылок больше стоит?

Что-то суппорт тупит слегка.... Саша (не Садовский), спроси пожалуйста у кого-нибудь из робота про эту ошибку.

Эта ошибка обычно возникает при играх с keep-alive (chunked) - там либо надо четко указывать размер чанка, либо общий размер контента. При несовпадении и будет выдаваться эта ошибка.

Копайте здесь....

Коля Дубр:
Хм, по описанию эксперимента не увидел, чем еще (кроме внешних факторов) будут различаться реципиенты. Другой вопрос - удастся ли ТС действительно сделать равнозначные сайты - но тут не ясно, в какую сторону он ошибется.

Коля, извини - но плохо думал. Подумай еще раз.

Дело не в равнозначности... Ладно, будет начало мая - расскажу.

_t2:
Тут даже не в ошибках дело. Посмотрите на стилистику-это либо действительно ребенок, желающий легко сорвать денег, либо кто-то старательно под него косит. Посмотрите на скриншот админки. http://fastvista.ru/raznoe/screen_yandex.jpg (108Кб) Сомнений остаться не должно.

BTW, в "админке" товарисч спалил свой Passport ID.

Сделаю-ка я, пожалуй, прогноз.

С большой долей вероятности эксперимент топикстартера завершится успехом.

Только вот причина успеха не будет иметь ничего общего с трастранком и внешними факторами.

T.R.O.N:
Признаюсь, это новость. Логично бы было именно кешировать, но это дело разработчиков.
Но почему тогда при смене домена на IP (конечно при условии 1-ip - 1 домен), яша по старому доменному имени индексирует старый домен. Это происходило в сентябре прошлого года. Или это было вызванно жругими причинами?

Нет, не логичнее - именно из-за того, что домен мог и переехать между заходами робота. А для зеркальщика - вообще смертельно....

За сентябрь не скажу уже, но корневые DNS тоже могут сбоить на ура (было дело....). Или просто не успеть обновиться.

CunninGFox:
яндекс не индексирует английский текст, если его на сайте подавляющее большинство.

Не путайте людей - индексирует.

Вот контр-пример:

http://www.yandex.ru/yandsearch?text=CNN.com+news

PS: И по-немецки тоже могу привести.

T.R.O.N:
Проблема не только с тайм-лимитом. Все привыкли (и висьма заслуженно), что DNS обновляются в течении 3-12 часов с момента внесения изменений на првичном сервере. Яшин бот обновляет базу DNS очень долго. Бывало до 10-15 дней. Учитывайте это

Неправильно. Робот резолвит DNS во-первых без кеширования, а во-вторых строго напрямую с корневых DNS зон. Надеюсь, понятно, почему именно так.

Всего: 449