Если кого-то действительно заинтересует материал - ваш кодинг мало поможет. Засеките, сколько времени займет принскрин и распознавание текста. И сопоставьте затратами на подготовку своего материала.
Вот и я на пару месяцев плотно в Киев заселяюсь. Актуальная тема всплыла :)
ЭЭЭЭХ! Рiдна ненько Украiна!
Тоже недавно задавался такой мыслью.
Не особо свежее, но, так сказать, для затравки дискусси:
Я и подразумевал, что страница site.ru/qwe/rt/yu/ui/76/abra.html (в 5-ти кликах от главной) будет идентична главной.
Вы на остальные вопросы ответьте, там интереснее. У меня на самом деле такое ощущение сложилось, что Вы отождествляете морду с самой накачанной страницей ;)
А 404 в заголовке отдавалось? Или по этому адресу подгружалась страница идентичная главной? :)
Вы хоть один пример такого случая показать в личку можете?
Любому?! Это как? Какое отношение имеет релевантность "любому запросу" к определению морды? Вы приравниваете страницу "релевантную любым запросам" к морде?
В том-то и дело, что с какой радости учитывать жирную внешнюю ссылку при определении главного зеркала? Ведь по Вашим словам внешняя ссылка может сыграть здесь роль.
т.е. при установке жирных ссылок на страницу site.ru/qwe/rt/yu/ui/76/abra.html (в 5-ти кликах от главной) для сырого сайта эта самая страница станет мордой?
А что Вы вообще понимаете под мордой? Уж не самую ли накачанную страницу?
Вопросы
1) что в данном случае Вы понимаете под релевантностью? Релевантна чему?
2) с каких пор самая релевантная страница признается мордой? По Вашей логике продвигаться внутренними нельзя, т.к. морда перестанет быть мордой.
3) с какой стати поисковик при определении морды должен учитывать внешние ссылки?
Я как раз склонен утверждать. К чему такие хирургические вмешательства?
Подскажите, каким образом может вообще проиндексироваться index.php, если ссылки на index нет на сайте?
Мне было бы интересно посмотреть на сайт с нормальной навигацией, имеющий проблемы такого рода.
ЗЫ. на многих движках страницы имеют вид index.php?какието-там-параметры. Соответственно, с таким подходом вылетит часть сайта.
Когда база проработана и все поля распознаны, то если есть капча - графика грузится, если капчи нет - не грузится.
В самом Олсабмитере отключите графику