Всем спасибо большое.
Как устроен сайт я поняла, в html разберучь быстро.
Теперь у меня появился такой вопрос - как робот может ходить по интернету? В принципе он может зайти на один известный сайт и ходить по ссылкам , которые в нем содержатся. Но это может привести к зацикливанию, причем если изначальный сайт содержит мало ссылок, то множество найденных документов будет мало. Есть ли какие-нибудь открытые хранилища сайтов? (Я понимаю, что, в принципе, можно создать свое.)
Второй вопрос: на всех ли сайтах множество картинок содержится в отдельной папке? Это общее правило или просто рекомендация?
Третий вопрос: существует ли какая-то регистрация сайтов, которые ссылаются на данный сайт? То есть, когда какой-то сайт ссылается на расматриваемый, проставляется ли какая-нибудь метка на рассматриваемом сайте?
Заранее спасибо.