Видел в буржунете хороший прокси, я сам его юзал, правда он платный. Вообщем он при каждом запросе дает новый айпи. В КУРЛе Вы пишите тока 1 раз, а сам прокси-сервер у себя уже все это разруливает, и каждый раз посылает запрос на желаемый Вами ресурс с разных АйПи. Цена около 30 енотов в месяц, если мне не изменяет память.
Есть правда пробный период на 3 часа, можете попробовать так)))
Если у Вас 20к страниц, то тут однозначно должен быть алгоритм, определяющий похожесть, ибо руками это делать = самоубийство.
Но что-то мне подсказывает, что придумать этот алгоритм будет не так-то просто:)
Да, кстати... Тайтлы, дескрипшин и кейвордсы прописаны везде?
Да их сотни, даже тысячи. Обязательно повезет:)
Найдите базу. Поверьте, и здесь есть люди, которые смогут Вам помочь.
З.Ы я не про себя. это не самореклама.
Да лучше подождать 1 сентября и подучить русский язык. Если не можете юзать всякие запятые там и подобные, казалось бы ненужные знаки пунктуации, то пишите используя простые предложения как в 1 классе. Тогда Вам ответят.
Если тут никто не подскажет, попробуйте написать на фрилансе объявление на покупку БД. Возможно это будет намного результативней:)
Как делается?
Либо найти удаленную БД, в которой есть необходимая информация и есть коннект, либо найти базу готовую, для заливки на сервер БД и от этого уже плясать.
Poezd Vagonovich, дык какое ДЗ? Каникулы однако.
Я вообще предлагаю на форуме сделать официальный праздник - 1 сентября.
1 сентября школотэ покидает просторы нашего любимого форума и мы вздыхаем спокойней))
Что это такое? Электронный школьный\коледжевский\универный журнал успеваемости?
Если именно это - пишите, есть готовое решение(не распространялся), написанное мной:)
Асько и скайп в профиле есть.
P.S я тоже не смог сразу такое сделать, и было решено выводить в таблицу. То есть каждый день это отдельная таблица. Но при желании можно переделать. Покажите саму таблицу, из которой выборка происходит. Да и не мешало бы сохранить исходный код в файл и дать ссылку на файл, а то форум квадратные скобки не любит)))
Вы скрипт хотите на ХТМЛ? ХТМЛ - язык разметки и не более.
По каким критериям у Вас будет определятся похожесть?
Если условия не сильно жесткие, то возможно Вы сможете это реализовать использую яваСкрипт.
sizeof - псевдоним count))