- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
сказали написать поисковик который мог бы индексировать динамические страницы.
А поисковик с модулем индексации статических страниц уже готов? Если да, то достаточно написать алгоритм вылавливания дублей динамических страниц.
С уважением,
Александр Садовский.
А поисковик с модулем индексации статических страниц уже готов? Если да, то достаточно написать алгоритм вылавливания дублей динамических страниц.
Я же все таки чайник.
) Мне несколько непонятно фраза "алгоритм вылавливания дублей динамических страниц". Да я написал поисковик, вроде симпатичный. Мне кажется что индексировать динамические страницы бессмысленно. Т.е данные на таких страницах валидны только на момент вызова. И никто не гарантирует что через пять минут страничка полностью не переменится.
И еще я так понимаю мне нужно из своей проги обратится к серваку чтобы получить из cgi-приложения html-ку. Но как это сделать в UNIX я без понятия. Man'ом после MSDN вообще пользоваться не могу. Да он сильно и не помогает если названий функций не знаешь.
Мне кажется что индексировать динамические страницы бессмысленно. Т.е данные на таких страницах валидны только на момент вызова.
Зависит, конечно, от скрипта, но в 99% скрипт -- это та же функция с параметрами, передаваемыми в URL. И если они остались неизменными, почему должен меняться результат? Да, бывают скрипты, которые учитывают cookies, дату или что-то еще, невидимое в URL, но это редкость.
Вылавливание дублей -- это борьба с параметрами по умолчанию и перестановкой параметров. Для скрипта /xxx.html?var1=a&var2=b может быть равно /xxx.html?var1=a, /xxx.html?var2=b, /xxx.html?var2=b&var1=a или десятку других комбинаций. Для поисковика это все разные URL.
С уважением,
Александр Садовский.
[This message has been edited by funsad (edited 06-03-2002).]
Здраствуйте
Кое-что стало проясняться
А что делать в таких случаях. Запросил страничку а там форма у которой в action стоит вызов cgi. По идее страничку которая сгенерится этой cgi тоже надо проиндексировать. Но в action вызов cgi-скрипта без параметров. Параметры потом подставятся из формы. Что мне индексировать? Я ж не смогу перебрать все значения для параметров которые передаются в эту cgi. Или просто проиндексировать эту cgi с пустыми параметрами. Получить одну страничку, а про остальные забыть. Или вообще пропускать скрипты без заполненных параметров?
Ответьте пожалуйста, как мировое сообщество борется с этой проблемой.
Заранее спасибо
Ярослав
Стоп, а зачем индексировать формы? Сформируй GET-запрос к странице, потом вылови в ней конструкции <a href...> и достаточно.
Вот уже гораздо лучше
)
Т.е Вы хотите сказать что скрипты в формах никто не индексирует?
Могу я в разговоре с боссом сослаться на Вас?
)
В принципе я тоже об этом думал. Но вот глядя на результат Яндекса http://www.setevoi.ru/cgi-bin/srch.pl?user=&title=&keyword1=&keyword2=&keyword3=
Можно подумать что это форма и Яндекс ее проиндексировал с пустыми параметрами.
Хотя лично мне достаточно и href'ов. Но мои боссы хотят чтобы мой поисковик мог уметь делать все, разве что на машинке вышивать не надо.![]()
Это даже и нельзя - индексировать формы. Представь, сколько товаров закажет твой поисковик в магазинах...
Но ведь никто ж не запрещает организовать заказ товаров и через href. Это конечно через одно место, но все таки можно. Что-то вроде
<A HREF="zakaz.cgi?id=1">Нажмите заказать товар 1 </A>
<A HREF="zakaz.cgi?id=2">Нажмите заказать товар 2 </A>
<A HREF="zakaz.cgi?id=3">Нажмите заказать товар 3 </A>
Тоже полная ерунда получается.
Надеюсь тэги форум не воспринимает. А то еще поломаю чего-нить![]()
Яндекс это ж индексирует и ничего, эшелоны заказанных товаров к нему не тянуться![]()
На РНР можно сделать, чтобы заголовок был абсолютно такой же как и вверху и с размером страницы и со всем.
Копий Дмитрий
Но ведь никто ж не запрещает организовать заказ товаров и через href. Это конечно через одно место, но все таки можно. Что-то вроде
<A HREF="zakaz.cgi?id=1">Нажмите заказать товар 1 </A>
<A HREF="zakaz.cgi?id=2">Нажмите заказать товар 2 </A>
<A HREF="zakaz.cgi?id=3">Нажмите заказать товар 3 </A>
Тоже полная ерунда получается.
Надеюсь тэги форум не воспринимает. А то еще поломаю чего-нить
Яндекс это ж индексирует и ничего, эшелоны заказанных товаров к нему не тянуться
- а в таких магазинах обычно через куки корзину передают. В любом случае челу надо что-нибудь ввести, хотя бы е-мейл - а этого поисковик делать не станет...