отправте на бизнес-ланч к лебедеву, вместе посмеёмся :)
где то тут уже писал, повторюсь:
http://www.habrahabr.ru/blog/rambler/2068.html
Eddie, :). Интересно увидить это на деле, особенно как это будет работать с хотя бы 1 млн документов.
Выводы у вас отличные.
saltykow, не многие будут заниматься тем что бы писать отдельный скрипт для выдачи xml вам, сделайте несколько стандартных примеров + сделайте готовые модули для достаточно распостраннёных скриптов досок. Поработайте над интерфейсом. Идея не плохая, должна выжить.
skorik, что значит часто меняете? А не проще ли делать новые страницы и складывать в архив старые, не вижу смысла в удаление предыдущего контента. Опишите ситуцию более подробно если можно.
Eddie, очень интересно слушать ваше рассуждение особенно когда вы его называете примитивным, попробуйте реализовать его на деле сразу видно что вы не программист. Без обид.
AdultGO,
Как правило для этого и существуют каталоги в поисковых системах для описания их определённой тематики и определение географической принадлежности сайта. А анализировать текст каждой страницы нужны достаточно большие ресуры и большое кол-во времени для анализа тематики. Возможно в будуйщем что то такое и будет а пока - каталоги.
AdultGO, я попоробую ответить за него, я просто звонил ему, саму технологию он не сказал, сказал что парсер универсальный и настраивать его не надо, как это делается я так и не понял сам и даже мыслей нету. Основа Ht://Dig.
no comments.
Боулинг, Сноуборд.
Эхх... жду снега. :)
Я являюсь разработчиком системы похоже на этой только там есть несколько фишечек в виде индекса популярности в лицах как на яндексе и т.д.
Но пришёл я сюда себя не рекламировать, а дать совет автору, не берите на себя обязательств для сохранение картинок и текстов у себя на сервере любой сервер имеет свойство падать - падаете вы, падают все сайты клиентов, я бы не в жизнь не взялся отвечать за всех своих клиентов, а на кластер я думаю у вас денег нету.