Может будет полезна эта информация
h**p://www.avosp.ru/links4.htm
Допустим кто-то имеет доступ базе.
Я не думаю, что он сумеет "скрытно" провести изменение ранжирования сайтов.
Это в тех. плане практически нереал :)
Можно адрес в личку?
Вы имеете в виду как поисковик "разбирается" с сессиями?
Если да, то самый простой пример резать их.
скажем так
Replace ([?&]?)PHPSESSID=[^&]+&? \1
ReverseAlias regex ^(.*)[&\?][[:alpha:]]+=[[:alnum:]]{32}$ $1
и т.д.
>А для вывода поисковика в массы что вы планируете
Планов всех не хотелось бы раскрывать.
Однако я думаю, это и есть самое сложное :)
Будим учитывать.
На данный момент анализируется и подстраивается алгоритм ранжирования, будем стараться учитывать все известные проблемы...
Вообще именно это и представляет основную сложность. Для реализации нужно понимание, кто что делает со своим сайтом, что бы он оказался наверху в результате выдачи.
Какие методы применяются для достижения этого. Что является допустимым (по нашему мнению), а что нет.
В этом конечно очень помог этот форум :), спасибо.
С морфологией на данный момент, я думаю, вопрос решили...
Своим пауком, не хочу пользоваться чужими базами...
>тяжело бывает это сделать
именно :)
А диз. 2нет действительно будет меняться.
Это было задумано изначально из-за изменения структуры каталога.
Ведь он создавался мной именно как каталог, а не набор сервисов. Английская и русская версия.
Забегая чуть вперед скажу, что на 2net будет только каталог.
На данный момент дописывается и тестируется новая версия поиска который предполагается разместить на отдельном домене.
Предполагаемое время открытия - сентябрь.
Начальный индекс порядка 500 миллионов документов.
Мне нравится заниматься этим делом, да и начинал просто из за спортивного интереса, сумею ли поднять данный проект почти в одиночку :)
Сейчас уже не один, что не может не радовать.
История базы более простая, база своя. :)
Было много сайтов которые передавали друг другу эту базу
kempo.ru > info-web.ru > 2net
велись и одновременно параллельные ветви... (f6.ru и т.д.)
На самом деле, создать большую базу это не проблема.
Существует множества способов, как за относительно маленькое время довести ее до значительных размеров.
Как верно заметил Drow, ее можно купить, спарсить. Есть и другие способы...
Хотелось бы еще и качество этой базы.
Вот почему каталог набирает редакторов раздела. Только с помощью их можно создать качественные, бесплатный каталог в России.
Что касается программного обеспечения, то работа над ним ведется с 2001 года. Именно тогда были куплены первые составляющие.
Каталог Links sql значительно переделанный, кое что переписано на с++.
Поиск используется от aspseek :), в последнее время сам стараюсь поддерживать данные проект.
С каких пор с Вами мы стали разговаривать на ты?
А насчет текста этой страницы - посмотрим.