Evg

Evg
Рейтинг
128
Регистрация
12.07.2004
Должность
С++
Интересы
поисковые технологии

Может будет полезна эта информация

h**p://www.avosp.ru/links4.htm

Допустим кто-то имеет доступ базе.

Я не думаю, что он сумеет "скрытно" провести изменение ранжирования сайтов.

Это в тех. плане практически нереал :)

Вы имеете в виду как поисковик "разбирается" с сессиями?

Если да, то самый простой пример резать их.

скажем так

Replace ([?&]?)PHPSESSID=[^&]+&? \1

ReverseAlias regex ^(.*)[&\?][[:alpha:]]+=[[:alnum:]]{32}$ $1

и т.д.

>А для вывода поисковика в массы что вы планируете

Планов всех не хотелось бы раскрывать.

Однако я думаю, это и есть самое сложное :)

Будим учитывать.

На данный момент анализируется и подстраивается алгоритм ранжирования, будем стараться учитывать все известные проблемы...

Вообще именно это и представляет основную сложность. Для реализации нужно понимание, кто что делает со своим сайтом, что бы он оказался наверху в результате выдачи.

Какие методы применяются для достижения этого. Что является допустимым (по нашему мнению), а что нет.

В этом конечно очень помог этот форум :), спасибо.

С морфологией на данный момент, я думаю, вопрос решили...

Своим пауком, не хочу пользоваться чужими базами...

>тяжело бывает это сделать

именно :)

А диз. 2нет действительно будет меняться.

Это было задумано изначально из-за изменения структуры каталога.

Ведь он создавался мной именно как каталог, а не набор сервисов. Английская и русская версия.

Забегая чуть вперед скажу, что на 2net будет только каталог.

На данный момент дописывается и тестируется новая версия поиска который предполагается разместить на отдельном домене.

Предполагаемое время открытия - сентябрь.

Начальный индекс порядка 500 миллионов документов.

Мне нравится заниматься этим делом, да и начинал просто из за спортивного интереса, сумею ли поднять данный проект почти в одиночку :)

Сейчас уже не один, что не может не радовать.

История базы более простая, база своя. :)

Было много сайтов которые передавали друг другу эту базу

kempo.ru > info-web.ru > 2net

велись и одновременно параллельные ветви... (f6.ru и т.д.)

На самом деле, создать большую базу это не проблема.

Существует множества способов, как за относительно маленькое время довести ее до значительных размеров.

Как верно заметил Drow, ее можно купить, спарсить. Есть и другие способы...

Хотелось бы еще и качество этой базы.

Вот почему каталог набирает редакторов раздела. Только с помощью их можно создать качественные, бесплатный каталог в России.

Что касается программного обеспечения, то работа над ним ведется с 2001 года. Именно тогда были куплены первые составляющие.

Каталог Links sql значительно переделанный, кое что переписано на с++.

Поиск используется от aspseek :), в последнее время сам стараюсь поддерживать данные проект.

С каких пор с Вами мы стали разговаривать на ты?

А насчет текста этой страницы - посмотрим.

Всего: 373