Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science

<font face="Verdana" size="2">Originally posted by spark:
Вячеслав, спасибо, сервис безусловно полезный, не могли бы Вы сообщить, с какого времени собиралась база запросов,общее количество запросов на данный момент и как часто она обновляется Вами? Желательно, точные цифры, чтобы можно было вероятность считать. Или это великий пинговский секрет?
</font>

Ну почему секрет. Сейчас в базе практически миллион запросов, из них 212 тысяч уникальных (увы, не те масштабы). Собираться они начали с 12 февраля этого года, база в последний раз обновлялась месяц назад. В дальнейшем мы планируем связать данный сервис со своей статистикой, которую дает счетчик, и показывать запросы всех поисковиков, по которым есть приходы на украинские сайты.

Да, идея, по сути, неплоха. Релевантность результатов такого поиска можно существенно повысить, если наряду со временем, которое пользователь проводит на странице, учитывать еще и количество поисковиков, которые на нее ссылаются по данному запросу. Скажем, если по запросу "юмор" на Вашу страницу приходят и с Яндекса,и с Апорта, и с Рамблера, то с огромной долей вероятности она соответствует тому, что ищет пользователь. Да и шума будет поменьше.

Я вообще планировал пойти еще дальше Спайлога. Если в статистике для каждого сайта отбирать коррелирующиеся запросы, сделанные в разных поисковых машинах, получается отличный кластер, который лучше всего характеризует сайт. Не знаю правда, возникали ли подобные мысли у Спайлога.

[This message has been edited by Vyacheslav Tikhonov (edited 08-09-2001).]

Огромное спасибо, Александр, за объективную оценку движка. Уже сейчас представляю, в чем его слабость. Я, в общем-то, и не ожидал от программы, собранной за 2 дня, слишком выдающихся результатов.

Будем работать дальше.

[This message has been edited by Vyacheslav Tikhonov (edited 13-09-2001).]

<font face="Verdana" size="2">Originally posted by iseg:
В этом треде зашла речь о явной ошибке, которую мы вчера и позавчера искали и исправляли, спасибо всем огромное за это.

А потом начались на мой взгляд, просто наезды - "а у вас этот запрос плохой", "а вот тут дубликатов много"...

Поищите на Гугле слово yandex - 40% дубли, ну и что? Информация то найдена и самая точная. То же самое и с запросом про "украинские поисковые системы" на яндексе

С уважением,
Илья
</font>

Если мой постинг с украинскими поисковыми системами был расценен как "наезд", приношу свои извинения. Меньше всего хотелось обидеть самую авторитетную российскую поисковую систему, до недавнего времени бывшую для меня эталоном.

Однако с таким подходом вас скоро обойдут конкуренты. Всего наилучшего

<font face="Verdana" size="2">Originally posted by Nicholas:
а адрес такой же кудрявый останется? Насколько я понял тут нет группировки по ПС, когда один и тот же документ найден в нескольких ПС.

PS: metabot.ru работает побыстрее.
</font>

Нет, будет http://metaping.com

Группировка есть, я еще пока не показываю. Насчет побыстрее, это нужен более мощный канал. Пока его нет

Судя по тому, что все молчат, или ищет слишком хорошо или совсем не в дугу

Программа получилось конкурентноспособной, скажем, с Metabot.ru ?

<font face="Verdana" size="2">Originally posted by iseg:
Это цитата из статьи Брина на WWW7 - "Анатомия большой гипертекстовой поисковой машины". Хорошо, что Вы или Ваши знакомые ее прочитали. Но при чем тут Яндекс?
</font>

Ну надо же. С ходу слово в слово уже цитирую Брина. Чертовски приятно

Судя по тому, что услугами Google сейчас пользуются немало известных компаний, его модель не самая плохая. И достойная для подражания. Но если у вас она другая, так ради бога

<font face="Verdana" size="2">
Мы возникли много раньше Гугля и и нас все совершенно по другому. (намного круче )
</font>

Да... читаю вот топик ))

<font face="Verdana" size="2">
Коэффициенты при расчете PageRank не могут быть завышены - он тогда сходится не будет

Сама модель PageRank весьма упрощена и страдает рядом недостатков. Я уверен, что в прямом, немодифицированном виде ее никто не использует. Если, скажем, Брин читает этот форум, он подтвердит

Для ранжирования результатов поиска гораздо лучше подходит тематически-ориентированный алгоритм HITS (Кляйнберг и ребята из Альмадено) - но, во-первых, он тоже нуждается в серьезных модификациях для защиты от непотизма, во-вторых, его тяжело считать real-time на каждом запросе.

Илья</font>

Хорошо. Если не PageRank, то что привело к такому результату:

Самый простой запрос: "украинская поисковая система":

"Мета" - украинская поисковая система

Учёт морфологии украинского и русского языков. Выделение контекстов найденных слов. Перевод запросов и результатов на русский, украинский и английский языки.

http://meta-ukraine.com/

Компьютеры и связь &gt; Интернет-сервисы &gt; Поисковые системы

NSearch - украинская поисковая система

Учёт русской и украинской морфологии. Выделение контекстов найденных слов. Структурирование поиска по серверам.

http://asearch.com.ua/

Компьютеры и связь &gt; Интернет-сервисы &gt; Поисковые системы

--------------------------------------------------------------------------------

Еще сайты из каталога (6) &gt;&gt;

&lt;META&gt;-Украина. Украинская поисковая система. | Показать найденные слова

Украинская поисковая система. Реестр украинских сайтов. Информация об Украине и украинцах.

http://www.meta-ukraine.com/ - 19К - совпадение фразы

Переход в категорию Поисковые системы | Похожие документы | Еще с сервера не менее 3246 док.

QuickSeek: Украинская Поисковая Система | Показать найденные слова

QuickSeek Украинская Поисковая Система На данной поисковой системе собраны ресурсы только украинских сайтов, что дает возможность украиноязычным пользователям быстро и удобно найти нужный ресурс...

На данной поисковой системе собраны ресурсы только украинских сайтов, что дает возможность украиноязычным пользователям быстро и удобно найти нужный ...

украинская баннерная сеть

http://www.quickseek.com.ua/ - 2К - совпадение фразы

Похожие документы | Еще с сервера не менее 1 док.

meta The Ukrainian search engine for Ukraine and Ukrainian all over the World

Найдено по ссылке

Украинская поисковая система Мета

Мета украинская поисковая система

http://meta.kharkiv.net - найден по ссылке

Похожие документы | Еще с сервера не менее 1 док.

Ukraine meta The Ukrainian search engine for Ukraine and Ukrainian

Найдено по ссылке

Украина мета украинская поисковая система

мета украинская поисковая система

http://www.meta.kharkiv.net - найден по ссылке

Похожие документы | Еще с сервера не менее 1 док.

ping :: украинская поисковая система, рейтинг и каталог сайтов | Показать найденные слова

поисковая машина, рейтинг и каталог украинских сайтов

http://topping.od.ua/ - 27К - совпадение фразы

Похожие документы | Еще с сервера не менее 1 док.

On-Line Zone - множество полезных ресурсов, нужных каждому.

Много полезных ресурсов заработок софт халява юмор для вебмастера работа всего не перечислишь Заходи и выбирай/Earn Free Money Contest Freebies Magazines,Job

Российские и Украинские поисковые системы

http://centerx.virtualave.net/zarabotok.htm - 5К - найден по ссылке

Похожие документы | Еще с сервера не менее 2 док.

поиск

Найдено по ссылке

asearch украинская поисковая система

asearch Лучшая Украинская поисковая система

http://search.avanport.com - найден по ссылке

Похожие документы | Еще с сервера не менее 1 док.

Пошукова система search kiev

Найдено по ссылке

nъsearch поисковая система по украинским ресурсам

Украинская поисковая система

http://www.search.kiev.ua - найден по ссылке

Похожие документы | Еще с сервера не менее 1 док.

meta украинская поисковая система

Найдено по ссылке

мета украинская поисковая система

мета rus украинская поисковая система

http://meta-ukraine.com - найден по ссылке

Переход в категорию Поисковые системы | Похожие документы | Еще с сервера не менее 1 док.

украинской поисковой системе

Найдено по ссылке

nsearch украинская поисковая система

http://search.kiev.ua - найден по ссылке

Похожие документы | Еще с сервера не менее 1 док.

У вас в 12 результатах поиска 5 зеркал Меты украины, причем 3(!) найдено по ссылке (это по какому принципу?) и 4 Аванпортовских зеркала (3 тоже по ссылке).
Видимо, плохо чистите зеркала - в 12 всего 4 сайта!

[This message has been edited by Vyacheslav Tikhonov (edited 07-09-2001).]

<font face="Verdana" size="2">Originally posted by iseg:
Как раз плохой результат возник от того, что в релевантности цитируемость случайно загасилась (точнее ее стали перебивать другие приоритеты). Это можно понять
даже по исходному постингу.
</font>

Если не секрет, какие приоритеты? Если я правильно понимаю, сейчас у вас два хранилища: в первом хранятся заголовки и текст в ссылках, оно используется при подсчете цитируемости и второе - полнотекстовое. Сначала поиск идет в заголовках и привязках, а уже потом по всей полнотекстовой базе. Судя по тому, что выводит Яндекс сейчас, мне показалось, что очень сильно завышены коэффициенты при рассчете PageRank, что ведет к большому количеству левых "найденных по ссылке".

Или у вас все по другому принципу?

<font face="Verdana" size="2">Originally posted by wolf:
Сегодня результаты поиска в Яндексе просто ужасают! ... Видимо, криво прикрутили, вот Яндекс так и переколбасило!
</font>

Да они давно уже ужасают после того, как Яндекс начал попытки использовать PageRank при ранкировании. Я, например, не могу понять, зачем нужно в первой десятке давать

несколько ссылок на один и тот же сайт или его зеркало с подписью "найден по ссылке".

<font face="Verdana" size="2">Originally posted by wolf:
Полезность сервиса существенно страдает из-за того, что результаты выдаются не абсолютные, а относительные (в %). Поэтому нельзя сравнить частоты запросов разных слов (например, "бегемот" и "гиппопотам") </font>

В целом я согласен. Добавил.

Всего: 847