Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science

<font face="Verdana" size="2">Originally posted by Dozer:
Блин.... совет просто грамотный ты замутил мне!!! RESPECT !! Сабмитер нету смысла делать.. IMHO. Я ручками всё... вот только еще вопросик.. можно ли узнать списочек.. просто списочек не URLS а по названиям TOP SE ?? Тоесть сколько их там 20-30? Ну если можете....то плиз поделитесь

TOP 20-30 SE !!! =D

With RESPECT FROM DOzeR

PS: Огромный RESPECT TO GRAY !!!
PS: Серьезно...я бы не допер сам !

PEACE!!
</font>

This is links of over 200 search engines and directories available in USA:

http://www.twics.com/~takakuwa/search/usa.html

<font face="Verdana" size="2">Originally posted by wolf:
Программка не смотрит в "черных точках" в Яндексе (лучшие сайты из поиска по каталогу)

[This message has been edited by wolf (edited 27-07-2001).]
</font>

Да, я не включал их в результаты поиска. А нужно?

Обновил скрипт с учетом пожеланий, добавил еще 10 поисковиков и разделил поисковики и каталоги с учетом географической принадлежности.

<font face="Verdana" size="2">Originally posted by funsad:
1. Несколько раз случалось, что скрипт перекидывал меня на Яндекс (результаты поиска были нулевые, кодировка страницы КОИ-8). Закономерность не отследил.
</font>

Да, просто в это время я подключал скрипт через прокси. Нужно было посмотреть, все ли нормально. Случайность

<font face="Verdana" size="2">
2. Неплохо бы сделать выдачу информации по мере поиска, а то пару раз скрипт обрывался по таймауту.

3. Были бы удобны кнопки "Select All", "Deselect All".

4. Неплохо бы поисковики разделить на две колонки -- русскоязычные и чисто украинские.

С уважением,
Александр Садовский.
</font>

Спасибо. Обязательно добавлю.

<font face="Verdana" size="2">
Наверно можно еще каталоги отделить от поисковиков. И исправить название у каталога MavicaNET.
</font>

Название исправил

<font face="Verdana" size="2">
1.У list.ru всё время выдаётся разная глубина поиска,а часто она вообще нулевая
</font>

Это связано с тем, что часто List.ru не дает непосредственно результаты поиска, а предлагает еще дополнительно выбрать категорию.

<font face="Verdana" size="2">
2.В анализируемом URL пропадает www(если оно
было) после завершения мониторинга.
</font>

Я делал это специально, чтобы увеличить возможность нахождения сайта. Исправил.

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:
Пожалуй, добавлю к результату поиска еще описания страниц, которые найдены для указанного сайта. Все равно мета-поиск, чего информация будет пропадать </font>

Здесь лежит новая версия анализатора:

http://www.topping.com.ua/position/

Так и не нашел, как у Апорта можно вывести больше 10 страниц за раз, для остальных скрипт ищет сразу в полусотне. Сообщения о багах приветствуются.

2AIK: глюк с основами SMS вроде исправил.

Пожалуй, добавлю еще к результату поиска еще описания страниц, которые найдены для указанного сайта. Все равно мета-поиск, чего информация будет пропадать

<font face="Verdana" size="2">Originally posted by vs:
У меня есть другое предложение:
возьмите логи Вашего сервера, посмотрите, по
каким запросам к Вам приходят (ну, для
интереса, еще и с каких поисковиков).
Затем напустите программу с этими словами.
Это будет, пожалуй, поточнее, чем слова
со страницы брать - Вы будете видеть
позицию по тем словам, по которым вас
действительно ищут.
</font>

Толковая мысль. Нужно только как следует автоматизировать

<font face="Verdana" size="2">
Кстати, в приходах от любого поисковика
можно сразу увидеть, с какой страницы списка
найденного пришли. Например, в Рамблере:

</font>

Это очень полезно. Спасибо!

<font face="Verdana" size="2">Originally posted by AiK:
Originally posted by Vyacheslav Tikhonov:
-=SKIP=-
Тестовая версия
-=SKIP=-
</font>

Bug report:
С Рамблером не работает.
KW: основы SMS
ULR: в профайле.

У меня была подобная трабла с субмитером.
Дело в том, что в рамблере дефолтной считается KOI8-r, поэтому надо либо верно формировать HEADER запроса, либо использовать
http://www-windows-1251.rambler.ru/
CU,
AiK
[This message has been edited by AiK (edited 26-07-2001).]

Нет, с кодировками точно все нормально - я Рамблеру запрос так и отдаю в KOI-8, остальным в Win-1251. Нужно посмотреть регулярное выражение, которое ему (Рамблеру) сейчас сопоставлено - проблема, похоже, там.

А насчет усовершенствования - я подумаю, как это сделать, не слишком напрягая машину.

<font face="Verdana" size="2">Originally posted by AiK:
Предложение по усовершенствованию:
не плохо бы было получить все ключевые слова на странице, по которым удаётся попасть в определённый диапазон.
</font>

Чем задается диапазон и какие именно ключевые слова?

<font face="Verdana" size="2">Originally posted by mager:
Посмотрел я этот скрипт и решил сделать свой. Копирайты его мне не очень понравились
Тестовая версия пока находится здесь:
http://media.topping.com.ua/cgi-bin/pos/rate.cgi
Пока включил 10 наиболее крупных российских и украинских поисковиков и каталогов.
</font>

2 Vyacheslav Tikhonov
Огромное спасибо!
Действительно получилось лучше.
Сообщите пожалуйста, когда будет готов.

Еще не подключил Cookies, так что ищет в основном пока еще только в первой 10 да и канал слабоват. Завтра доработаю и перенесу на более мощный канал.

<font face="Verdana" size="2">Originally posted by mager:
2 Vyacheslav Tikhonov
Я понимаю,что для кого-то это наверное не очень сложно(тем более удивительно, если до сих пор этот скрипт не переделан для русских
поисковиков).Но я, честно говоря, как это делать не знаю ,и был бы чрезвычайно признателен за конкретные рекомендации.
А кроме Большой Тройки интересует пожалуй только Google.
</font>

Посмотрел я этот скрипт и решил сделать свой. Копирайты его мне не очень понравились

Тестовая версия пока находится здесь:

http://media.topping.com.ua/cgi-bin/pos/rate.cgi

Пока включил 10 наиболее крупных российских и украинских поисковиков и каталогов.

Всего: 847