Географический поиск (GIR - Geographic Information Retrieval)

G
На сайте с 26.09.2005
Offline
10
#21

2лагиф:

> Взять, к примеру, тот же "сайт болельщиков киевского динамо". Болельщик может жить в Караганде, а "динамо" было и останется киевским. Название "Киев" присутствует, но значения никакого совершенно не имеет. И болельщиков у него толпы по всей Украине.

причем тут болельщики я не пойму, если территориально сайт принадлежит тематике, связанной с киевом.... Сайт не о болельщиках, а о киевском футбольном клубе. В традиционнном поиске чтобы в ответ на твой запрос вернулся релевантный сайт, необходимо чтобы слова запроса встречались в тексте (или в ссылках на данную страницу при ссылочном ранжировании). Но сайт тематически может относиться к территории, но не упоминать на своих страницах географические топомимы, ее идентифицирующие.

> Да и скептицизм я испытываю больше не к самой идее в целом - а к нынешним методам, которые, думается мне, часто таки промахиваются.

методы постоянно развиваются, на то и есть наука....

> А вообще - послушай здешних умельцев-оптимизаторов. Они тебе расскажут, как продвигаются сайты. Ты на поисковики еще и не так скептически смотреть будешь...

задачи оптимизации и поискового спама (применительно к GIR) я пока здесь опускаю.... это второй вопрос.... А вообще я сам занимаюсь оптимизацией и прекрасно представляю все нюансы... это к слову.

2AlexA

ты не подскажешь подробнее про эти организации/группы?

PS

приятно что отвечают аспиранты, я думаю эта тема интересна. Сам аспирант 2го года.... ужасно хочу найти коллегу в этой теме. Тема просто супердиссертабельна, отечественных публикаций на тему по крайней мере можно пересчитать по пальцам...

G
На сайте с 26.09.2005
Offline
10
#22

2Artisan

да, насчет TIGER вы абсолютно правы... но а как насчет Whois database. Я не знаком точно с ее данными, но разве когда регирятся наши сайты они не указывают хотя бы примерное местоположение?

кстати насчет отдаленной регистрации хоста - действительно один из методов ранжирования в GIR - пессемизация хоста, зарегистрированного на более отдаленный регион, от того, который был указан в запросе...

поэтому владельцам сайта просто невыгодно регириться вдали скажем так.

А насчет нескольких адресов на страницах - то тоже есть методы..

Например система GIPSY строит некую трехмерную модель сайта, где каждой странице ставится в соответствие башенка определенной высоты, которая "растет" из определенного участка местности. В итоге, строя такие башенки для всех страниц сайта, получаем некую гористую местность, и там, где выше всего уровень рельефа - там наиболее релевантные для запроса материалы...

lagif
На сайте с 15.12.2004
Offline
30
#23

goover,

в том и дело, что территориально сайт болельщиков киевского динамо принадлежит не к киеву вовсе, а к болельщикам - и не территориально. :)

и вообще, наверное, лучше поговорить об этих методах, когда они разовьются :) :)

но сейчас мой скептицизм оправдан. :)

к тому же, вы сами хотели знать, отношусь ли я скептически к поисковым алгоритмам. вот я и ответила...

p.s. аспирант - к сожалению (а может, к счастью...) статус на форуме. зависит от количества постов...

Это тоже пройдет...
G
На сайте с 26.09.2005
Offline
10
#24

2lagif

.s. аспирант - к сожалению (а может, к счастью...) статус на форуме. зависит от количества постов...

да, я уже догадался об этом, спасибо за подтверждение! :)

G
На сайте с 26.09.2005
Offline
10
#25

> в том и дело, что территориально сайт болельщиков киевского динамо принадлежит не к киеву вовсе, а к болельщикам - и не территориально.

как раз таки наоборот, сайт принадлежит именно к киеву, поскольку тематика его - киевский футбольный клуб. А болельщики - это всего лишь основные посетители сайта, которые большей частью как правило (научно обосновано) географически располагаются вблизи (в некой мере) киева или украины. Просто из исследований большинство пользователей ходят на сайты близкой (в географическом смысле) тематики намного чаще... Статистика вещь упрямая.

lagif
На сайте с 15.12.2004
Offline
30
#26

goover,

ссылку на статистику можно? просто впервые такое слышу.

S
На сайте с 03.05.2002
Offline
25
#27
goover:
2Artisan
да, насчет TIGER вы абсолютно правы... но а как насчет Whois database.

А какая разница откуда брать адрес - парсить текст страницы или из whois данных? Весь вопрос в том, что с этими данными делать дальше. Вот тут то возможность достаточно точной локализации адреса и играет ключевую роль.

lagif
На сайте с 15.12.2004
Offline
30
#28

Silent,

Кстати, если часто парсить whois, RIPE может вас забанить...

S
На сайте с 03.05.2002
Offline
25
#29

lagif, меня не может:) Потому что не я заговорил про whois. Так почему же ответ обращен ко мне?

lagif
На сайте с 15.12.2004
Offline
30
#30

Silent, это замечание по ходу дела, не ответ...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий