Kiwi

Рейтинг
12
Регистрация
17.10.2001
Должность
работа во благо...
Интересы
интернет, поисковые технологии, водный туризм, пиво, женщины

<font face="Verdana" size="2">Originally posted by JuriC:
Почитайте, а то я не все там понял</font>

А чего там непонятного?

Во-первых, Яха официально объявил, что стянул у Гугла стиль вывода информации (точнее не "стянул", а как они пишут "сделал форму вывода информации такой же, как и на других поисковиках, например, на Гугле" ).

Во-вторых, они написали, что изменили метод оценки релевантности, и теперь у кого было много переходов с Яха - станет меньше, а у кого было мало - станет больше.

В-третьих, они объявили, что раньше они сортировали сайты в категориях по алфавиту, а теперь - чем больше вы им заплатите, тем ближе к началу списка окажется ваш сайт (шутка).

На самом деле они опубликовали принципы нового ранжирования сайтов в их каталоге. Основной принцип: ранжирование на основе частоты ключевых слов, которые вводятся при поиске. Ключевые слова берутся из: категории, где "лежит" сайт, заголовка, описания и доменного имени. Факторы, влияющие на ранжирование следующие: положение ключевых слов в документе, частота ключевых слов, относительный вес слов, близость искомых слов друг к другу в документе (проксимити).

Этим они хотят добиться того, чтобы посетители Яхи чаще использовали каталог, так как теперь сайты в нем также будут ранжироваться по ключевым словам, как и при поиске.

Вот, собственно и весь смысл статьи.

<font face="Verdana" size="2">Originally posted by Basilisk:
Просто поисковики разлюбили мета-теги за то, что они стали обманными и полюбили тег title.
Естественно, теперь стал обманным и он.</font>

Title (как любой заголовок) - это "лицо" документа (в отличие от метатегов, которые нерадивые сайтовладельцы превратили в "нечто противоположное лицу"). Обычно title пишут так, чтобы от отражал смысл самого документа. Именно поэтому словам, вынесенным в title, присваиваются поисковиками высокие веса с целью увеличения релевантности поиска. И метатэги здесь не причем.

<font face="Verdana" size="2">Originally posted by iseg:
Дело в том, что, на мой взгляд, IR как науки в России практически нет. Разубедите меня, если сможете. </font>

А как же диссертация Некрестьянова (с которым вы так активно спорите), которая вам понравилась? А как же группа, в которой он работает? Чем они, по-вашему, занимаются?

Согласен с вами, что кол-ва статей, которые выходит в области IR в России и за ее пределами разняться в разы. Например, упоминаемый выше диссер написан на 95% на "буржуинской" литературе. Но все же это не признак отсутствия в России IR как науки, что-то есть (Попов и Кo в РГГУ и т.п.)

<font face="Verdana" size="2">Originally posted by Keva:
Алгоритмически ловится. "Рамблер" устойчив к такому виду спама.</font>

Так откуда такой устойчивый наплыв посетителей? И не портал они, вроде, и не порносайт. Да и из регулярных обновлений у них - лента РБК в правом нижнем углу и все.

Было бы здорово послушать также гуру из других поисковиков (Яндекс, Апорт, ...)

<font face="Verdana" size="2">Originally posted by Serjio:
Разве запрещено в мета-тегах использовать информацию, которая напрямую описывает контент сайта и услуги компании?</font>

Т.е. вы хотите сказать, что title уже стали считать метатэгом (согласно решениям последней сессии ВЦСПС )? Как же я отстал от жизни...

[This message has been edited by Kiwi (edited 22-10-2001).]

<font face="Verdana" size="2">Originally posted by Keva:
Причем "золотая середина" известна и реализована и в Рамблере, и, кажется, в Яndexе</font>

В Рамблере может быть, но вот в Яндексе... Это особенно видно, когда по запросу "спам" Яндекс начинает выдавать информацию о совместных предприятиях, понимая его как дательный падеж от СП. (Я бы до этого и не догадался, если бы автор анализатора не подсказал).

Прямо "золотая середина с резким радикальным уклоном".

<font face="Verdana" size="2">Originally posted by puk:
Если бы я хотел ввести со спец-символами, то ввел бы не в кавычках, а !город !Москва и получил бы результат безо всяких словоформ, но дело в том, что такой способ не всякий знает, во всяком случае, ты уж точно.</font>

Ты впадаешь в крайности: либо используется морфология, либо не используется вообще. Я же имел в виду другое: не попытаться ли найти в этом "золотую середину"? (См. мой третий пост по данной теме.)

<font face="Verdana" size="2">Originally posted by Fargalaxy:
Всё очень просто. Вот как это понимает Яндекс:
СП - единственное число
СПы - множественное число
СПам - дательный падеж множественного числа , (как юзерам, студентам, дуракам...)</font>

А корректно ли это (имеется в виду склонение аббревиатур) с точки зрения русского языка? Разве в русском языке аббревиатуры склоняются? Точнее, я бы так сказал: есть "склоняемые аббревиатуры" (например, БАМ: БАМу, о БАМе и т.п.), которые уже вошли в обиход, а есть "несклоняемые аббревиатуры" (например, КГБ). А ведь СП как раз относится к последним. Или я не прав?

<font face="Verdana" size="2">Originally posted by wolf:
Упс! Ты хотя б, прежде чем писать, сам ввел бы запрос "город Москва" в Яндекс с кавычками и без. Ведь в обоих случаях результаты одинаковые!</font>

Ooops. I did it again... и понял, что не прав: результаты одинаковые (с точностью до "проданных ссылок" ). Видимо ошибся при вводе запроса. Может, букву пропустил...

<font face="Verdana" size="2">Originally posted by puk:
Простейший пример - ввел "город Москва"</font>

А ты в кавычках вводил ("город Москва") или просто так - как два слова (город Москва)? Здесь то, как раз, как мне кажется, все верно. Хочешь искать составные термины - вводи их в кавычках. Иначе даже человек не поймет, что ты хочешь искать: все документы, содержащие, содержащие слова "Москва" и "город" или все документы, содержащие составной термин "город Москва".

<font face="Verdana" size="2">Originally posted by wolf:
Причем здесь российская наука? Яндекс - частная лавочка, и все их изыскания направлены на максимизацию собственной прибыли, но никак не на развитие российской науки (единственно, если только в виде такого побочного эффекта, как защита диссертаций руководителями - и то, чисто гипотетически)</font>

По вашему, наука - это такое большое светлое, приемлемое только к государству, а "частные лавочки" могут только на этой самой науке паразитировать? А по-моему, именно "частным лавочкам" мы должны быть благодарны за то, что российская наука окончательно не захирела, что имеются значительные достижения мирового уровня (по крайней мере в области прикладной лингвистики ), и у выпускников школ еще есть желание идти учиться в вузы.

И в чем беда, если "частные лавочки" желают заработать на своих достижениях деньги? Во-первых, это их достижения, полученные, как любил говорить Ворошилов, "своим умом". И, во-вторых, эти деньги остаются у нас - в России, а не кормят весь мир.

<font face="Verdana" size="2">IMHO, надо просто увеличить слегка минимальную длину основы в нечеткой морфологии Яndex'а.</font>

Простите. Но разве нельзя прежде всего рассмотреть запрос (в данном случае "спам") в том виде, каков он есть, и лишь затем начинать "измываться" над ним при помощи морфологии, синонимии, нечеткостей и т.п.? Не это ли имели в виду РБК-шники, говоря, что поиск в Яндексе чрезмерно интеллектуализирован и оторван от жизни?

123
Всего: 24