Сколько мусора в сети

Artisan
На сайте с 04.03.2005
Offline
372
#51
Как писал donskoi
а насчет ротации, о которой я писал-не знаю, я не програмист и не математик, наверное ресурсов она будет жрать немеряно,

Это делается не на уровне поиска в индексе и подготовки результатов для выдачи а на уровне выдачи результатов пользователям причем ресурсов потребляется исчезающе мало по сравнению с другими задачами при выдаче и например на Yandex по косвенным признакам похоже на то что все что надо для рандомизации там уже сделано и они могут ее включить в любой момент.

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
M
На сайте с 10.05.2005
Offline
58
#52
Как писал andre

Берут выдачу алгоритмических поисковиков и на основании своего алгоритма пытаются ее кластеризовать. Алгоритм описан у них на сайте, результаты тоже можно посмотреть. Нравится? А ведь в их распоряжении сейчас фактически весь проиндексированный Яндексом Рунет.

Пару месяцев назад нашел:

http://www.pixel-apes.com/rubrika

С сайта pixel-apes.com

Что такое фасетная классификация? Это подход, когда для каждого классифицируемого объекта могут быть применены несколько независимых систем классификации. Например, человеков можно классифицировать по:

полу (мужской/женский/вольноопределяющийся)
профессии (целое «дерево» профессий)
возрасту (число)
образованию (среднее/высшее, а также какой конкретно ВУЗ)
и много ещё по чему.
Все эти системы классификации а) разные и б) независимые. Т.е. мужчина вы или женщина в теории никак не влияет ни на ваш возраст, ни на вашу профессию (конечно, на практике это не вполне так, но мы-то сейчас рассматриваем этот случай как пример). Такие системы можно смело называть «фасетами».



Какие-то фасеты допускают, что объект обладает несколькими рубриками в рамках этого фасета, а какие-то (например, фасет «пол» из примера выше) — требует единственности рубрики.

Если совместить нигму и "фасетную классификацию", может получиться хороший результат в 3 клика.

А собственное видение будующего:

1. Запрос на большом поисковике: Выдача тематического портала

2. Запрос на тематическом портале: Выдача соответствующего сайта

minaton
На сайте с 18.09.2004
Offline
135
#53
Если мы говорим о "естественном интеллекте", это будет некое "смысловое разложение", если об "искусственном" - "кластеризация".

Как мне видится, по отдельности эти два метода не приведут к цели, один неполный, другой утопический. А вот если бы совместо - работа шла бы быстрее! :) Что-то типа прореживания кластеров и/или придание им человеческого вида и смысла. Получится nigron.ru ;)

Ceres
На сайте с 28.09.2004
Offline
389
#54

andre, пардон, не въехал сразу в ваши мысли - я думал вы о том, что группа будет формировать выдачу яндекса :)

Все хорошо, за исключением 2-х пунктов:

1. поезд уже едет, причем давно, и всех, кто будет мутить в настоящее время альтернативные системы без миллионов долларов, ждет полное фиаско. Даже в последний вагон не запрыгнуть :)

2. сообщество перегрызется мгновенно!

Там чу-де-са! )
A
На сайте с 23.11.2000
Offline
166
#55
Как писал Ceres
Все хорошо, за исключением 2-х пунктов:

Это довольно старый спор, вот ответ от 2003 года, начиная с фразы "Опора на прошлый опыт, конечно, штука надежная... :)" -

Насчет перегрызутся... сложно сказать. История знает разные случаи. Все зависит от способа управления. Один из возможных вариантов описан здесь - /ru/articles/502

Ceres
На сайте с 28.09.2004
Offline
389
#56
;pagenumber=8

знаю, но речь ни о том, какая схема лучше, а о том, что без очень больших денег раскрутить подобную затею - нереально. Либо надо быть гениальным пиарщиком, чтоб за несколько тысяч или десятков тысяч зеленых суметь продвинуться. Нужны миллионы как минимум :)

S
На сайте с 06.04.2005
Offline
1
#57

Андрей, Ваш "семантический каталог" совершенно неустойчив к злонамеренному спаму. Никто не мешает спамеру завести столько логинов экспертов, сколько ему понадобиться. Например, по одному на каждую пару сайт-запрос. Сделать автоматический скрипт, который будет сабмитить в каталог (создавая новые логины экспертов).

Кроме того, запросы могут дрейфовать из чисто коммерческих в смешанные. Например, появится завтра музывальная группа "Пластиковые Окна". Появятся фан-сайты "Пластиковых Окон", новости о них на музыкальных сайтах и т.п. и люди станут искать все это в сети. Хватит ли у "семантического каталога" гибкости заметить это?

В любом случае, ручной каталог, как Вы сами видите, пригоден только для тех запросов, по которым есть заинтересованные эксперты. Значит, сам по себе он не живет, а может существовать только как дополнение к поисковой системе общего назначения.

А для этого он по своим запросам должен быть ощутимо лучше, чем та поисковая система сама по себе и плюс быть защищен от спама - мусора в выдаче поисковых систем и так хватает.

Ceres
На сайте с 28.09.2004
Offline
389
#58
"Пластиковые Окна"

Sparrow, неплохое кстати название для танцевальной группы :)

A
На сайте с 23.11.2000
Offline
166
#59
Как писал Sparrow
Андрей, Ваш "семантический каталог" совершенно неустойчив к злонамеренному спаму. Никто не мешает спамеру завести столько логинов экспертов, сколько ему понадобиться. Например, по одному на каждую пару сайт-запрос. Сделать автоматический скрипт, который будет сабмитить в каталог (создавая новые логины экспертов).
Кроме того, запросы могут дрейфовать из чисто коммерческих в смешанные.

А если я попрошу по 1 доллару за каждый экспертный логин - сколько злонамеренный спамер их заведет под риском, что за каждый дурной ответ удаляется и сам логин эксперта, и все завязанные на него ответы? Можно ведь и не по одному доллару попросить, чем больше трафик, тем больше просить можно.

Разделение между "коммерческими" и "некоммерческими" запросами условное. Оно существует давно, но реальной "информационной" подоплеки под ним нет. Каждый запрос, и соответственно ответ на него имеет свою стоимость. Для большинства она близка к нулю, для меньшинства - высока. /ru/articles/502

Каталог не должен "замечать" происходящие явления в жизни и в сети. Чем больше его влияние как навигационного инструмента, тем больше заинтересованность всех поставщиков информации в Сеть, в том, чтобы важная информация была адекватно в нем прописана.

Как раз сейчас пишу рассылку, гляньте, а - http://www.profile.ru/items/?item=11290 Cравните http://del.icio.us и http://www.neiron.ru

Поиск в том виде, как существует сейчас, уходит. В него неизбежно будут "интегрироваться" социальные поисковые технологии.

Ceres
На сайте с 28.09.2004
Offline
389
#60
А если я попрошу по 1 доллару за каждый экспертный логин - сколько злонамеренный спамер их заведет под риском

andre, лично я не дам ни цента, пока траф с такого (вашего) каталога не будет равен трафу с яндекса, или как миниму с рамблера!

Чем больше его влияние как навигационного инструмента, тем больше заинтересованность всех поставщиков информации в Сеть, в том, чтобы важная информация была адекватно в нем прописана.

нет у меня заинтересованности, и не будет. Не вижу смысла учавствовать в междусобойчике.

Это утопия, и только потому, что не найти вам инвесторов. Единственный вариант реализовать на базе уже существующих поисковиков, или тех, что возможно появятся в будущем. Может вот Абрамович продаст Челси и в интерент вдарится :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий