Именно. Время Ашмановской конфы, т.е. больших терок. :)
Да есть приколисты. :)
Да новых идей можно много напридумывать, только не очень интересно это. Для меня поиск будущего связан скорее с нахождением ответов на сложные вопросы. Т.е. переколдовка сложного запроса (пусть даже и написанного по строгим правилам) должна рулить, на уровне, близком к ИИ. Ответы на большинство вопросов в сети есть, осталось только научиться их находить. :)
Ну так количество пользователей гугла сделал бизнес, а не качество поиска. По качеству различия сегодня у поисковиков не критичны. Клиентов придется отнимать у всех, проще всего наверное отнять их у альтернативных поисковиков, которые вроде есть локально в разных странах.
Кроме фичи, которую отметил Alexey Levin, интересного пока я у Blekko не вижу, слэш-теги на уровне "как на этих сайтах" решают какую-то локальную задачу, причем не понятно, зачем это нужно массе.
Все немного не так. :)
Противостоять Яндекс может, но зачем? Время для противостояния упущено - под Яндексом развилась целая паразитирующая отрасль с немалым оборотом, промышляющая спамом и гс-строительством. Одно из правил любого нормального бизнеса - своих паразитов не стоит давить, их нужно доить. И пофигу на всякие морали - закон джунглей, типа. :D
Решение технически не сложное:
Таким образом решается проблема ГС - смысл их клепать под Яндекс пропадет, разве что под гугл. Плюс реальная прибыль от дойки оптимизаторов может увеличить текущую чистую прибыль на 20-30%. Практически на халяву. Для оптимизаторов при этом ничего не меняется - матрикснет обдурить все равно будет сложно. Цена ссылки немного вырастет, что не обязательно приведет к увеличению бюджета, т.к. ссылок можно меньше купить - они же на 100% рабочие будут. :)
Яндексоиды пока не созрели для такого шага, но работа с ними ведется. :)
Пока это просто еще один поисковик. Рановато выдавать ему громкие титулы, даже уровня "претендент".
Любопытно, чей индекс используется. Что-то я не нашел инфы. Если сделали свой, то настроены парни более, чем серьезно.
Почему "все"? Других не может быть?
Ну да, удобная фича. Особенно при быстро обновляемом индексе.
Это вряд ли. Такую идею запросто можно переформулировать и запатентовать еще раз.
А при чем тут "подвинуть гугл"? Доля поискового трафа гугла зависит в первую очередь от грамотно выстроенного бизнеса, к поисковым технологиям и поисковым фичам это слабо относится.
Что полезного можно извлечь из КГ/АМ?
Так Вы читали статью? Или просто угадали все буквы? Там в самом начале формула для коэффициента ротации, два действия - вычитание и деление. Или Вы еще не проходили таких действий на уроках? :D
G00DMAN добавил 02.11.2010 в 15:11
Про верификацию не понял, что Вы хотите верифицировать? Независимость переменной? От чего, если она одна?
Про объем выборки я выше написал, объем выборки - это количественный фактор, и он не самый важный. Гораздо важнее при любых "выборочных" исследованиях качественный фактор. Поэтому необходимо, чтобы выборка была репрезентативной (т.е. чтобы отображала основные свойства всего объекта). В данном случае этого нет, взят свой десяток ГС и пофиг. :)
P.S. Судя по мылу "типа ученых" - они не только ссылками барыжат, они еще и сайты продвигают. :)
P.P.S. Такой тупой статьи в научном сборнике я не видел никогда. :D
Это не научное утверждение, его же не опубликовали в RCDL. :D
Естественно, 99,99% сео-ссылок можно спалить влет, не важно где они стоят, на ГС или в "вечных" статьях, но это даже не важно. Важна "научность" статьи, а ее одобрение рядом коллег - доставило немного лулзов. :)
Во-во, "типа научная", да.
Если каждый бред конструктивно критиковать, то ни на что больше времени не хватит. Ну да ладно, вкратце на этот раз отпишусь...
10 сайтов - это круто. Не, ну если бы они исследовали процентов 20-30 сапо-сайтов хотя бы, определили критерии "среднего" сапо-сайта и взяли 10 таких средних, было бы еще немного научненько, даже при спорных критериях. Но этого нет, взяли то говно, что было у знакомого ВМ, который им скидывал ежедневно табличку в ехеле. А может и сами 10 ГС наклепали. Чего не сделаешь для науки... :D
За 7 месяцев тИЦ не менялся, хотя там были веселые апдейты. Это говорит об одном - исследуемые ГС были нулевками. Зашибатая выборка для исследования. :D
При этом нам было пофигу на выпадение страниц на нулевых ГС, мы же не чекали на индекс и не думали, от чего могут сниматься ссылки. Зачем думать? Они снимаются, потому что сео-ссылки иначе не могут! Ротация, мать ее! :D
Ага, исследовали 7 месяцев, а таблицу накатили за 20. Ну а чо, бумага все стерпит, да и читатель свой уже нашелся - сео-нубы. :D
Ну да, особенно на новостных сайтах, которые публикуют в день несколько десятков чужих новостей с честными ссылками на первоисточник. Вот же спамеры...
Приколов в работе много, подробнее лениво расписывать.
Ну я же написал - словарь с правилами. Продвинутый анализатор может и предсказать наиболее вероятную каноническую словоформу с большой точностью, простые - ничего не предсказывают, просто выдают весь список каконических, в порядке убывания встречаемости.
В английском языке, как говорят, все проще и можно стеммером обойтись (тем же портеровским), в русском - не получится.
МЕТА - какой-никакой, но говорят, что в Украине он собирает бОльшую долю трафа, чем Рамблер в России. Так что keva развивается, в отличие от. :)
По большому счету анализатор - это и есть словарь, со всеми правилами и исключениями из них.
В соглашении, которое подписывает участник, организаторами оговорены различные проблемные случаи. Это на самом деле важный момент, мало ли, что Вы там захотите сделать с полученными от конкретных лиц чужими авторскими текстами. Так что подписку брать необходимо, что бы Вы там не думали. :)
Я уже понял, просмотрев Ваши посты на этом форуме. :)
Дело не в интеллектуальной ценности. Дело в том, что коллекции собираются в вэбе, из чужих источников, на которых стоит копирайт. И есть закон об авторском праве, так что не все так просто, как Вам кажется.
То Вам был интересен РОМИП, но не было ссылки на скачку, то вдруг стал не интересен - Вы бы определились, чтоле... ;)