Не подскажете где можно посмотреть этот патент? Не могу найти :( или как он называется хотя бы?
Вот например дорвеи созданные по цепям Маркова ну очень оригинальные :), а качественным такой контент назвать нельзя.
Стемминг - если не ошибаюсь это нормализация слова в английском языке (поправьте если ошибся), как она может относиться к качесвенности?
С помощью шинглов определяют неповторимость контента, а это еще не качественность.
Какие еще методы анализа могут помочь?
А что по Вашему является качественным контентом? И каким образом робот может оценивать качественность контента?
+
Да сейчас это так, но тогда, в момент старта Гугла, у него было всего сотрудников 2 человека, офис в гараже и около 1 млн. инвестиций. Как ему удалось развиться до таких масштабов незамеченно?
Нет, чисто из любопытства. Мне кажется что-то здесь не так... Два студента организовали поисковик в каком-то гараже, опубликовали результаты своих исследований и им никто не смог помешать захватить интернет? Вон сам Бил Гейтс в панике! Письма рассылает своим подчиненным (к сожалению не нашел ссылку), что мол сдаем позиции ребяты, надо бы на web поднажать.
Да лучше и быстрее, согласен. Гугл вообще супер! Но как это у него получилось? Его конкуренты наверняка владели достаточными средствами, чтобы прикупить парочку новеньких серверов, включить их в работу, тем самым повысить скорость индексирования и полноту поиска. Плюс нанять лучших, на то время, спецов по поисковым технологиям, которые воплотили бы в жизнь основные алгоритмы Гугла. И все Гуглу не пробиться - против него огромные средства, лучшие спецы и алгоритмы аналогичные его собственным. Почему главные игроки тогдашнего поискового рынка так не поступили?
Спасибо классная ссылка!
В то время, когда Гугл стартовал у него еще не было всяких LocalRank'ов и TrustedRank'ов, не было серии патчей направленных
на борьбу со "зловредными" :) оптимизаторами - был только PageRank, он составлял основу уникального алгоритма ранжирования
Гугла. Так вот этот PageRank, как раз и был запатентован, а значит опубликован. Патент обойти - не такая уж и сверхсложная
задача, вон посмотрите на современных поисковиков - все применяют PageRank (немного оптимизированный но идея та же), только
обзывают его по своему и никакого патента!
Вот мне и интересно неужели тогдашние лидеры поиска поняв, что алгоритм Гугла работает и к нему начали перетекать их
клиенты, ничего не смогли сделать? Согласен, что кардинально изменить систему стоит дороже чем создать новую, но сомневаюсь,
что тогда у Альтависты не хватило бы на это денег.