Что такое тип лексики?
LSI - это модный способ определения степени связности ключевых слов в количественном выражении. Это некоторый аналог корреляции терминов. Или степень синонимии. Используя эти данные, можно считать тематическую близость документов.
Да нет, скорее всего, Яндекс на ходу классифицирует страничку, приписывая ее к нескольким категориям, а потом смотри, а есть ли среди этих категория пересечения. Если есть, то линки между страничками учитываются.
О тематической близости у Itman нет. Тематическая близость - это, все-таки, классификация. И к LSI: Latent Semantic Indexing
Вы, Вячеслав растекаетесь мыслею по древу, а обижаетесь не по делу.
Вот смотрите с чего мы начали и к чему пришли: с вопроса "сколько денег нужно стартапу". Для, скорее всего, некоммерческого проекта. Вместо того, чтобы помочь людям с оценкой, Вы их посылаете сначала за опытом в Гугл, хотя очевидно время Гуглов прошло, потом поминаете нехорошими словами Черепаху и Пунто (хотя для создания бюджетного регионального поисковика их опыт вполне подошел бы, это к слову о ценности этих проектов), а потом вспоминаете о модной тенденции социального поиска. Опять-таки, ничего модного в этой тенденции нет: участие человека в той или иной степени в поиске всегда существовало. До Веба в виде усилий библиотекарей, в вебе в виде каталогов. В NLM, где я сейчас фактически работают, так до сих пор работают библиотекари и просматривают статьи с целью аннотирования и оценки качества. И традиция эта существовала уже давно, как и сам поиск в NLM, который судя по слухам, существовал еще на мейнфреймах до появления писюков.
И по поводу покупки аудитории вопросно-ответного поиска: а есть ли купить-то в том регионе, где товарищ хочет создать поисковую машину?
Оба-на... уже и социальный поиск приплели. Кстати говоря, этот социальный поиск он тоже фактографический. В частности в уже набранной базе ответов. И от этого никуда не деться, потому что по каждому чиху не побежишь к эксперту.
Вячеслав, я просто опроверг Ваше утверждение о причинах неудачи. И, кстати, стартапы не начинаются с покупки чужих проектов. Вам про это выше тоже уже объяснили.
Почему же сразу "шутить". На чьем опыте Google запустил adWords и adSense - это чистой воды спекуляция с Вашей стороны. К тому же мы уже обсуждаем "не-поиск"? Не так ли.
Про blogspot я действительно забыл. И еще YouTube, про который я упомянул. Все, или мы что-нибудь еще забыли? Ну и самое главное: чтобы скупать стартапы пачками нужно иметь успешный и налаженный бизнес, как у Гугла с Яху, чтобы деньги лились рекой. Что-то я сомневаюсь, что инвестор побежит выдавать деньги под покупку "чужих" проектов. Он лучше пойдет приобретать их напрямую.
По поводу Черепахи: пусть может, все-таки, лучше Д. Крюков расскажет? Пресс-релиз выпустит. Не хочется быть испорченным телефоном.
По поводу Пунто: там было совсем игрушечное финансирование, которое, к тому же, еще и очень быстро закончилось. Та же команда Яндекса годами сидела на шее Комптека до момента, когда они только решили найти стороннего инвестора.
Осталось выяснить, где им это удалось. :-)
Хорошо, Вячеслав, скупают. А с каким проектом, кроме U-Tube это дает им возможность занимать лидирующие позиции?
Вы абсолютно неправильные вещи говорите про провал Пунто.
И скорее всего, неправильные вещи про Черепаху. За Черепаху не могу ручаться, я это не от людей из Стэка слышал. Мне их соображения, извините, пересказал человек, который со Стэком общался.