itman

Рейтинг
64
Регистрация
26.05.2001

Что такое тип лексики?

pro-maker:
А для оценки близости по типам лексики LSI также используется?

LSI - это модный способ определения степени связности ключевых слов в количественном выражении. Это некоторый аналог корреляции терминов. Или степень синонимии. Используя эти данные, можно считать тематическую близость документов.

pro-maker:
itman, проблемы с русским, а с английским и совсем завал. :)

Смысловые индексы - это какие-то параметры, идентифицирующие набор смыслов слов документа, и соответствующий им (смыслам) иерархический рубрикатор?

pelvis, в качестве первого приближения. :) iГоша хорошо выразил. :)

Да нет, скорее всего, Яндекс на ходу классифицирует страничку, приписывая ее к нескольким категориям, а потом смотри, а есть ли среди этих категория пересечения. Если есть, то линки между страничками учитываются.

ХренРедькиНеСлаще:
...

Например, по максимуму скалярного произведения на "тематические орты". Методов довольно много.

О тематической близости у Itman нет. Тематическая близость - это, все-таки, классификация. И к LSI: Latent Semantic Indexing

pro-maker:
Хрнс, у itman-а о нечетком поиске. Похожесть, конечно, можно по-разному понимать, но тематическая близость, наверное, ближе к оценке пересечения с лексикой уровня рубрикатора. Не покажете конкретную ссылку, где у itman-а о тематической близости?

Вы, Вячеслав растекаетесь мыслею по древу, а обижаетесь не по делу.

Вот смотрите с чего мы начали и к чему пришли: с вопроса "сколько денег нужно стартапу". Для, скорее всего, некоммерческого проекта. Вместо того, чтобы помочь людям с оценкой, Вы их посылаете сначала за опытом в Гугл, хотя очевидно время Гуглов прошло, потом поминаете нехорошими словами Черепаху и Пунто (хотя для создания бюджетного регионального поисковика их опыт вполне подошел бы, это к слову о ценности этих проектов), а потом вспоминаете о модной тенденции социального поиска. Опять-таки, ничего модного в этой тенденции нет: участие человека в той или иной степени в поиске всегда существовало. До Веба в виде усилий библиотекарей, в вебе в виде каталогов. В NLM, где я сейчас фактически работают, так до сих пор работают библиотекари и просматривают статьи с целью аннотирования и оценки качества. И традиция эта существовала уже давно, как и сам поиск в NLM, который судя по слухам, существовал еще на мейнфреймах до появления писюков.

И по поводу покупки аудитории вопросно-ответного поиска: а есть ли купить-то в том регионе, где товарищ хочет создать поисковую машину?

Оба-на... уже и социальный поиск приплели. Кстати говоря, этот социальный поиск он тоже фактографический. В частности в уже набранной базе ответов. И от этого никуда не деться, потому что по каждому чиху не побежишь к эксперту.

Вячеслав, я просто опроверг Ваше утверждение о причинах неудачи. И, кстати, стартапы не начинаются с покупки чужих проектов. Вам про это выше тоже уже объяснили.

Почему же сразу "шутить". На чьем опыте Google запустил adWords и adSense - это чистой воды спекуляция с Вашей стороны. К тому же мы уже обсуждаем "не-поиск"? Не так ли.

Про blogspot я действительно забыл. И еще YouTube, про который я упомянул. Все, или мы что-нибудь еще забыли? Ну и самое главное: чтобы скупать стартапы пачками нужно иметь успешный и налаженный бизнес, как у Гугла с Яху, чтобы деньги лились рекой. Что-то я сомневаюсь, что инвестор побежит выдавать деньги под покупку "чужих" проектов. Он лучше пойдет приобретать их напрямую.

По поводу Черепахи: пусть может, все-таки, лучше Д. Крюков расскажет? Пресс-релиз выпустит. Не хочется быть испорченным телефоном.

По поводу Пунто: там было совсем игрушечное финансирование, которое, к тому же, еще и очень быстро закончилось. Та же команда Яндекса годами сидела на шее Комптека до момента, когда они только решили найти стороннего инвестора.

Vyacheslav Tikhonov:
Шутить изволите? Еще в апреле 2003-го гугл прикупил компанию Applied Semantics и на ее опыте работы с рекламодателями и технологии запустил adWords, а позже - adSense, приносящие сейчас баснословные прибыли и беззаговорочно лидирующие в своих сегментах на рынке. Почитайте историю покупок гугла - очень познавательная информацию о том, откуда развился тот или иной сервис.
Да и тот же Blogger далеко не последний сервис по популярности, не говоря уже о Blogspot.


itman, так огласите общественности правильные вещи. Где сейчас эти проекты и чем занимаются? И в чем заключается их успех.

Осталось выяснить, где им это удалось. :-)

gekos:
Vyacheslav Tikhonov, верно, ведь таким макаром Гугля приобретает не только наработки и технологии, но и аудиторию.

Хорошо, Вячеслав, скупают. А с каким проектом, кроме U-Tube это дает им возможность занимать лидирующие позиции?

Вы абсолютно неправильные вещи говорите про провал Пунто.

И скорее всего, неправильные вещи про Черепаху. За Черепаху не могу ручаться, я это не от людей из Стэка слышал. Мне их соображения, извините, пересказал человек, который со Стэком общался.

Vyacheslav Tikhonov:
itman, понятно, что поиск для них приоритетен, и важнее него ничего нет. Но если Вы забыли, в этом топике речь идет о раскрутке стартапа, а успешный проект без аудитории создать невозможно. Ее можно либо купить у кого-то, либо вложить свои собственные $$$ и со временем наработать, если получится.
Как я уже писал, Гугл обычно предпочитает первое при интеграции в новый рынок.
Поисковые машины вроде Turtle или Punto на том и прогорели, что не смогли собрать свою собственную аудиторию.

P.S. Если же я кого-то насмешил, то это только от его собственной недальновидности. ;)
Всего: 444