Ashmanov

Ashmanov
Рейтинг
66
Регистрация
21.11.2000
Должность
"Ашманов и Партнёры", гендиректор
InSAn:
Насколько я знаю, уже нет :)
Гугль передумал идти... Хотя, возможно, это только слухи...

Нет, не слухи. Передумывал действительно три недели назад. А потом опять передумал.

Так что офис для продаж и маркетинга они создают, директора уже практически наняли.

Как писал Leom

У поисковиков просто нет поиска похожих, а есть поиск по фразам, посему некорректно говорить что он плохой или хороший.

Лев, у поисковиков есть поиск похожих, и мы его с вами вместе тестировали в переговорной месяц назад. В результатах поиска можно у каждой ссылки на документ попросить найти похожие на него.

Тогда вы почему-то не отрицали наличия такого поиска у Я, Г, Р.


Игорь, а можно я опубликую мои комментарии к отчету Харина с указанием на то что ряд выводов не соотвествует действительности?

Достаточно уже вашего утверждения о том, что вы отвергаете выводы отчёта. Отчёт делался для внутренних целей, готовить его для публичной публикации не вижу смысла.

Нет события.


Ну вообще то я ожидал что если Вы мнение высказываете, то будете мотивировать его какими то фактами, которые каждый желающий может проверить сам.

Лев, я например, считаю, что автомобиль с полным приводом лучше переднеприводного на зимней дороге. Но это не значит, что я готов немедленно вступить с вами в бурную дискуссию на пятьдесят сообщений с каждой стороны, или отдать вам свой автомобиль для сравнительного тестирования.


Ну извините про то что нельзя обсуждать новые технологии я не знал.

Можно. Если обсуждать. А вот грузить всех читателей маркетинговыми поливами не стоило бы.


Но просто меня как человека с техническим образованием доводы без доказательств как то не убеждают........

А вы именно такие доводы и приводите. Тогда приведите хоть одно доказательство того, что у вас есть новая, уникальная, хорошо работающая технология. Ваша демо-версия таким доказательством не является. Увы.

А об алгоритме вы молчите, как партизан.

То есть читателей форума Вы хотите убедить именно простыми декларациями? А они ведь тоже в основном имеют высшее техническое образование...

Я вот тоже имею такое образование. Трижды с вами встречался, ничего, кроме маркетинговых деклараций не услышал, а штука - по существу не работает.

Я выхожу из этой дискуссии, всего доброго. Давайте подождём второй версии, выложенной в сеть и участия в РОМИПе.

Лев,

отвечаю: нет, ничего мы не готовы, а зачем?

Вы ещё на Гугл нападите и потребуйте немедленного тестирования.

а с чего бы вдруг мы должны все вместе собраться, напрячься и старательно тестировать вашу технологию, сравнивая со всеми системами, что у нас есть? У нас своих дел полно. Я и так ведь три раза с Вами встречался, сидел часа по два, привёл на встречу Харина с Ивановым, Тутубалина, попросил Харина протестировать. Ну,

Вам предлагают на РОМИП - Вы даже не знали, что это такое. Нет, мол, тестируйте здесь и сейчас!

По-моему, вы здесь как раз занимаетесь агрессивным маркетингом, ничем иным.

Вы нарочно выступаете в провокационном стиле, подбиваете спорить, требуете от участников доказывать, что они не верблюды. Я вот, мол, заявляю, что Путин - дурак, и пусть он немедленно сюда выйдет и опровергнет меня.

Вы горячо утверждаете, что у всех поисковиков поиск похожих плохой! Неубедительно.

Мы же с вами смотрели на экране и Яндекс, и Рамблер, и Гугл. Как-то они ищут похожие, не такой он уж и плохой. Да, есть и нерелевантные находки.

А потом Харин посмотрел - и пишет, что у вас релевантность так себе. Каждый второй-третий документ сомнительный. Ну и что дальше?

И с чего это мы должны публиковать отчёт и защищать его от ваших опровержений?

Мы посмотрели, протестировали. У меня появилось своё мнение. Я его высказал. Отчего это я вдруг должен его кому-то доказывать (а вы будете горячо оспаривать)? Мне лично это неинтересно. Мы же вам не конкуренты, у нас нет заговора против Вас (но я уверен, что Вы его скоро обнаружите).

Лучше Вы сделайте веб-проект, запостите тут ссылку, желающие посмотрят.

Вы извините, это выглядит так, как если бы Вы пришли в какую-то компанию незнакомых вам людей, и стали кричать, что вы тут самый сильный и любому морду набьёте. "А, не хотите проверить, кто сильнее - значит, вы боитесь меня!. Давай, давай, выходи..."

А люди просто собрались чаю выпить, а не с вами драться.

Лев, Вы с вашими амбициями и куражом идите лучше на ринг - делайте продукт, продавайте, станьте круче Верити и Хамингбёрда, делайте доклады на конференции.

Наши досужие мнения станут вам не нужны.

Павел,

Это характерный пример того, что сложная задача на первый взгляд кажется простой. Но это только кажется.

На самом деле алгоритм, Вами приведённый., работать не будет в принципе, так что и сравнивать с ним нет никакого смысла.

Поясню. Вы можете, конечно, взять все слова документа, даже выбросить из них стоп-слова, о чём вы забыли упомянуть (предлоги ведь не нужны, верно?), затем намешать синонимов и дальше запросить традиционный поисковик.

Но! Тут вам придётся решить, как объединять полученный список слов в запрос к поисковику. Есть два варианта:

а) все слова запихнуть в один запрос - через ИЛИ, или через И, или даже объединить их в некую ДНФ (в скобках некоторые слова через И, а сами скобки через ИЛИ);

или, напротив,

б) наделать много атомарных запросов с небольшим количеством слов каждый и объединять потом результаты.

Так вот, в первом случае вы почти гарантированно получите нулевой результат - запрос слишком длинный и слишком сужает перебор.Попробуйте ввести запрос из двух-трёх десятков слов в Яндекс или Рамблер - он в среднем не найдёт вообще ничего. Хоть одно слово да испортит пересечение списков вхождений.

Во втором случае вы получите гигантское количество результатов и должны будете как-то их профильтровать и обьъединить - а как, придётся придумать, и это не так просто.

Синонимы, конечно, добавят ещё больше шума. Вы не сказали, откуда их брать, но это серьёзнейший вопрос - потому что традиционные словари синонимов не годятся.

У нас уже была дискуссия про синонимы и как они ухудшают поиск.

В общем, поиск похожих - довольно тонкая задача.

И речь как раз нужно вести о том, чем предлагаемый Львом алгоритм поиска похожих КАРДИНАЛЬНО отличается от существующих в Яндексе и Рамблере, Гугле и прочих поисковиках.

Насколько я понимаю, Лев выдвигает два принципиальных отличия своей технологии: 1) качество поиска, 2) скорость поиска/индексирования на огромных массивах документов.

Коротко скажу, что мы на прошлой неделе протестировали модуль, который Лев передал нам в Москве, нам не понравилось - релевантность поиска пока низкая. То есть находимые документы - на самом деле не очень похожие. Таким образом, по качеству кардинального отличия от других производителей мы пока не усмотрели.

Тестировал Николай Харин, это один из лучших специалистов в России, его алгоримы поиска и ранжирования использовались и используются в ОРФО, Следопыте, МультиЛексе, Рамблере, Спамтесте, Новотеке.

Что касается скорости, тут я ничего сказать не могу - тестовый массив там не очень большой.

Да нет, не тайна.

Просто не готовы ещё.

А то, что не ответили - нехорошо. Прошу прощения.

Как писал kit
В следующий раз обязательно пансионат какой-то нужно. Ребятки, ведь >60K$ собрали! Можно и раскошелиться на более неформальную атмосферу, а не только барыш подсчитывать. ;-)

Во-первых, согласен, не надо барыш подсчитывать. Особенно, если он чужой и если не знаешь расходов.

Во-вторых, хочу извиниться за зал и качество сборника. Зал - результат фактического обмана со стороны Инфопространства. Ну и народу уже много, в Ирис уже не влезли бы. Сборник - результат того, что авторы дали доклады за два дня до конференции. дадим электронную версию.

В-третьих, про пансионат: мы об этом думаем уже третий год. Пансионат требует примерного подсчёта и бронирования большого количества номеров заранее, а огромная масса участников спохватилась за день. Кроме того, удорожает участие ещё минимум на 100 у.е . Плюсы тоже есть - безграничное общение. Минусы - неизбежная пьянка, дороговизна, организационные сложности. Время проведения, опять-таки, под сомнением - поздняя осень в Помосковье не очень приятный сезон.

Как писал sottovoce


И исключительно важный вопрос организаторам - электронная версия докладов конференции ее участникам будет предоставлена лишь за отдельную плату! ПОЧЕМУ?

Электронная версия будет выслана совершенно бесплатно.

Когда добавим доклады, которые нам не сдали участники, и, возможно, расшифрованную стенограмму. Возможно, стенограмма будет потом отдельно.

Как писал Maxim Golubev
Project Computing выпустила Google Desktop Proxy. Эта утилита на основе Java обеспечивает другим компьютерам удаленный доступ к результатам локального поиска Google на компьютере пользователя, сообщает ResearchBuzz.
/ru/news/5510

Я очень рад, что первый пункт моего предвидения сбылся.

Максим, у Вас удивительная манера выражаться и мыслить нечётко. Если так мыслить, то при сравнении двух нечётких утверждений всегда будет хоть какое-то совпадение. И Вы всегда будете провидцем.

Ждёт тебя, золотце, дальняя дорога, казённый дом и трефовый король... И червовая дама ждёт почти каждого из нас.

Скажем, можно сказать, что через некоторое время компьютерные технологии ещё более разовьются. И поиском будет пользоваться ещё больше людей, в том числе локальным. Каково предвидение? Кто со мной поспорит, ну-ка?

Должен вам сказать, что системы, индексирующие пользовательские компьютеры, а также поисковые P2P-сети, поисковые клиенты с экспортом новостей - далеко не новость.

А объединение каталогов для хранения файлов - это вообще уже древняя история.

Ну и что следует из того, что некая компания выпустила ещё один клиент для такого экспорта?

А Вы ведь утверждали, что это - столбовое направление развития поисковых технологий.

Ещё раз спрошу - Вы мне дадите пошарить поиском по Вашему диску? Нет? А тогда кому дадите? Подруге? Маме?

И как такие малые очаги совместного поиска сольются в глобальный поиск, если я не пущу никого в свою поисковую вотчину и Вы - тоже?

Я-то, честно говоря, не захочу и сам шарить по чужим компьютерам. Зачем они мне? И так поиск в Интернете - сплошной мусор, а тут ещё бесконченые дубли документов от разных чайников.

Вроде разобрались, в чём дело, ну и ладно.

Хочу прокомментировать некоторые детали:

а) вообще-то мы не подписывали кодекс и хартию оптимизаторов. Не потому что любим чёрные методы, а потому что документы пока не очень проработанные, неаккуратные. Ну, а в общем и целом, мы имеем примерно такой же внутренний кодекс. Это так, для точности.

б) у нас вообще нет огромного количества клиентов. Просто нет, как и у всех игроков на рынке. Их - десятки, не сотни. Большая часть из них - постоянные. Очевидно, оставшаяся часть уходит к другим подрядчикам, прекращает вкладываться в интернет-маркетинг, либо начинает делать продвижение сайта самостоятельно, научившись у нас.

Не исключаю, что кто-то остаётся недоволен. Это нормально, если процент этот небольшой и разошлись цивилизованно. Причины могут быть разные, в том числе несовместимость конкретных личностей с той и другой стороны, загруженность конкретного менеджера и пр.

Но компания Павла - по-моему, совсем молодая, вряд ли к ней могло перебежать множество наших клиентов. У нас не так часто заканчиваются договора, большинство из них на 3-5 месяцев.

в) Случай с неправильным восприятием лекции Андрея довольно поучителен. Это, видимо, наша ошибка. Хотелось развлечь слушателя и дать ему с чем сравнивать позитивные рекомендации.

Но есть общий феномен восприятия - в спешке, при обилии информации, при трудностях понимания люди обычно не воспринимают отрицание. Известно, что у маленьких детей это всегда так - скажешь "не садись на пол" - тут же сядет. Живо представляет в уме само действие, а его отрицание - как представишь?

Известный феномен, что не бывает отрицательной рекламы - помните случай, когда Рейган сказал по ТВ, что вот Америка катится к чёрту, потому что он вчера купил котлету на улице, так есть невозможно? Продажи этого сорта котлет, естественно, резко выросли, причём надолго.

Да и вообще при 1-2 семинарах в месяц чисто статистически гарантированно, что кто-то поймёт неправильно.

Это свойство наивных слушателей нужно учесть. Мы будем поменьше рассказывать про то, какими методами НЕ надо пользоваться и аккуратнее объяснять, что это чернуха.

Как писал Sla

К этому всё и прийдет - родился человек - выбрал себе фирму по обслуживанию жизни - прожил жизнь и умер.
Ну а у этой фирмы уже свои поставщики - сименс, кока-кола и т.д. Всё будет доставляться непосредственно человеку на дом, а заказываться через интернет. Так и будет - сто процентов :) Глобализация называется.

Ну. Родился - выбрал фирму - попил кока-колы - произвёл глаз, почки, печень, простату на продажу - умер.

Вы ж не думаете, что вас будут разводить и кормить просто так?

Подробнее про светлое будущее см.

http://haritonov.kulichki.net/stories/llife.htm

Всего: 359