Ashmanov

Ashmanov
Рейтинг
66
Регистрация
21.11.2000
Должность
"Ашманов и Партнёры", гендиректор

старый добрый Гугл, который даже и не заметит что его поставил Mail.ru...

Вы это серьёзно? Конечно, Гугл поставили с ведома Гугла, это очевидно.

Илья, это действительно пока обкатка, но Гугл там будет использоваться совершенно точно, вместе с Бегуном. Рамблер они снимут.

И Волож об этом знает, так что можешь его спросить...

А о какой компьютерной прессе ты говоришь? Тут нужны обозреватели именно рунета - остальные пишут про новые широкие ЖК-мониторы и цифровые камеры для ванной.

Но мало их и узок их круг. Вебпланета умерла, c ADaily тоже фигня какая-то, Интернет.ру обновляется вяло, больше философскими статьями. Компьютерре всё это до лампочки, так же как и CNEWs - они обычно пишут про западный рынок. Более того, ты совершенно прав, собирать в поле новостную информацию самостоятельно они давно отвыкли - проще западные новости копировать и переводить и пресс-релизы транслировать.

Кстати, я давно (с Нового года) не вижу на прилавках Мира Интернет и других интернет-журналов. Они тоже умерли?

Ты прав, Илья.

Вижу, что Интернет тебе нравится и ты в нём с удовольствием копаешься. Ну и хорошо.

Просто поисковая машина - это, на мой взгляд, фаст-фуд.

Он тоже нужен людям - люди бегают по улицам, выбегают на полчаса из офисов, нагуливают аппетит в парках и на горнолыжных горках, что-то же им нужно поесть. Это жизнь.

Более того, рестораны этого заменить не могут. Ну не пойдёт семья, запускавшая змея на Воробьёвых горах, в помпезный ресторан.

А пойдёт в МакДональдс.

Кстати, не замечали, что в МакДональдсах - очень неудобные стулья, всегда. Это для того, чтобы не задерживались, не рассиживались. В частности, поэтому и пиво там не дают. Вот в Ростиксе дают и народ торчит там заметно дольше.

Чем-то это мне смутно напоминает твою концепцию о том, что есть упрощённая и совершенно особая модель поиска в голове пользователя и главное - её не стряхнуть.

Быстренько дал слово, нашёл что-то, дал ещё слово-два (не дай Бог три), нашёл, посмотрел. Три раза не вышло найти - убежал. Главное - не заморачиваться, трясти быстрей.

Я не спорю с тем, что такая модель - реальна. Я просто хочу сказать, что да, фаст-фуд - это кусок жизни, он заводной, живой, пахучий, массовый, адреналиновый, но бывают и рестораны, и домашнее питание. Это для спецслучаев, наверно. Но их много, денег там тоже много и так далее.

У тебя опечатка - должно быть "описание спама для Spamtest".

Ну, причины очевидные и самые распространённые.

Нехватка ресурсов для раскрутки, отсутствие чёткого плана развития бизнеса, неправильный менеджмент, частая смена курса. Эти два проекта с самого начала были малахольные.

Болгарский проект был получше - там был хороший менеджер и шансы захватить интернет-аудиторию всей страны были очень неплохие. Телекоммуникационный гигант Global One (болгарский филиал) был в партнёрах. Проект начал сам развиваться довольно быстро. Но интерес инвесторов Рамблера не простирался даже до пары десятков тысяч долларов на развитие проекта. Да и объём рынка в Болгарии небольшой, пользователей было мало. Вот его и закрыли, а скорее забыли постепенно. Откладывали с месяца на месяц решение о финансировании, пока он не умер. Приучили не есть.

А немецкий проект с самого начала был бутафорией. То есть технологически он был сделан нормально и заработал, однако немецкий менеджер требовал много денег ежемесячно и не давал никаких планов развития, да и не сделал ничего за несколько месяцев, даже поддержку пользователей проекта толком не смог оказывать. Тем более, что этот проект не был рассчитан на основное население страны (а на русских эмигрантов), "большой" интернет-рынок Германии далеко не был свободным и так далее.

А для попадания адреса в спам-списки есть более простые объяснения - словарные атаки и прочие методы подбора и проверки наличия адресов.

Буквенные адреса длиной в 6-8 букв, я думаю, вообще проверяются почти целиком по всем вариантам. 30 в 6 степени - это тысяча в третьей, то есть всего миллиард вариантов. Это немного. А алгоритмы там, конечно, хитрее, наподобие жадных алгоритмов, и засекают гораздо больше реальных адресов.

Статья просто не содержит никаких утверждений, которые можно было бы конструктивным способом явно проверить или опровергнуть. За исключением мелочей:

Например, вовсе не проходит весь российский трафик через М9.

И молчащие алдреса тоже часто начинают получать спам.

Ну, а читают ли спецслужбы весь российский трафик - ответить легко. Конечно, нет. Для того, чтобы это доказать, нужно на пальцах подсчитать этот трафик. Вот смотрите:

На mail.ru - 3-5 миллионов писем в день при 3-4 миллионах активных пользователей (заходящих хотя бы раз в месяц). Сотрудники Mail.ru говорят, что у них каждый второй ящик России. Ну, пусть даже так (потому что если у них только одна пятая ящиков, то российский трафик больше не в два, а в пять раз).

Добавим то соображение, что в корпорациях посылают больше почты, чем пользователи mail.ru. Не одно-два письма в день, а 10-20.

Пусть всего мимо mail.ru проходит ещё два раза по столько (оценка занижена, ну да ладно).

Таким образом, российский трафик можно оценить снизу цифрой в 15 миллионов писем. Я лично думаю, что он ближе к 30-50 миллионам.

Проверим по-другому. Всякие обзоры и отчёты насчитывают 8-10 миллионов пользователей Интернета в России.

Пусть только 2-3 миллиона активных. Сколько они шлют писем? Да, похоже, получится примерно столько же. На самом деле там распределение очень неравномерное (есть отморозки вроде меня со 100-150 письмами в день).

Теперь о чтении в реальном времени. Сколько писем может прочитать в день один агент спецслужб, обученный скорочтению? Пусть 10 в минуту (если письма по 2 Кб), 600 в час, 5,000 в день. Значит, нам нужно 3000 агентов, всё время читающих письма. Да, не забудем про сменную работу. Чтобы читать всегда, не пропуская ни единого письма, нужно ещё два сменщика. Итого 9,000 агентов. Это цифра не астрономическая, в России взрослых непьющих мужчин всё-таки больше, но практически нереальная.

Да заметим, что приложения к письмам я не учёл. А их тоже нужно открыть - то Word, то Excel, то Лексикон, а то и pdf?, и прочесть.

Таким образом остаётся архивирование и пост-анализ (неужели с помощью Яндекс.Сайта?!!! Нет?!!! Тогда Экскалибура???).

Сколько же мегабайт нужно архивировать?

Возьмём среднюю длину письма с приложениями в 5 Кб. Тогда это 75 Гбайт в день. А если на самом деле распределение длин письма не такое, и скажем, среднее = 20 Кб, то тогда 300 Гбайт в день.

Тоже не сверхъестественные цифры, но не очень реальные в наших условиях. Яндекс с Рамблером таких объёмов не потянут, а вот Гугл - вполне (но у Гугла 54 тысячи серверов).

В любом случае на съём трафика нужны тысячи машин в разных узлах, сливающие данные в центр.

Так что, если на СОРМ затратили порядка несколько десятков миллионов у.е и продолжают тратить сотни тысяч в месяц, то такое архивирование с индексированием возможно.

Вопрос только в том, что дальше делать с этой массой?

Большинство писем содержат обрывки информации, негодные без знания контекста, без внедрённого агента в компании или банде, а поиск чего-то новенького по лексике бесперспективен - лексика бандитов и террористов с педофилами не отличается от обычной. Прочесть всё нельзя, как мы видели, а что искать по индексу? "Взрывчатка"? "Обналичка"? "Отмывание грязных денег"? Щас, так они прямо и написали!

Заметим, что прочесть переписку конкретного преступника или подозреваемого можно и так - по постановлению суда.

Господа!

Ну чего вы пристали к Яндексу? Неужели вы думаете, что можно вот им с потолка взять и подсказать такую идею, а они за неё так прямо и ухватятся? Действительно, всё же очевидно! А почему, кстати, сибирские крестьяне не продают кедровые шишки в Аризону? Надо им посоветовать.

Кого они должны обслуживать по англоязычному Интернету - наших пользователей-американофилов? Их мало. Американцев? Да у них Гугл и прочие есть.

Гугл - это типично американская история успеха, Гугл получил инвестиции (что-то порядка 40 миллионов) в момент наибольшего раздувания интернет-пузыря. При чём здесь качество поиска? В 1998-1999 годах Гугл действительно выгодно отличался от всяких дохлых АльтаВист (кстати, откуда странная идея, что у АльтаВисты есть деньги?).

Они сумели это отличие раскрутить, в прессе и бизнес-кругах. В том числе подав всю историю, как легенду об американской мечте: два высоколобых аспиранта, придумали клёвый алгоритм в гараже и так далее. Это всё в значительной степени именно легенда.

Сейчас Гугл даёт какое-то качество и имеет очень агрессивную маркетинговую политику, хороших продавцов и так далее. Ну, нормальный бизнес. Предположим, что у Яндекса технология не хуже или лучше. Теперь давайте дадим Яндексу 40 миллионов. Это ведь немного, если мы тут все скинемся...

Но нужно несколько побольше - чтобы Гугл с первого места выбить. Или хотя бы кого-то там с десятого. И тут нужны деньги, а не технология.

Ну оставьте детские разговоры про грамматику. Она тут не при чём. Это в поисковиках дело пятнадцатое. А у Яндекса наверняка английская морфология есть, так же как она точно есть у Рамблера и Апорта. Вон Рамблер выходил на немецкий рынок и на болгарский, и соответствующие модули морфологии мы ему сделали, ну и что? А бизнеса там никакого не вышло, по более-менее очевидным причинам.

А когда ищут "програмы", подразумеваются "программы". Ну и что?

Мы и говорим о том, что site design, возможно, не вполне грамотное выражение, поэтому его реже задают в строке запроса.

А может быть, это и не так, не знаю.

Вообще интересно было бы исследовать "ореол" среднего запроса - ошибки, опечатки вокруг него и более многословные уточнения его.

Тут будет принципиальное отличие между "моносемантическими" запросами (типа "антивирус", "раскрутка", "крэки", "порно"), которые при уточнении не теряют основного смысла, и полисемантическими ("программа"), которые являются просто сборищем омонимов и при уточнении распадаются на совершенно не связанные, независимые кластеры.

При этом заметим, что под что именно оптимизировать страничку - большой вопрос. Вообще оптимизировать сайт под много низкочастотных запросов часто имеет смысл - интеграл по ним часто больше, аудитория лучше, а частотный запрос слишком конкурентен. Особенно в случае омонимии частого общего запроса, когда половина результатов поиска вообще не про то.

Можно оптимизировать страничку и под грамматические ошибки и опечатки - по тем же соображениям (см. в нашем сборнике статью Павла Ряйконнена).

А спор-то о чём? Что не надо было говорить "всегда"? Хорошо, заменяю на "в подавляющем большинстве случаев".

Ну, теперь нужно вспомнить, о чём таком содержательном была речь до этого.

Уважаемая Нита, я, собственно, и не хотел Вас обаивать умными высказываниями, так что можете смело разочаровываться. Я, возможно, даже не стану стреляться.

Так мне никогда не говорить всегда? Или всегда не говорить никогда? Прямо не знаю, как Вам потрафить!

А пример, по-моему, опять некорректный.

Насколько я понимаю по-английски, site и web site - могут означать разные вещи (site слово старинное, означает совсем не сайт в интернете, в отношении фирмы может означать просто офис или стенд на выставке). Носитель языка, видимо, может сказать для краткости и site design, когда захочет говорить именно о дизайне интернет-сайта, и в Интернете так и говорят по большей части, но точнее всё-таки звучит web site design.

Думаю, что этим может объясняться меньшее число более общих запросов.

Может, их вообще производят русскоговорящие?!!

На Ваших трёх- и четырёх-словных сочетаниях, как видим, имеется примерно тот же закон.

Всего: 359