iseg

Рейтинг
80
Регистрация
15.12.2000
Должность
Search Engine Department Manager, Yandex
Интересы
Search Engine Development

"Непотизм" сиречь "кумовство".

Принцип спама, четко сформулированный И.А Крыловым: "Кукушка хвалит петуха, за то что хвалит он кукушку".

В спаммерском просторечьи называется "линконакрутка".

Старая тема. Посмотрите сайт http://www.plagiarism.org/

По-моему, Данни года два назад об этом на сайте писал. Иначе откуда я про него помню?

Как минимум, в запасе у Яндекса "поиск похожего документа".

"yandsearch?ds=проверяемый_URL",

если кто не в курсе.

Этот механим отлично находит "цельностянутые статьи". Года два назад (как раз во времена этих разговоров) я так находил подтверждение скандалу между "компьютеррой" и "открытыми системами", кажется.

Что касается методики списывания, когда надергиваются куски из разных документов, то тут надо что-то специальное сооружать. Не очень трудное. Но просто такое ощущение, что овчинка не стоит выделки.

Если у вас есть конкретный заказ от МинВУЗа, приносите - рассмотрим. К нам ни МГУ, ни ЛГУ, ни МинВУЗ по этому поводу не обращались.

Это жаль, я заранее согласен.

<font face="Verdana" size="2">Originally posted by funsad:

Илья Сегалович, руководитель отдела поисковых систем Яндекса, ведущий программист. ....

К сожалению, лично с Игорем и Ильей я не знаком, и информация собиралась иными путями.
</font>

Это точно. Я даже могу назвать эти пути

Спасибо за внимание к моей персоне. Придется отвечать, бросив работу над Кубком .

Родился в Нижнем Новгороде (Горьком) в 1964 году. А вовсе не в Балашихе. Откуда она, кстати, вылезла, Александр? (Ваш ответ не засчитывается )

Я, увы, не потомственный священник, хотя бабушка, действительно из семьи таковых. Насчет Добролюбова - похоже, правда, хотя сам в музей не ходил, верю маме на слово.

Родители геологи, детство повел в Казахстане. Отец в 60-е годы открыл "40 лет КазССР" и "Восход" - крупнейшие в СНГ месторождения хромитов, за что он получил всякие правительственные награды и вошел в разные энциклопедии.

Учился в городе Алма-Ате, сначала в школе #54 (в центре города; по слухам там же где Жириновский). Начиная с седьмого класса, 4 года подряд сидел за одной партой со своим другом Аркадием Воложем (не исключено, что кое-кто слышал это имя) в Республиканской Физ.-Мат. Школе города Алма-Аты. Каковая парта выдала на гора половину золотых медалей вышеозначенной школы в 1981 году. Тогда же умудрился удачно отстреляться на Всесоюзной олимпиаде по математике, где занял второе место (см. архивы журнала Квант за 1981 год)

Не попав в университет, куда мы с Аркадием поступали вместе, мы разбрелись. Он пошел по стопам своего отца, в Керосинку (его отец известный нефтяной геолог, тоже наоткрывавший кучу всего, и старый товарищ моего отца, откуда, собственно, и наше знакомство), а я по стопам своего, во МГРИ на геофизический факультет. Времена были тяжелые, на дворе стоял Афган и новый закон о призыве студентов, начиная с 1982 года. Выбора не было.

Отучившись и женившись в первый раз, попал в ВИМС (институт минерального сырья), где благополучно писал на фортране геофизические системы и даже немного публиковался (Известия АН, серия Физика Земли, например).

Года с 1990 возникло сильно ощущение, что надо делать что-то еще. К счастью, искать долго не пришлось, Аркадий к этому моменту уже основал фирму, специально под Борковского, который к тому времени уже имел за плечами спелл-чекер, словарь Джин, и кучу всего.

Надежды Аркадия не оправдались, Борковский уехал в Америку, но ребята, которые остались (один из них сейчас в Бостоне программист, а другой Cisco Russia) сделали отличную программу с полнотекстовым морфологичесикм поиском. Для 1990 года это, наверное, был рекорд. Я начал подрабатывать у них, делая дистрибутивы, тестируя, и, даже, написал инсталлятор (точнее переписал тексты Воложа) и деморолик. Постепепенно обнаглел и стал все оптимизировать, перейдя в разряд основных разработчиков. На продаже этого продукта в 1991 году можно было жить, кормить 5-10 людей и даже весной 1992 года пойти к Апресяну и Богуславскому и получить у них качественный словарь.

Потом кончились деньги, а изготовление своей морфологии оказалось совсем непростым делом. Первая версия на новом словаре (ни одной строчки Борковского) работала со скоростью 3 слова в секунду. И только, заглянув в книжки, весной 1993 года я написал морфоразбор, который держал 100 тысяч русских слов в 300 килобайтах основной памяти и работал со скоростью 1000 слов в секунду на тех еще компьютерах.

Наконец-то появилась возможность сделать _быстрый_ индексатор, что называется "для конечного пользователя". И осенью того же года , примерно, появилась первая программа "Яндекс". Весь тот год я был, по сути, единственным программистом в конторе, которая занималась продажей компьютеров, потому что программы как-то не очень продавались. (локальный поиск, вообще, мало кого тогда интересовал).

Но вместо того, чтобы делать непонятно кому нужные поисковые системы, решили пойти по проторенному пути и выпустить "закрытую" систему с морфопоиском. Так появилась "Библия". Точнее Библейский Компьютерный Справочник. Программа под Windows. Изготавливали мы его уже вдвоем, мне в подмогу Аркадий взял интерфейсного программиста. Году в 1994 мы ее потихоньку продавали и доделывали, а 1995 ее увидели люди из ИнформРегистра и перешли к нам от своих прежних поставщиков технологии (Пархоменко). Так мы получили большой заказ на "Грибоедова".

Пока его делали, взяли еше программистов, КомТек переехал в офис с Интернетом, и все поняли, что нужно срочно делать поиск для Интернета. Это был конец 1995 - начало 1996 года.

Весной 1996 года морфология на "закрытом" словаре перестала всех устраивать. По одной простой причине: в Библии - 40 процентов слов несловарные, а в интернете и того больше (если мерять по словарю)

Выслушав несколько едких упреков (вот мол, сколько лет занимаешься этим, а ничего хорошего для людей не сделал ), я жутко на себя рассердился и сотворил за довольно короткий срок "открытый" словарь, примерно то, что сейчас работает в Яндексе. Ну а летом 1996 года к нам пришла Елена Колмановская, и вся дальнейшая история Яндекса хорошо ею описана в самых разных местах. Даже на майках .

Последний год-полтора почти совсем не программирую. Приходится быть т.н. "менеджером".

Из личных деталей - примерно в 1993 году я решил заняться английским (имея стратегические планы уехать куда подальше), и там на курсах, встретил свою будущую жену. С ней мы стали ходить в Интернат #103 и возить детей регулярно в ее студию при детском театре "Подвал". Постепенно вовлеченность наша в их дела, а их в наши возрастала, и примерно через год после того как у нас с Машей появился свой ребенок (у нее до этого уже было трое), мы взяли сначалу одну, а потом еще двух девчонок к себе в семью. Таким образом, я еще и папа большой фостеровской семьи.

Да и еще, каждый год, осенью, я участвую в туре Пэтча Адамса по России. То есть работаю клоуном. Уже примерно 6-7 лет.

С уважением,

Илья Сегалович.

Спасибо большое, задушим.

Илья

<font face="Verdana" size="2">Originally posted by AiK:
-Доктор, меня игнорируют
-Следующий
© Бородатый анекдот
</font>

Это offtopic, так же, впрочем, как и исходное сообщение. Заранее прошу прощения.

Я, Артем, после прочтения ваших высказываний http://about.al.ru/subscribe/issue2.html , что мы, рамблер и апорт, все как один "приобрели исходники одного и того же зарубежного поисковика", до сих пор глотаю ртом воздух.

Так что на ваши реплики отвечать начну не скоро, вы уж извините покорно.

Илья

<font face="Verdana" size="2">Originally posted by wolf:
[BДалеко не у всех редиректы используются в спаммерских целях.</font>

Приведите, примеры, пожалуйста.

Илья

<font face="Verdana" size="2">Originally posted by Gray:
Илья, как я понимаю, Альтависта все же оказалась на высоте и ее постигла участь "несдавшегося врага". Случаем, не в этих целях появились заголовки "Hasta la vista Altavista"?

Это я к тому, что ее-то как раз в иаблице нет...
</font>

Ну зачем же так, я всех одинаково люблю, честное слово

Я просто боялся, что не влезет, и, к тому же, у АльтаВисты - похуже результаты. Да, господи, проверять-то ну никак не больше 10 минут

Илья

Да ладно, чего там. Дело нехитрое.

Берем N редких слов (чтобы было легко проверить весь результат).

Делаем запросы - очень удобно из нашего Я-Бара, там все перечисленные

товарищи фигурируют. Перед этим надо еще залезть в настройки альтависты,

фаста и гугля, ну да это вы и сами знаете.

Вот и результат. Не знаю, влезет или нет, я таблички

в UBB писать не умею.


Yandex Rambler Google Aport Fast
перверсия 1032 229 22% 202 20% 584 57% 204 20%
квадруполь 158 41 26% 35 22% 38 24% 35 22%
спелеометрия 4 1 25% 0 0% 3 75% 0 0%
компрачикос 116 38 33% 7 6% 98 84% 22 19%
внеиндивид-ый 86 16 19% 10 12% 4 5% 9 10%
контроверсия 70 41 59% 9 13% 17 24% 7 10%
бладшот 9 1 11% 3 33% 9 100% 0 0%
пармизан 14 1 7% 2 14% 2 14% 3 21%
абхидхарма 415 112 27% 150 36% 178 43% 181 44%
паринирвана 143 50 35% 25 17% 21 15% 25 17%
резольвент 453 224 49% 42 9% 356 79% 28 6%
сантистокс 64 17 27% 26 41% 17 27% 35 55%
сигарилла 1139 57 5% 16 1% 211 19% 15 1%
бриолин 430 111 26% 165 38% 218 51% 101 23%
вишнуизм 187 59 32% 91 49% 109 58% 72 39%
аргонавтика 407 209 51% 135 33% 310 76% 136 33%
бхакти 1826 527 29% 2330 128% 1372 75% 1478 81%
анахоретство 21 11 52% 13 62% 7 33% 6 29%
иподьякон 139 53 38% 47 34% 125 90% 33 24%
виверра 154 41 27% 51 33% 101 66% 83 54%
цивета 67 9 13% 18 27% 11 16% 19 28%
брахиозавр 119 30 25% 70 59% 107 90% 58 49%
неликвидность 463 261 56% 89 19% 169 37% 140 30%
инклинометр 261 81 31% 36 14% 161 62% 47 18%
базед 44 13 30% 26 59% 17 39% 49 111%
------------ --- --- --- ---
В среднем 30% 31% 50% 30%

Результаты хорошо согласуются с официальной статистикой Апорта и Яндекса.

Еще нюанс - мерил это примерно месяц назад

Конечно же, слова я долго и тщательно подбирал, чтобы принизить конкурентов,

а не просто залез в энциклопедию и выдрал оттуда первые попавшиеся.

Удачи, Илья

Нет, она не для этого появилась.

Слуайно. Сейчас уберем

А откуда эта дезинформация про нуль-ссылку?

Илья

Прогресс, однако.

Из Гугля нам ответили, сразу как они запустили русский интерфейс. Видимо, заодно и поиск починили . Теперь и мы его вернули.

Осталось только дождаться, когда Спайлог обновит статистику, чтобы увидеть все эти телодвижения.

Илья

Всего: 442