Utr

Рейтинг
101
Регистрация
19.03.2006

Каширин,

:))

А звонившие Вам не рассказали - они там, в самом деле, тестируют что-нибудь? Или им пофиг. А если тестируют, то каким образом?

ultrabyte,

10х5х200=10000

Недотягивает до 43385, даже если не умножать на 10 или 20:)

И ведь это просто объём проиндексированной информации. А есть ещё и всякие необходимые дополнительные штуки вроде анкор-базы и пр.

Из известного интервью:

=======================

Рост вашей базы влияет на работу поискового движка?

Илья Сегалович: Влияет, тяжелее работать. Все очень пропорционально, чем больше база, тем труднее работать.

Успеваете апдейты делать?

Илья Сегалович: Успеваем, успеваем, успеваем. (задумчиво)

Михаил Ушаков: Кроме апдейтов, у нас еще идет технологическое обновление, то есть мы каждый день «кушаем» по 3 сервера: на завтрак обед и ужин.

Заменяете?

Михал Ушаков: Нет. Новые ставим. Сегодня в технопарке Яндекса около тысячи серверов.

====================

Они, вроде бы, и сами не отрицают трудностей, связанных с объёмом базы.

neznaika,

Хм. А Вы предполагаете, что они содержат ещё одну копию базы специально для тестирования в локале? Может быть. Только объём подобной базы располагает к экономии. Тем более, что надо ещё и бэкап хранить такого же объёма, и кэш. Дешевле, пожалуй, потестировать выборку.

Мне пишут "перестаньте фантазировать" - но что в этой идее выходит за рамки здравого смысла? Неужели более логично предположить, что Яндекс работает вслепую? Изменили алгоритм, зажмурились и нажали на кнопку - нехай будет что будет, как получится - так и хорошо. Мне кажется, тут всё же есть над чем подумать.

Мне кажется, что следует обратить пристальное внимание на сказанное вскользь Садовским "ТИЦ - это показатель авторитетности ресурса". И придать этой фразе бюрократически точный, буквальный смысл. Возможно, именно в этом суть "новой политики".

Ведь нельзя же рассчитывать, что любой желающий, в самом деле, может стать "авторитетным" всего лишь путём "прогона" сайта по всем известным линкопомойкам за 3-4 часа работы на Оллсабмиттере. Или, если сам не умеет, то заплатив за такой "авторитет" аж целых 20-40 баков. Возможно, что стратегическиая линия сейчас - это постепенное отсечение "лёгких" путей добычи ТИЦ и превращение его в показатель реальной авторитетности ресурса.

Ведь положа руку на сердце - мы же сами вовсю издевались над ТИЦ, называя его не более чем "пузомеркой". Ну, а теперь, возможно, ТИЦ некоторое время поиздевается над нами. А потом, не исключено, - этот показатель будет действительно важной характеристикой сайта.

И при покупке морд не придётся первым делом лезть в беки:)

Trump,

А у меня ссылочное на том сайте, который прогонялся исключительно по белым каталогам, практически не срабатывало в течение 1,5 месяцев. +2-3 позиции на второй странице по СЧ - и всё. Хотя беков наросло за месяц +150, а запрос не чересчур конкурентный. Было странно, но сегодня я уже не удивился, что прирост ТИЦ составил ровно 0.

Впрочем, действительно, надо подождать хотя бы сутки с выводами.

Мои наблюдения в точности совпадают с высказанным LizaBEE.

Неприятно, но ожидаемо:(

После декабрьского "выстрела" по прямому линкообмену можно было предполагать и о других действиях, направленных на подавление накрутки ТИЦ. Второй мишенью, похоже, стали каталоги. Сейчас с третьей бы вовремя угадать.

Кстати, если сделать запрос "заплатить старые пени", то человеку, интересующемуся, как расплатиться с долгами, Яндекс расскажет, в первую очередь, про старые пни. Так что, сервис не больно-то хорош.

Хм.

А почему как бы само собой разумеется, что "люди так говорят" - так, как я проиллюстрировал? Люди так не говорят. Попытки говорить подобным образом строгие училки пресекают ещё в третьем классе и это крепко вбивается в подкорку на всю жизнь. К "падонкофскому" сленгу данные слова тоже не относятся. Кто-нибудь реально слышал, как ваши окружающие (или, хотя бы, подростки на улице) говорят про "сыроки", "грибоки" и "клубоки"? Лично я - нет.

Но можно проверить - насколько такие словоформы вообще распространены.

Поиск с точным соответствием запросу даёт количество страниц, на которых данные слова встречаются именно в приведённой мною форме:

===================

старые пени - страниц 37

сыроком - страниц 38

сыноки - страниц 32

осёлы - страниц 11

петушоки - страниц 2

счастливецем - 1 (и та с данной свежепроиндексированной темы)

===================

Это из числа тех словоформ, которые Яндекс не поправляет как ошибочные.

А из тех, что поправляет:

===================

клубоки - страниц 16

орёлы - страниц 27

===================

Разницы, в принципе, никакой. И страниц, как мы видим, негусто. То есть, никто так, действительно, не изъясняется. Но в то же время:

===================

"афтар" - страниц 592517

"арфаграфический славарь" - страниц 1 885

===================

Вот это уже социальное явление. Так люди реально говорят и пишут - и Яндекс с этим считается.

А то, о чём я писал - это псевдословоформы, в человеческой речи и на письме практически не встречающиеся. Однако, Яндекс их понимает как верные.

T.R.O.N,

Ваш пример - это исключение, сделанное для жаргона "падонкоф" как для социального явления. Это исключение специально оговорено Яндексом. А есть словоформы, которыми вообще практически никто не пользуется - наподобие "сыноков" и "дочеков". Но к "сынокам" у Яндекса отношение одно, а к "дочекам" ровно противоположное.

Собственно, я согласен с Вами в том, что 100% точности определения ошибок Яндекс пока не достиг. Возможно, он к этому стремится. Но смысл всего выступления был таков - на данный момент всерьёз исследовать аспекты "понимания" Яндексом морфологии - малоперспективное занятие. Потому что при таких исследованиях мы предполагаем, к примеру, что в русском языке 6 падежей, а Яндекс может располагать числом и поболее.

Всего: 559