Каширин,
:))
А звонившие Вам не рассказали - они там, в самом деле, тестируют что-нибудь? Или им пофиг. А если тестируют, то каким образом?
ultrabyte,
10х5х200=10000
Недотягивает до 43385, даже если не умножать на 10 или 20:)
И ведь это просто объём проиндексированной информации. А есть ещё и всякие необходимые дополнительные штуки вроде анкор-базы и пр.
Из известного интервью:
=======================
Рост вашей базы влияет на работу поискового движка?
Илья Сегалович: Влияет, тяжелее работать. Все очень пропорционально, чем больше база, тем труднее работать.
Успеваете апдейты делать?
Илья Сегалович: Успеваем, успеваем, успеваем. (задумчиво)
Михаил Ушаков: Кроме апдейтов, у нас еще идет технологическое обновление, то есть мы каждый день «кушаем» по 3 сервера: на завтрак обед и ужин.
Заменяете?
Михал Ушаков: Нет. Новые ставим. Сегодня в технопарке Яндекса около тысячи серверов.
====================
Они, вроде бы, и сами не отрицают трудностей, связанных с объёмом базы.
neznaika,
Хм. А Вы предполагаете, что они содержат ещё одну копию базы специально для тестирования в локале? Может быть. Только объём подобной базы располагает к экономии. Тем более, что надо ещё и бэкап хранить такого же объёма, и кэш. Дешевле, пожалуй, потестировать выборку.
Мне пишут "перестаньте фантазировать" - но что в этой идее выходит за рамки здравого смысла? Неужели более логично предположить, что Яндекс работает вслепую? Изменили алгоритм, зажмурились и нажали на кнопку - нехай будет что будет, как получится - так и хорошо. Мне кажется, тут всё же есть над чем подумать.
Мне кажется, что следует обратить пристальное внимание на сказанное вскользь Садовским "ТИЦ - это показатель авторитетности ресурса". И придать этой фразе бюрократически точный, буквальный смысл. Возможно, именно в этом суть "новой политики".
Ведь нельзя же рассчитывать, что любой желающий, в самом деле, может стать "авторитетным" всего лишь путём "прогона" сайта по всем известным линкопомойкам за 3-4 часа работы на Оллсабмиттере. Или, если сам не умеет, то заплатив за такой "авторитет" аж целых 20-40 баков. Возможно, что стратегическиая линия сейчас - это постепенное отсечение "лёгких" путей добычи ТИЦ и превращение его в показатель реальной авторитетности ресурса.
Ведь положа руку на сердце - мы же сами вовсю издевались над ТИЦ, называя его не более чем "пузомеркой". Ну, а теперь, возможно, ТИЦ некоторое время поиздевается над нами. А потом, не исключено, - этот показатель будет действительно важной характеристикой сайта.
И при покупке морд не придётся первым делом лезть в беки:)
Trump,
А у меня ссылочное на том сайте, который прогонялся исключительно по белым каталогам, практически не срабатывало в течение 1,5 месяцев. +2-3 позиции на второй странице по СЧ - и всё. Хотя беков наросло за месяц +150, а запрос не чересчур конкурентный. Было странно, но сегодня я уже не удивился, что прирост ТИЦ составил ровно 0.
Впрочем, действительно, надо подождать хотя бы сутки с выводами.
Мои наблюдения в точности совпадают с высказанным LizaBEE.
Неприятно, но ожидаемо:(
После декабрьского "выстрела" по прямому линкообмену можно было предполагать и о других действиях, направленных на подавление накрутки ТИЦ. Второй мишенью, похоже, стали каталоги. Сейчас с третьей бы вовремя угадать.
Кстати, если сделать запрос "заплатить старые пени", то человеку, интересующемуся, как расплатиться с долгами, Яндекс расскажет, в первую очередь, про старые пни. Так что, сервис не больно-то хорош.
Хм.
А почему как бы само собой разумеется, что "люди так говорят" - так, как я проиллюстрировал? Люди так не говорят. Попытки говорить подобным образом строгие училки пресекают ещё в третьем классе и это крепко вбивается в подкорку на всю жизнь. К "падонкофскому" сленгу данные слова тоже не относятся. Кто-нибудь реально слышал, как ваши окружающие (или, хотя бы, подростки на улице) говорят про "сыроки", "грибоки" и "клубоки"? Лично я - нет.
Но можно проверить - насколько такие словоформы вообще распространены.
Поиск с точным соответствием запросу даёт количество страниц, на которых данные слова встречаются именно в приведённой мною форме:
===================
старые пени - страниц 37
сыроком - страниц 38
сыноки - страниц 32
осёлы - страниц 11
петушоки - страниц 2
счастливецем - 1 (и та с данной свежепроиндексированной темы)
Это из числа тех словоформ, которые Яндекс не поправляет как ошибочные.
А из тех, что поправляет:
клубоки - страниц 16
орёлы - страниц 27
Разницы, в принципе, никакой. И страниц, как мы видим, негусто. То есть, никто так, действительно, не изъясняется. Но в то же время:
"афтар" - страниц 592517
"арфаграфический славарь" - страниц 1 885
Вот это уже социальное явление. Так люди реально говорят и пишут - и Яндекс с этим считается.
А то, о чём я писал - это псевдословоформы, в человеческой речи и на письме практически не встречающиеся. Однако, Яндекс их понимает как верные.
T.R.O.N,
Ваш пример - это исключение, сделанное для жаргона "падонкоф" как для социального явления. Это исключение специально оговорено Яндексом. А есть словоформы, которыми вообще практически никто не пользуется - наподобие "сыноков" и "дочеков". Но к "сынокам" у Яндекса отношение одно, а к "дочекам" ровно противоположное.
Собственно, я согласен с Вами в том, что 100% точности определения ошибок Яндекс пока не достиг. Возможно, он к этому стремится. Но смысл всего выступления был таков - на данный момент всерьёз исследовать аспекты "понимания" Яндексом морфологии - малоперспективное занятие. Потому что при таких исследованиях мы предполагаем, к примеру, что в русском языке 6 падежей, а Яндекс может располагать числом и поболее.