- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
На сайте Яндекса говорится:
"В поиске Яндекса сегодня
сайтов: 2 220 989,
веб-страниц: 748 238 349,
объем проиндексированной
информации: 19 119 ГБ"
Какие типы файлов учтены в этих 19Гб? Понятно, что учитываются html/xml, doc, ppt, xls, pdf, txt. Какие еще форматы учитываются? Учитываются ли графические файлы?
kudesnik, учитывается всё, что проиндексировано и отдает 200 роботу (расширение не важно).
И это не 19 Гб, а 19 Тб :)
Да, конечно, именно 19Тб - я описался.
FlyAway
А какие именно типы индексируется яндексом - я знаю это html/xml,txt, MSOffice formats, pdf? Какие еще? Может есть какая-нибудь ссылка от яндекса насчет этого?
Потом, индексируются ли граф.изображения? mp3 файлы?
kudesnik, много, например php, phtml, да пофиг как назвать лишь бы 200 отдавалось сервером;)
Какие типы файлов учтены в этих 19Гб? Понятно, что учитываются html/xml, doc, ppt, xls, pdf, txt. Какие еще форматы учитываются? Учитываются ли графические файлы?
Если я правильно понимаю вопрос - 19Тб это сумма объемов "сохраненных копий". А сохраненные копии - это исключительно текст.
kudesnik, много, например php, phtml, да пофиг как назвать лишь бы 200 отдавалось сервером;)
Т.е. граф.изображения (gif, jpg, etc.) учитываются в суммарном объеме? (картинки же тоже отдаются сервером по 200 ...)
Вообщем, я сомневаюсь что это критерий ...
Переформулирую вопрос :)
Вот возьмем страницу: http://company.yandex.ru/news/2004/1216/
Яндекс в выдаче говорит что ее размер - 8Кб и действительно размер html-кода 8,17Кб.
На этой странице два гиф-файла с суммарным объемом 1,76Кб.
И мой вопрос такой: данная страница в базе яндекса (которая размером 19Тб) посчитана как 8Кб или как 10Кб?
kudesnik, как 10 Кб, база-то одна
да хватит им места на дисках :)
да хватит им места на дисках :)
А если не хватит, то потрут 80% и никто ничего не потеряет 😂