- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
и никакими метками не подразделяются на разные форматы?
Интересно будет ли бонусность у pdf документа даже если контент в нем неуникальный😕
Ну это уже вопрос логики создателей - на что они ориентируются. Если это поисковик для веб, то веб-страницы там - преимущественный и предпочтительный контент для выдачи:) а если поисковик по книгам - то возможно и PDF
В вопросе ТС зарыт интересный момент - возможно дублирование сайта в варианте PDF, и это будет плюсом в глазах поисковика
Логично предположить, что все проиндексированные данные хранятся в наипростейшем формате типа тхт (для быстроты обработки и т.п.), смысл тогда писать распарсенные пдф в другую базу?
Когда я занимался проектированием большого поисковика, исплоьзовалась следующая технология: Информация хранится в двух видах - индекс (двоичное дерево) и контент (выдернутый из исходного документа текст без мусора). Насколько я знаю, принципиально новых технологий не появилось, разве что в ПС контент хранится не всегда
Яндекс может использовать отдельные сервера для хранения .doc .pdf и так далее. А вот будут ли одинаковые данные с одного сайта в разных форматах в выдаче по одному запросу? А если не будут, что ПС предпочтёт выдать стандартную страницу или прикреплённый документ?
Яндекс может использовать отдельные сервера для хранения .doc .pdf и так далее.
Откуда у яндекса столько серверов, да и зачем их хранить отдельно, а затем тратить дополнительные ресурсы на запросы к нескольким базам?
В вопросе ТС зарыт интересный момент - возможно дублирование сайта в варианте PDF, и это будет плюсом в глазах поисковика
момент действительно интересный. Навеян недавним бумом с продажей контента в форматах gif tif и пр.
Откуда у яндекса столько серверов, да и зачем их хранить отдельно, а затем тратить дополнительные ресурсы на запросы к нескольким базам?
Ну может один сервер. Серверов у него достаточно. А отдельно, так как эти документы в отличии от обычной страницы не требуют переиндексации. Если меняется содержимое, то меняется и название документа. Поэтому можно резервировать.
а мне вот иртересен слудующий вопрос для тех, кто знает точно.
Отдают ли предпочтения поисковые системы Html формату или например PDF формату. То есть Если хранить некоторые статьи в формате PDF - сайт в глазах поисковика падать будет или нет ? Или таки всё равно, что HTML, что PDF - для поисковиков без разницы
Ну может один сервер. Серверов у него достаточно. А отдельно, так как эти документы в отличии от обычной страницы не требуют переиндексации. Если меняется содержимое, то меняется и название документа. Поэтому можно резервировать.
Совершенно не показатель. Например, на половине сайтов, что-то продающих, лежит файл price.xls... Думаете, тоже статичный? :) Контрольную сумму сверять - логично. но это и для обычных страниц можно делать, так что совершенно не обязательно "выносить"
Интересует другой вопрос - а учитывают ли ПС ссылки из документов, отличных от html? ☝
Совершенно не показатель. Например, на половине сайтов, что-то продающих, лежит файл price.xls... Думаете, тоже статичный? :) Контрольную сумму сверять - логично. но это и для обычных страниц можно делать, так что совершенно не обязательно "выносить"
Интересует другой вопрос - а учитывают ли ПС ссылки из документов, отличных от html? ☝
По этому поводу недавно статью читал на каком-то блоге. Проводили эксперимент. Учитываются ли ссылки из PDF документов. Результат был однозначный - НЕТ. Хотя, глядя на многие пдфки с кучей ссылок внизу, думается, что возможно у людей есть другие сведения по этому поводу.