- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В самом ли деле нет альтернативы "инвертированным файлам" как способу организации индекса для SE?
Или - другими словами - нет ли каких-то специфических "поисковых потребностей" для обслуживания которых "инвертированные файлы" вовсе не являются бесспорным лидером?
И - все ли SE используют "инвертированные файлы" в качестве индексов?
Еще вопрос.
Вообще говоря, имея в своем распоряжении инвертированный файл, - можно ВОССТАНОВИТЬ исходный файл ... (правда, наверное, в нем будут потеряны мелкие детали, - типа заглавных букв!)
Однако, - правильно ли я понимаю, - что SE так не делают, но - хранят "у себя" наряду с инвертированными файлами также весь проиндексированный контент в виде "обычных" (не-инвертированных) файлов?
Нет, широко используются и сигнатурные файлы, в которых применяются так называемые n-граммы, которые затем каким-то образом хешируются и формируют сигнатуру слов.
Более подробно можно почитать здесь.
Вот и спросите у разработчиков. ;) Насколько я знаю, большинство поисковиков используют.
По инвертированному файлу можно получить только некие координаты каждого слова в текста, сам по себе восстанавливать он ничего не позволяет.
Контент, из которого получаются сниппеты с подсвеченными ключевыми словами, обычно хранится в специальном хранилище, которое и адресуется координатами из инвертированных файлов.
тихо..шопотом ... а что такое инвертированные файлы ?
Справочная
еще тише .... прочитал ... а как это с оптимизацией вяжется ?
"C оптимизацией вяжется" посредством SE.
... сигнатурные файлы, в которых применяются так называемые n-граммы, которые затем каким-то образом хешируются и формируют сигнатуру слов.
Более подробно можно почитать здесь.
- а по-русски ничего не поркомендуете ... про "сигнатурные файлы"?
И потом, инвертированный файл - он ведь индексирует не СЛОВАРЬ, а КОНТЕНТ ... а то, что Вы наприсали про "сигнатурные файлы", - относится, вроде как, к СЛОВАРЮ, а не к КОНТЕНТУ!
- что значит "некие"? Координаты они и есть координаты ... А если "расставить" слова в соответсвии с указанными координатами, - разве не "востановится" исходный контент???
greenwood, хорош флеймить. С оптимизацией это никак не вяжется, раздел так и называется - "Поисковые технологии".
К инвертированному файлу всегда идет словарь. Лексикон называется.
Координаты могут быть разными. В индексе могут храниться, как только номера документов, так и позиции слов в тексте, так и смещения позиций друг от друга.
А если "расставить" слова в соответсвии с указанными координатами, - разве не "востановится" исходный контент???
Нет. Контент хранится блоками, координаты адресуют позиции слов в каждом блоке.
К сожалению, ничего. Такие вещи предпочитаю читать в оригинале. :)
И Вам советую.