- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Обычно предложения начинаются с большой буквы а заканчиваются точкой.
Я сделал по "деревенски" - вычислил координаты в тексте запрашиваемых слов, отсчитал от каждого 20 символов назад и вперед и этот текст вывел в качестве "цитаты". На большее ума не хватило :)
Я сделал по "деревенски" - вычислил координаты в тексте запрашиваемых слов, отсчитал от каждого 20 символов назад и вперед и этот текст вывел в качестве "цитаты". На большее ума не хватило
по-моему очень грамотно :)
На чем реализована штука? на Перле чтоли? Или написал полноценную на С или С++ ? Кстати, кто читал Kevin Hemenway, Tara Clishain "Spidering Hacks"
Таки надо ИМХО при такой реализации держать весь словарь в памяти (ну или все слова с частотой появления > 0.0...). Хотя, с другой стороны, сейчас это абсолютно не проблема.
Единственное, что я не понял, как наличие прямого индекса может сократить размер обратного индекса и как на это влияет размер базы?
Теперь по реализации.
Я обычно реализую это через т. н. "плоский индекс" - через образы документов, где каждое слово представлено 4-байтным идентификатором. При вычислении запроса с учетом координат слов запоминаю несколько самых релевантных фрагментов, строю битмапу для цитирования и, адресуя этот образ индексами слов, строю цитату. Вхождения, соответственно, все подсвечиваю.
Кстати, использование такого плоского индекса на небольших объемах - не более пары миллионов урлов - может, как ни странно, при переорганизации алгоритма сократить объем обратного индекса.