- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
По моим тестам пока попадает много "лишних" слов, за которые нельзя зацепить рекламу, плюс попадают непрезентативные слова из меню, верхней или нижней шапки.
Я бы согласился со списком, если бы ты на ходу определял тип страницы и давил лишние ключевые слова для страниц рубрик, например, так:
1) навигационные страницы - разделы, рубрики, теги на сайте
Не важен контент (аннотации документов), важны тексты ссылок разделов и элементы навигации
2) информационные страницы - полный текст страницы с информацией
Не важны элементы навигации, только уникальный текст
3) транзакционные страницы
Важны и элементы навигации, и уникальный текст
У тебя же есть поисковый индекс со взвешенными термами, почему не пробить его по коллекции документов и не взять ранк по каждому ключевому слову? И качать ничего не надо.
По моим тестам пока попадает много "лишних" слов...
...
Не важны элементы навигации, только уникальный текст
...
У тебя же есть поисковый индекс со взвешенными термами, почему не пробить его по коллекции документов и не взять ранк по каждому ключевому слову? И качать ничего не надо.
Да, полностью согласен, но мы приходим к той же проблеме, что и была озвучена ранее. Надо выкачивать некоторую окрестность страницы, чтобы сличить их "на просвет" (не менее 3-5), и их надо еще найти.
А в индексе у нас и вправду есть данные о разментке, о навигационной разметке в том числе, но - вот беда - только для украинских сайтов.
Слава, "сервис" - это вторично. На самом деле это удобный способ тестировать те алгоритмы, над которыми я сейчас работаю.
🍻
Очень интересно было бы на исходники поглядеть, так как балуюсь подобным ;)
"По моему разумению" - а немного подробнее можно узнать? Какие части речи отсекаются и т.д.
Как считается вероятность смысловой связи между словами?
Потому как результаты выдает отличные для словосочетаний.
И сейчас результаты приятно удивляют :)
С другой стороны, мысленно обобщить по десятку обработанных страниц тематику сайта достаточно просто.
Именно. И баловатся эвристиками для отбрасывания "незначимого" текста на странице намного сложнее, чем сравнить "на просвет" десяток страниц с сайта...
Респект. 🍻
а помоему отличный сервис !
Занятный сервис, натравил его на свой сайт, он мне ни одного ключевика на моей странице не нашел. Хотя другие плюются от переизбытка ключевиков.
А у меня по двум сайтам тема странно определилась. По сайту про работу - Недвижимость пишет; по порталу по коммерческой недвижимости - Супермаркеты. По второму ещё понятно, а вот по первому крайне удивлена...
А у меня по двум сайтам тема странно определилась. По сайту про работу - Недвижимость пишет; по порталу по коммерческой недвижимости - Супермаркеты. По второму ещё понятно, а вот по первому крайне удивлена...
А дайте ссылочку. Можно в личку. Будем крутить и улучшать :)
Подвесил определение тематики вместо cgi-приложения - демоном.
а можно, используя эту тему, избавиться от блоков меню, оставляя чистый текст в виде больших абзацев?
когда чищу хтмл - порой, менюшки выстраиваются в одно предложение и участвуют в анализе содержимого и определения ключевых слов, это очень сильно мешает в ранжировании предложений и абзацев.
а можно, используя эту тему, избавиться от блоков меню, оставляя чистый текст в виде больших абзацев?
А для этого надо делать несколько "срезов" с сайта - "соседние" страницы брать и потом общие части удалять....