Создайте страницы с кодом ответа 200. Скиньте примеры страниц через форму обратной связи - Сервисы и программы для работы с SE

178

рецидивист

12 декабря 2021, 12:41

#31

chaser #:
По шинглам

Наверное, не так выразил мысль. Программа открывает страницы и получает HTML-код. Дальше что происходит? Она сравнивает по шинглам HTML со всеми тегами? Она выбирает все слова внутри тегов, исключая сами теги? Она берет текст из каких-то определенных тегов, может быть, и из атрибутов, к примеру, изображений? Она берет куски текста объемом больше Х слов, склеивает их и проверяет? Или как? Какой у нее алгоритм выбора данных со страницы для сравнения?

Правильное использование noindex Liex - Автоматическое Продвижение "Сниппет" для яндекса и

217

chaser

12 декабря 2021, 19:41

#32

рецидивист #:

Наверное, не так выразил мысль. Программа открывает страницы и получает HTML-код. Дальше что происходит? Она сравнивает по шинглам HTML со всеми тегами? Она выбирает все слова внутри тегов, исключая сами теги? Она берет текст из каких-то определенных тегов, может быть, и из атрибутов, к примеру, изображений? Она берет куски текста объемом больше Х слов, склеивает их и проверяет? Или как? Какой у нее алгоритм выбора данных со страницы для сравнения?

HTML не используется, он отсекается.

Берется полный текст страницы, либо "значимый" контент (определяется алгоритмически). Затем контент сравнивается между собой.

Текст из изображений и мета-тегов не используется.

SiteAnalyzer ( https://site-analyzer.ru/ ) - аналог Screaming Frog | Majento ( https://majento.ru/index.php?page=seo-analize ) - 70+ бесплатных сервисов SEO-аналитики

322

Shlackbaum

15 января 2022, 09:50

#33

chaser :
Будем рады любым отзывам и пожеланиям по работе программы.

Спасибо за софтину.

Не хватает настроек экспорта.

В частности хотелось бы иметь возможность получить в одной Excel'ке список из неуникальных групп.

Где первым URL идет исследуемый, а следующие за ним - это его дубли начиная от наидублейшего :)

Можно ограничить количеством или (лучше) гибкой настройкой "Насколько должны быть неуникален URL группы от "главного" URL группы, чтобы попадать в группу"

Наступит проблема, когда по сути одни и те же URL будут попадать в различные группы, да и просто разные URL будут вершинами разных групп и ее тоже хорошо бы решить, но пока я не придумал как.

Но простая выгрузка в вышеописанном формате - уже шаг.

Спасибо

Пустота. Какого черта здесь появляется чья-то реклама?

Единые параметры URL Как лучше ставить ссылки Дубли страниц

217

chaser

17 января 2022, 20:37

#34

Shlackbaum #:

Спасибо за софтину.

Не хватает настроек экспорта.

В частности хотелось бы иметь возможность получить в одной Excel'ке список из неуникальных групп.

Где первым URL идет исследуемый, а следующие за ним - это его дубли начиная от наидублейшего :)

Можно ограничить количеством или (лучше) гибкой настройкой "Насколько должны быть неуникален URL группы от "главного" URL группы, чтобы попадать в группу"

Наступит проблема, когда по сути одни и те же URL будут попадать в различные группы, да и просто разные URL будут вершинами разных групп и ее тоже хорошо бы решить, но пока я не придумал как.

Но простая выгрузка в вышеописанном формате - уже шаг.

Спасибо

Возможно позже реализуем в SiteAnalyzer'e, записал в ТУДУ лист.

TO

76

TEJlO

28 марта 2022, 10:39

#35

Спасибо за софт. Образовалась проблема

Что делать?

217

chaser

28 марта 2022, 10:55

#36

TEJlO #:

Спасибо за софт. Образовалась проблема

Что делать?

Не включать страницы с редиректами )

TO

76

TEJlO

28 марта 2022, 11:46

#37

chaser #:
Не включать страницы с редиректами )

Все страницы с кодом ответа 200 :-)

217

chaser

28 марта 2022, 14:21

#38

TEJlO #:

Все страницы с кодом ответа 200 :-)

Скиньте примеры страниц через форму обратной связи, явно не так чтото

170

Skf

9 января 2023, 23:51

#39

Странно 2 урла сравнивает, будто контент не увидела программа. Как победить? Настройки никакие не менял при запуске

>>>>>>>>>>>>>>>> Массовая проверка Яндекс.ИКС [Бесплатно]: https://searchengines.guru/ru/forum/1071333 <<<<<<<<<<<<<<<<

217

chaser

10 января 2023, 12:02

#40

Skf #:

Странно 2 урла сравнивает, будто контент не увидела программа. Как победить? Настройки никакие не менял при запуске

Скорее всего сайт на яваскрипте, программа же рендерить JS пока не умеет, поэтому и контента так мало.

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Все что нужно знать о DDоS-атаках грамотному менеджеру

BatchUniqueChecker - Массовая проверка уникальности URL между собой