Есть ли возможность указать зеркало сайта в Topvisor при на новый домен?
Все обыскал и не нашел (
это жесть же, он так все mitm атаки пропустит.
Каспер также своим сертификатом у всех сайтов подменяет.Видимо так надежнее.
https://t.me/SEOKommercheskost_bot
Попробуйте так
Спасибо за софтину.
Не хватает настроек экспорта.
В частности хотелось бы иметь возможность получить в одной Excel'ке список из неуникальных групп.
Где первым URL идет исследуемый, а следующие за ним - это его дубли начиная от наидублейшего :)
Можно ограничить количеством или (лучше) гибкой настройкой "Насколько должны быть неуникален URL группы от "главного" URL группы, чтобы попадать в группу"
Наступит проблема, когда по сути одни и те же URL будут попадать в различные группы, да и просто разные URL будут вершинами разных групп и ее тоже хорошо бы решить, но пока я не придумал как.
Но простая выгрузка в вышеописанном формате - уже шаг.
Спасибо
Наверное, не так выразил мысль. Программа открывает страницы и получает HTML-код. Дальше что происходит? Она сравнивает по шинглам HTML со всеми тегами? Она выбирает все слова внутри тегов, исключая сами теги? Она берет текст из каких-то определенных тегов, может быть, и из атрибутов, к примеру, изображений? Она берет куски текста объемом больше Х слов, склеивает их и проверяет? Или как? Какой у нее алгоритм выбора данных со страницы для сравнения?
HTML не используется, он отсекается.
Берется полный текст страницы, либо "значимый" контент (определяется алгоритмически). Затем контент сравнивается между собой.
Текст из изображений и мета-тегов не используется.
Представляем вашему вниманию новую версию бесплатной программы BatchUniqueChecker, предназначенной для массовой проверки уникальности контента нескольких страниц между собой по списку URL, карте сайта Sitemap или локальным HTML-файлам.
Что нового в версии 1.4:
Не оптимально в сравнении в KeyAssort или не оптимально вообще?
У нас два варианта Hard-кластеризации, второй на большом количестве запросов работает медленно.
Но можно пользоваться и первым вполне.