Почитал, спасибо.
Если еще подробнее, есть результат работы парсера текстов в интернете по ключу. Спаршенные тексты находятся в одном файле. Парсер фильтрует дубли текстов по доменам, но пропускает, если они находились на разных сайтах. Нужно подсветить эти дубли, возможно, нечеткие.
Если подробнее, нужно подсветить похожие куски внутри текста. Поиск по шинглам нужен, видимо. Количество символов в тексте более 200к.
Услугу прогона по доскам народ перестал предлагать?
Разместить объявление еще на 100 досках
Цветы разные бывают...
А разве криптовалюты не для даркнета придумали?
Да простая фигня.
Надо спарсить весь интернет (с исходным кодом), и потом искать страницы по куску кода.
Ранжировать ничего не нужно.
miltorg, Обычный поисковик всякий может сделать. Сделай поисковик по исходному коду, типа Publicwww.
KeyWordKeeper
Это еще что такое 😂