porh

porh
Рейтинг
183
Регистрация
14.06.2006
garik77:
Вот здесь тема есть, почитайте

Почитал, спасибо.

Если еще подробнее, есть результат работы парсера текстов в интернете по ключу. Спаршенные тексты находятся в одном файле. Парсер фильтрует дубли текстов по доменам, но пропускает, если они находились на разных сайтах. Нужно подсветить эти дубли, возможно, нечеткие.

Если подробнее, нужно подсветить похожие куски внутри текста. Поиск по шинглам нужен, видимо. Количество символов в тексте более 200к.

kxk:


ТС и так спалился, куда уже сильнее.
Всякие доски объявлений нужно регистрировать или на дикий оффшор из Деллавера оформленный на алкаша из деревни или на просто левые данные и уж тем более не палить что Вы хозяин в соц сетях.

Услугу прогона по доскам народ перестал предлагать?

Разместить объявление еще на 100 досках

foxi:
тоже хз зачем покупать биткоин, чтоб купить за них цветы )))

Цветы разные бывают...

А разве криптовалюты не для даркнета придумали?

miltorg:

А в чём там идея?

Да простая фигня.

Надо спарсить весь интернет (с исходным кодом), и потом искать страницы по куску кода.

Ранжировать ничего не нужно.

miltorg, Обычный поисковик всякий может сделать. Сделай поисковик по исходному коду, типа Publicwww.

horizont:
Куча сложноподчинённых слов

Это еще что такое 😂

Всего: 856