- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Просто надо ещё раз прочитать стартпост
Если настаиваите на буквальном понимании ТС,
Как удалить строки различающиеся по одному символу?
да ключи перебираю, встречаются такие строки, например -
stupid face wallpaper
stupid faces wallpaper
То просто взять то, что короче🤣 И, опять Левенштейн с носом.
просто взять то, что короче
ОК, что короче:
stupid face wallpaper
или
abrakadabra
stupid face wallpaper
или
abrakadabra
И ничего практически не получить. Вместо abrakadabra ведь может быть все что угодно
И это предлагается вместо простого, проверенного решения - лемма/стем, сортировка. Дающего, еще и кучу ништяков.
Для пыха варианты в 15-20 строк : стемер(отдельно строки считаются), выполнить внешнюю программу mystem там или еще чего. Внешние сервисы лемматизации.
Да-да, а потом окажется, что при выборке "wanna on bitch" и "wanna on beatch", при разнице всего в пару букв, фразы имеют слишком разное значение и не могут быть исключены из списка сравнения )) А еще, поскольку мы сравниваем все же ключи и разные комбинации при одинаковой лемме могут быть важны, то как откидывать? Например, при сравнении "смотреть из окна" и "смотреть в окно" - лемма будет идентична, поскольку, обычно, междометия, частицы, местоимения и т.д. откидываются для упрощения. Проверить, кстати, проще простого. Вбиваем в яшу "смотреть в окно" и "смотреть в окна" и получаем разную выдачу, хотя лемма одинакова, да и разница всего в эту самую 1 букву, даже откидывать ничего не нужно. Получается, что ни морфология, ни простой перебор в лоб - не помогут в данной задаче.
"wanna on bitch" и "wanna on beatch",
Метод основанный на морфологии - все нормально. Что не удивительно
"смотреть в окно" и "смотреть в окна" и получаем разную выдачу, хотя лемма одинакова, да и разница всего в эту самую 1 букву, даже откидывать ничего не нужно.
Просто посложней анализ, но есть методы.
Просто посложней анализ
О чем и было сказано еще на первой странице, что задача простая только на первый взгляд и потребует более сложных решений.