- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
модификатор u "#москв\w#"ui и файл должен быть в utf-8
---------- Добавлено 14.12.2016 в 00:54 ----------
А вообще есть куча либ чтобы привести слово к базовой форме. Тот же phpmorphy
Вау!!! Это работает! Спасибо огромное.
Прикрутил Москву
А за Москвой и всё само прикрутилось
А вообще есть куча либ чтобы привести слово к базовой форме. Тот же phpmorphy
Нет никакого смысла приводить к базовой форме. Достаточно просто находить дистанцию между словами. Например: Между "Москва" и "Москве" дистанция 1 символ: "а" меняется на "е". Между "Москва" и "Моксва" - 2 символа. Предварительно, можно сделать фонетический разбор слова, есть множество алгоритмов, но не все они подходят под русский, если вкратце, то пропущенное через функцию фонетического разбора слово "Ростов-на-Дону" будет выглядеть где-то так: РСТВНДН, и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны, а если и слово не меняется - значит расстояние между двумя словами будет равно 0 - а это значит точное попадание. Это конечно лучше чем милторговские алгоритмы, но не идеально ввиду того, что если слово напишут "Ростов на дону" (вместо тире - пробелы), то регулярка по тире может не сработать, ну и ещё по мелким косячкам, которые сработают: например город "Обь" и слово "об" пропущенные через функцию фонетического разбора будут выглядеть как "б", что является полным совпадением с точки зрения дистанции между словами.
Я как-то раз писал алгоритм, который учитывал ошибки пользователей в поисковых запросах. Удобно, с учетом автодополнения и автозамены при подтверждении.
Нет никакого смысла приводить к базовой форме. Достаточно просто находить дистанцию между словами. Например: Между "Москва" и "Москве" дистанция 1 символ: "а" меняется на "е". Между "Москва" и "Моксва" - 2 символа. Предварительно, можно сделать фонетический разбор слова, есть множество алгоритмов, но не все они подходят под русский, если вкратце, то пропущенное через функцию фонетического разбора слово "Ростов-на-Дону" будет выглядеть где-то так: РСТВНДН, и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны, а если и слово не меняется - значит расстояние между двумя словами будет равно 0 - а это значит точное попадание. Это конечно лучше чем милторговские алгоритмы, но не идеально ввиду того, что если слово напишут "Ростов на дону" (вместо тире - пробелы), то регулярка по тире может не сработать, ну и ещё по мелким косячкам, которые сработают: например город "Обь" и слово "об" пропущенные через функцию фонетического разбора будут выглядеть как "б", что является полным совпадением с точки зрения дистанции между словами.
Я как-то раз писал алгоритм, который учитывал ошибки пользователей в поисковых запросах. Удобно, с учетом автодополнения и автозамены при подтверждении.
Вы слов-постановки задачи написали в 5 раз больше чем рабочая программа которую я написал
И если бы не u - всё бы было готово за час
Кстати. Ростов на Дону через пробелы - у меня работает
---------- Добавлено 14.12.2016 в 02:10 ----------
Вообще. Давным давно. В 2003 году я написал Антиматерильник. Вот то была интересная штука. Надо его найти
---------- Добавлено 14.12.2016 в 03:00 ----------
Нашёл. Вот он:
http://chajnik.ru/antimat
Вот что выдает вместо мата:
бери мой писюль, кончик писюлька
и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны
Далеко не все слова и названия городов с выкинутыми гласными будут одинаковы в склонениях.
Химки — в Химках
Жуковский — в Жуковском
Набережные Челны — в Набережных Челнах
что если слово напишут "Ростов на дону"
Да, и "Набережные Челны" пишутся именно через пробел, а не через дефис, и это не единственный такой город :)
Он представил рабочий код,
Серьёзно?🍿
Хотя разве что для 1еуро/час в Мыколайках такое пойдёт.
Далеко не все слова и названия городов с выкинутыми гласными будут одинаковы в склонениях.
Да, но дистанция в 1-3 символ - не много. Можно считать, что это искомое слово. Хотя, конечно, нужно брать контекст. Тут все зависит от фонетического разбора: чем он точнее разбирает произношение слов, тем ниже ошибка. Можно звонкие на глухие менять, и гласные не убирать, тогда точность высится. В любом случае, это более точный алгоритм, чем доверится на правильное написание города пользователем.
Вообще интересная темка, я давно хотел написать кое-какую штуку на эту тему: что-то вроде мини-поисковой системы, которая бы оценивала релевантность слова. Но пока руки не доходят, и не уверен что доведу до конца.
P.S. [umka], ваш ник ломает систему быстрого цитирования :)