- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
это доказывает только, что у нас разные расчеты
Если верить статьям самого яндекса, то для определения дублей они используют шинглы и тот факт, что уже имеется некоторая инвертированная база текстов. Я уже представлял на форуме пример работы этого алгоритма (см. тут).
Хых, от фонаря ввел два только что придуманных текста:
1. В пионерском лагере мы делали зарядку а после завтрака у нас было построение на пионерскую линейку
2. В нашем пионерском лагере проводились пионерские линейки, а по утрам нас выводили на утреннюю зарядку
Результат: "Тексты разные. Сходства нет. Рерайтинг очень хороший!"
Честно говоря, результат у меня вызывает сомнения... Врядли от перестановки местами слов текст будет считаться уникальным. (замечу, что мое мнение голословно, специальных экспериментов я не проводил, но сам работаю только с уникальными текстами написанными с нуля руками)
A_Liss,
Схожесть: 20.00%
A_Liss,
Схожесть: 20.00%
А где это посмотреть можно? Чет не увидел где схожесть в %-ах определяется
А где это посмотреть можно? Чет не увидел где схожесть в %-ах определяется
Это я посчитал, там схожесть 0.
А, понятно :)
Пасиб
Врядли от перестановки местами слов текст будет считаться уникальным.
По большому счету тексты отличаются один от другого составом слов и их расположением. Если считать, что положение слов в тексте не влияет на уникальность, то это будет другая концепция, отличная от концепции, основанной на шинглах. Конечное решение какой концепции доверять - дело каждого.
По большому счету тексты отличаются один от другого составом слов и их расположением. Если считать, что положение слов в тексте не влияет на уникальность, то это будет другая концепция, отличная от концепции, основанной на шинглах. Конечное решение какой концепции доверять - дело каждого.
Т.е., у Вас такой "подход" к этой проблеме?😆
Продолжайте в том духе.;)
Добавил еще один показатель сходства текстов на основе расстояния Левенштейна - попарное сравнение и пакетное сравнение
Добавил еще один показатель сходства текстов на основе расстояния Левенштейна - попарное сравнение и пакетное сравнение
Хорошая идея! Даже если поисковики используют другие технологии, эта должна давать неплохое ориентировочное ощущение качества рерайта.
А вы в расстоянии Левенштейна за единицу изменяемой величины используете букву или слово? Потому что при сравнении полного текста, при учете возможной синонимизации логичнее было бы использовать слово в качестве неделимого элемента.