- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Интересно, как Яндекс определяет схожесть контента? Если текст содран один в один, то тут все ясно. А вот например если переставить абзацы местами? По доходчивость текста для пользователя пока молчим, интересут только определение Яндексом.
Или например есть срезанная с другого сайта страница-каталог с 5 товарами, у каждого товара несколько характеристик. Будет ли для Я страницы являться оригинальной если переставить местами товары, да еще в каждом товаре поменять местами характеристики?
Или же вообще идет сравнение по словам, но тогда возникает вопрос о процентном соотношении оригинального контента к неоригинальному.
У кого какие соображения по этому поводу?
Ищите по слову "шинглы".
Ищите по слову "шинглы".
И в чем фикус?
Интересно, как Яндекс определяет схожесть контента? Если текст содран один в один, то тут все ясно. А вот например если переставить абзацы местами? По доходчивость текста для пользователя пока молчим, интересут только определение Яндексом.
Или например есть срезанная с другого сайта страница-каталог с 5 товарами, у каждого товара несколько характеристик. Будет ли для Я страницы являться оригинальной если переставить местами товары, да еще в каждом товаре поменять местами характеристики?
Или же вообще идет сравнение по словам, но тогда возникает вопрос о процентном соотношении оригинального контента к неоригинальному.
У кого какие соображения по этому поводу?
По поводу Яндекса не знаю, но знаю о существовании ресурса который проверяет уникальность контента. Ссылку сейчас поискал, но что-то не могу найти, если найду выложу. Но вобщем сервис известный.
Возможно Яндекс юзает что-то похожее..
И в чем фикус?
Фикус в том, что принцип распознавания дублей в Яндексе описан самим Сегаловичем.
который проверяет уникальность контента. Ссылку сейчас поискал, но что-то не могу найти, если найду выложу. Но вобщем сервис известный.
antiplagiat.ru
copyspace.com
http://company.yandex.ru/articles/article10.html (середина статьи, подзаголовок "Качество индекса")
Интересно, как Яндекс определяет схожесть контента
Почитайте про шинглы, но не факт что это единственный алгоритм...
Интересно, как Яндекс определяет схожесть контента? Если текст содран один в один, то тут все ясно. А вот например если переставить абзацы местами? По доходчивость текста для пользователя пока молчим, интересут только определение Яндексом.
Или например есть срезанная с другого сайта страница-каталог с 5 товарами, у каждого товара несколько характеристик. Будет ли для Я страницы являться оригинальной если переставить местами товары, да еще в каждом товаре поменять местами характеристики?
Или же вообще идет сравнение по словам, но тогда возникает вопрос о процентном соотношении оригинального контента к неоригинальному.
У кого какие соображения по этому поводу?
Всё очень просто он считает контрольную сумму, у одно и того же тектса контрольная сумма будет одна и таже.
допустим слово привет п-7 р-8 и-9 э-10 т-11 сумма равна 35 допустим. Если буквы поменять, то контрольная сумма останеться той же.
Каждая буква имеет код ANSI ||.
Можно подсчитывать контрольную сумму абзацами и так далее, но я думаю в яндексе как то подругому. Потому что был опыт эксперимента, когда берёшь текст большими частями и ставишь на страницы яндекс их не клеит и не банит.
А когда делал сайты с полностью похожими страницами через 3 недели пришёл робот зеркальщик и все сайты пропали.
Всё очень просто он считает контрольную сумму, у одно и того же тектса контрольная сумма будет одна и таже.
допустим слово привет п-7 р-8 и-9 э-10 т-11 сумма равна 35 допустим. Если буквы поменять, то контрольная сумма останеться той же.
Каждая буква имеет код ANSI ||.
и он считает контрольную сумму для каждого слова из текста? ИМХО, не в ту степь.
Лично я когда полностью заимствую текст меняю знаки припинания, по логике с контрольной суммой (шинглом) это должно прокатывать.
В php и mysql есть функции определения "похожести" английского текста или похожести его звучания, как они работают не знаю (в исходники не заглядывал), но может быть взяты похожие алгоритмы.