- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
есть опыт, вылетают из индексации странички с краденым контентом, что сильно влияет на позиции, не в лучшую сторону.
какой процент должен быть чужого текста на сайте
Brucekiev, не стоит забивать себе этим голову. Нет такого процента, т.к. ПС используют множество методов определения уникальности текста, следовательно, и уникальность не измеряется лишь процентным соотношением "чужого текста".
Brucekiev, не стоит забивать себе этим голову. Нет такого процента, т.к. ПС используют множество методов определения уникальности текста, следовательно, и уникальность не измеряется лишь процентным соотношением "чужого текста".
Не согласен. Вопрос важен.
Используется метод кластеризации точных копий по контрольной сумме. Документ сравнивается с размером страницы. Но процентное соотношение не главное. Вот в чём дело. Поэтому не нужно думать о проценте плагиата для попадания в бан.
Документ делится на части, среди них идёт поиск дублей. Они маркируются для повторного просмотра. Далее используются сортировочный подход, сортирование и нахождение подобий и вероятностный подсчет. Вероятность дублирования, основывается на маркерах в документах разных видов.
Так же всё это прогоняется по нескольким ступеням.
Сначала проверяется взаимосвязь контента и структуры. Потом находится эквивалентный контент.
Потом ищется просто похожий контент. Потом - частичное структурное соответствие уже внутри похожего контента. Потом однотематический контент проверяется.
Механизм наказания может быть до смеха простым. Бот, который нашёл на вашем сайте дубли просто к вам не пойдёт. Или будет ходить не часто, или не глубоко.
Полный бан заработать достаточно трудно. Клоакинг чужого контента, нарушение DMCA, или другие смертные грехи.
Но не забивайте себе голову процентами. Для молодого сайта достаточно снизить его вес в глазах роботов, чтобы он стал практически забаненым. Просто не берите чужого. :)
Не согласен. Вопрос важен.
Где же Вы увидели, что вопрос не важен?
Я про выискивание процентов "чужого текста" писал.