- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Есть у кого-нибудь какие либо предположения или знания относительно того как яндекс различает оригинальные тексты и плагиат? Т.е. есть ли строгое разделение: такая-то страничка оригинальная, а такая-то тыренная (по яндексу)? Или же яндекс как-то различает степень оригинальности? Т.е. может ли яндекс думать: этот текст на 50% уникальный? И еще считает ли яндекс за оригинальный текст, который когда-то действительно появился на данном сайте впервые в рунете, но потом был растиражирован на сотню сайтов. И, кстати говоря, имеет ли какое-то значение то нашелся мой текст на 10 сайтах или на ста?
Есть у кого-нибудь какие либо предположения или знания относительно того как яндекс различает оригинальные тексты и плагиат? Т.е. есть ли строгое разделение: такая-то страничка оригинальная, а такая-то тыренная (по яндексу)? Или же яндекс как-то различает степень оригинальности? Т.е. может ли яндекс думать: этот текст на 50% уникальный? И еще считает ли яндекс за оригинальный текст, который когда-то действительно появился на данном сайте впервые в рунете, но потом был растиражирован на сотню сайтов. И, кстати говоря, имеет ли какое-то значение то нашелся мой текст на 10 сайтах или на ста?
Первое что приходит на ум это по дате.
Возможно учитываются ссылающиеся страницы.
Т..е. есть статья, а в конце ссылка на такую же статью, т.е. та оригинальнее.
А вообще это темный лес, вон Гугловцы хоть и орут что у них есть проверка на уникальность контента, но я юзал чужой и индексировалось все как родное.
Алгоритмы определения нечетких дубликатов
/ru/forum/56951
что-то многовато тем по этой ТЕМЕ за последние пару дней. ПОищите недавно обсуждалось.
http://company.yandex.ru/articles/article10.html "качество индекса" почитайте
Происхождение копий документов в Интернете может быть различным. Один и тот же документ на одном и том же сервере может отличаться по техническим причинам: быть представлен в разных кодировках и форматах; может содержать переменные вставки – рекламу или текущую дату.
...
Широкий класс документов в вебе активно копируется и редактируется – ленты новостных агентств, документация и юридические документы, прейскуранты магазинов, ответы на часто задаваемые вопросы и т.д. Популярные типы изменений: корректура, реорганизация, ревизия, реферирование, раскрытие темы и т.д. Наконец, публикации могут быть скопированы с нарушением авторских прав и изменены злонамеренно с целью затруднить их обнаружение.
...
Очевидно, что с полными повторами проблем особых нет, достаточно сохранять в индексе контрольную сумму текста и игнорировать все остальные тексты с такой же контрольной суммой. Однако этот метод не работает для выявления хотя бы чуть-чуть измененных документов.
Для решения этой задачи Udi Manber (Уди Манбер) (автор известной программы приближенного прямого поиска agrep) в 1994 году предложил идею [manber1994], а Andrei Broder (Андрей Бродер) в 1997 [broder] придумал название и довел до ума алгоритм «шинглов» (от слова shingles, «черепички, чешуйки»).
Илья Сегалович (отрывок из статьи)
Kostyan, AVV, Спасибо, нашел много интересной информации. Перевариваю )
hromoy, в любом случае, советую работать с оригинальным контентом ;)