защитить уник. контент

1 23
A
На сайте с 28.02.2010
Offline
55
#21

вам по сколько лет, Господа?

можно вместе рассмотреть что такое "уникальный контент"

1. в русском языке используется, в той или иной форме, порядка полумиллиона слов, допустим с учетом основных формообразований их 700 - 800 к в базе яндекса\гугла, не столь важно какой пс, ну пусть будет даже 1 или 1.5 миллиона с использованием основных префиксально-суффиксальных накруток

2. учитывая тенденции последнего апа, да и всех предыдущих апов, думаю не для кого не секрет что алгоритм яндекса имеет некоторое отношения к ( вырезанно цензурой ), что подразумевает следующее:

а) если вы генерируете бредовые тексты на дорвеи, то они должны быть лингвистически грамотно построены, то есть предлог "В" не может стоять перед ( вырезано цензурой ) , а к примеру: "И" может стоять перед ( вырезано цензурой ) т.д.

б) на основе анализа этих массивов текста строится весь проект

как оказывается сложно писать то, когда всё элементарно но выкладывать массам это нельзя

3. теперь попробуйте оперируя 700к слов, откинув абсурдные словосочетания ( рассматривается с позиции: лингвистика + реализация в коде ) составить даже не миллион страниц с уникальным тематическим контентом, а хотя бы 10000 страниц по 2-5к символов с пробелами.

4. исходя из ваших рассуждений в индексе должно остаться порядка нескольких тысяч сайтов, остальные в той или иной мере попадают под какие либо фильтры, наиболее яркий пример сайты новостей, посмотрите кто в топах, неужели вы думаете что они являются авторами контента, что у них есть свои корреспонденты, операторы и прочий персонал

5. кто работает с кодами, кто сам создавал ботов и имеет представление о том как живёт бот ... попробуйте концепцию уникальности реализовать в коде, не нужно ничего усложнять, просто сядьте и попытайтесь это сделать :) Уверяю вас, столкнётесь с нерешаемыми задачами, то есть они разумеется решаемые, но при их решении поисковая система превращается в каталог сайтов.

6. что может быть уникального в жизни например: Тамерлана, Наполеона, Суворова и т.д. Неужели вы думаете до создания википедии этого нигде не писали и что там исключительно "уникальный контент"?

7. Сейчас в выдаче миллионы страниц, "уникального контента" при данных вводных не может существовать по определению, даже не берём в расчёт такие отрасли как стоматология, пластиковые окна, натяжные потолки или любая другая специализация, где существует какой то технологический процесс.

кому нужно, те сделают для себя пометки, а больше я не буду ничего вам говорить, сейчас на меня выльют много грязи, но меня не интересуют ваши мнения (с) беспредельщики мы

ps: автор статьи не я, мной кое что отредактированно и не более того, огромная благодарность автору за статью и за его опыт и навыки переданные мне и моим партнёрам

чтобы выжили мы, вы должны будете умереть
L
На сайте с 07.12.2007
Offline
351
#22
ivashka:
И самый главный вопрос, как защитить свои сайт от такого?

1 Закрыть RSS.

2 Если тырят вручную - то можно свежевыложенные тексты открывать только для роботов ПС и для тех, кто пришел с поиска.

3 Если тырят скриптами - их можно отловить по IP и отдавать им "левый контент".

Это не так сложно, если Вы пишете на php+mysql (как написано у Вас в подписи) и серьезно озабочены проблемой плагиата.

OPTIMER
На сайте с 05.01.2006
Offline
496
#23
ivashka:
Популярность документов

А если документ не популярен, но уж вкусен ух как, то его не стырят?)

Вообщем, Это интернет и можно заранее готовиться к унику и его тыренью.

оО Раскрутка сайтов без абон. платы, единоразово от 100.000 руб.
1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий