SkyKiller, оригинальная и интересная идея. Теперь возникает вопрос - возьмут ли такой уникализированный текст яндекс- и рамблер-новостники?
Arhivator-007, можно подробнее? Нифига не понял как склейка доменов может защитить от плагиата.
Да уж, признаюсь, мне тоже религия не позволила отнестись к вопросу автора с подобающим вниманием. А на деле и правда noindex охватывает всю страницу. Мне кажется, это было сделано бывшими оптимизаторами этого сайта, чтобы он сразу упал в позициях после того, как перестали с ними сотрудничать.
А на деле, я где-то читал в помощи Яндекса, что тег noindex не может быть вложенным. То есть увидев первый noindex, робот ищет закрывающий /noindex и не обращает внимания на остальные открывающие. Алгоритм же всяких баров и т.п. действует по-другому - он выделяет сначала внутренние области, потом выше и выше. А главное содержимое статьи как раз таки получается вне этих тегов noindex
Вот это вы меня напугали тут сначала... :-D То htaccess яндекс не воспринимает, то по фтп заходит...
Тема отличная, прямо таки как будто пятница реально.
yanus, как в воду глядел!
А по поводу откуда яндекс может запалить этот файл: если какие-то ошибки с сапой, вполне возможно, что она выдает в тексте ошибки и адрес файла. Вот например такую:
Да бросьте Вы, в самом деле... Вы действительно думаете, что тексты копируют ручками? Те, кто не сможет отрубить джаваскрипт при первой неудаче копирования, не представляют угрозы копирования материала вовсе. Это примерно значит то, что даже если они и скопируют материал в свой говноблог, то наверняка он не составит конкуренции в выдаче с Вашим сайтом. Я думал, мы тут говорим о серьезных вещах (парсинге тысяч страниц), а не о баловстве со спичками.
Devvver, я тут смотрю
Frie, по-моему где-то раньше я слышал, что там привязка по гео идет, а не по изображению. Либо сравнение с изображениями, но с той же привязкой к координатам. Непременное условие - в этом месте должна была проезжать машинка с камерами и сохранить этот снимок в разных ракурсах.
А про товары в магазине - честно первый раз слышу. А сквозь коробки она умеет смотреть? Или по форме и размеру коробки определяет что там внутри? Незаменимая вещь на программе "Что? Где? Когда?" с черным ящиком.
И Вы снова в эфире телепередачи "Большие скАчки" на Первом канале! Делаем ставки, господа!
А если серьезно, то у Вас ссылки наверно дурацкие - с каталогов или форумов. Вот и колбасит их - то отвалятся, то прибавятся.
tanir23, на самом деле он очень прост, но если его слить в паблик, эту тему быстро закроют. Кстати, вот этот алгоритм, который анализирует цветовую карту, скорее всего будет успешно распознавать картинки, уникализированные тем способом, который я использую. Людям с репутацией еще могу поделиться, но к Вам, tanir23, честно, доверия пока нет и не очень понятно для каких целей это Вам надо. (исходя из Вашего сайта в подписи и сообщений на этом форуме).
Не ребят, вы не в ту степь пошли. Какой нафиг код... Шинглы в коде картинки - это смешно.
Лучше почитайте про нейронные сети и реально про системы распознавания образов. Про лучшего друга для создания уника - файнридера - все забыли? Явный пример же распознавания образов букв. Да, у букв тоже есть образы. И на четвертом курсе мы писали лабу на распознавание рукописных букв с помощью нейронных сетей (конечно, с помощью жалкого их подобия, но тем не менее). Верная мысль была про разбивку на квадраты, примерно так действует один из видов алгоритмов.
Elbran, меня поражает Ваша упертость) Даже порой кажется, что в нике не хватает буквы "a" на четвертой позиции.
А по поводу уникализации картинок - 24.11.10 апдейт яндекс-картинок показал действенность моего метода. Метод я автоматизировал для своего движка. Прогнал два сайта со старыми картинками по нему месяца два назад. Картинки индексировались долго, но сегодня вижу, что абсолютно все уникализированные выдаются как оригиналы.
Про алгоритм поиска похожих - неужели никто не видит, что в большей степени учитывается не сама картинка, а поисковый запрос? А про прическу я тоже, конечно, прифигел немного, когда увидел в разных ракурсах фотки как "похожие", расслабился уже после остальных примеров =)
P.S. Devvver, пока писал, не заметил Вашего сообщения. Солидарен)
Не весь трафик одинаково полезен. Например, тизерный трафик, в ходе которого просматривается всего одна страница сайта, а потом человек в ужосе убегает, ИМХО даже вреден. А где взять штук сто человек, которые бы лазили по сайту день за днем с разных не палевных айпишников - это вопрос. Если это действительно будет играть роль при раскрутке, надо будет организовать процесс)
Да Вы думайте сколько угодно, писали же уже в теме, что люди открывают сразу кучу страниц и потом закрывают. Очень часто люди не следуют обычному порядку "увидел в яндексе - прочитал статью - закрыл страницу - вернулся в поиск - открыл другой сайт". Я сам когда что-то ищу открываю сразу все хоть сколько то подходящие сайты первой страницы выдачи в разных вкладках, а потом уже читаю.
Вы посмотрите сами в свою метрику сколько людей у Вас имеют время посещения сайта 0 мин 00 секунд и сами все поймете.