Фото, теги и дубли

Станислав
На сайте с 27.12.2009
Offline
237
1042

Как побороть дубли?

Сайт предоставляет загрузку фоток, к фоткам пользователь прописывает теги.

К примеру есть некая модель Маша, у нее есть 40 потрясных фоток которые она хотела бы выставить на всеобщее обозрение.

Она заходит на сайт, и заливается все свои фотки на него, к каждой фотке обязательным полем является заполнение поле с тегами.

Маша сидит и видит что ее 40 фоток уже загрузились и у каждой фотки есть поле в которое нужно написать что на фотке изображено. Все 40 фото сделаны в одной и той же комнате, с одним и тем же интерьером, только позы самой Маши разные, ну и она начинает делать следующие действия. Заполнит первое поле, сделает Ctrl+C, и погнала с Ctrl+V.

По сути все правильно она делает, и ограничивать какие то ее действия в этом плане я не хочу, только распугаю народ.

Как быть? Дублей просто жесть!

1. Если смысл перемешивать идентичные теги, чтобы добиться уникальности в Title? Но это тупиковая схема, потому что комбинаций будет не особо много

2. Exif, беспонтовая вещь в данном случае

3. Для разбивки тегов уже думаю может воспользоваться API яндекса и добавлять различные синонимы слов и обратиться к пункту 1, но и то не факт что прокатит.

4. Сделал уникальное поле рядом с фоткой, его содержимое проверяется по базе на уникальность, но либо не заполняют, либо такую дичь туда пихать начинают, только ради того чтобы проскочило.

5. Добавлять в Title ID (mongodb), вобще никакой смысловой нагрузки не несет, больше на спам будет похоже.

Что придумать то можно со всем этим? Как от дублей избавиться? 100к+ дублей в итоге....

Мы там, где рады нас видеть.
S3
На сайте с 15.03.2010
Offline
113
#1

не думаю, что ПС посчитает эти фотки дублями, у них же у каждой есть ещё своё имя (например 32ug2gujg234.jpg), а они не могут быть одинаковыми

Станислав
На сайте с 27.12.2009
Offline
237
#2
stalk319:
не думаю, что ПС посчитает эти фотки дублями, у них же у каждой есть ещё своё имя (например 32ug2gujg234.jpg), а они не могут быть одинаковыми

Я пишу не про фотки, а про страницы на которых размещены эти фотки. ПС удаляют страницы как дубли, выберут одну из 40, а остальные 39 удалять из выдачи.

Приходят мысли только о том что взять 2-3 первых тега у дубликатов и добавить #1|#2|#3

Получаться Title что то вроде:

1. Маша, медведь, природа, деревья, лес (это не дубль)

2. Маша и медведь #1

3. Маша и медведь #2

4. Маша и медведь #3

5. Маша и медведь #4

Есть ли в этом смысл?

P
На сайте с 17.08.2018
Offline
6
#3
Ms-Dred:
Я пишу не про фотки, а про страницы на которых размещены эти фотки. ПС удаляют страницы как дубли, выберут одну из 40, а остальные 39 удалять из выдачи.

Вы хотите чтобы каждая из этих 40 страниц присутствовала в выдаче? по сути никакой пользы для людей 40 страниц почти идентичного контента не несут, и вряд ли по ним будут переходы из органики, или вы собираетесь каждую такую страницу оптимизировать?

bezmazbl
На сайте с 23.08.2017
Offline
24
#4

Canonical?

▁ ▂ ▃ ▅ ▆ █ (https://www.mixcloud.com/bezmazbl/)
A
На сайте с 05.03.2006
Offline
282
#5
Ms-Dred:
Я пишу не про фотки, а про страницы на которых размещены эти фотки. ПС удаляют страницы как дубли, выберут одну из 40, а остальные 39 удалять из выдачи.

Приходят мысли только о том что взять 2-3 первых тега у дубликатов и добавить #1|#2|#3
Получаться Title что то вроде:
1. Маша, медведь, природа, деревья, лес (это не дубль)
2. Маша и медведь #1
3. Маша и медведь #2
4. Маша и медведь #3
5. Маша и медведь #4

Есть ли в этом смысл?

Есть такая тема. Яндекс не анализирует фото. И фото маши может посчитать дублями фото Вити.

2. Маша и медведь #1

3. Маша и медведь #2

4. Маша и медведь #3

5. Маша и медведь #4

Будут дублями.

Ну только если каноникалом.

Станислав
На сайте с 27.12.2009
Offline
237
#6
PLeo:
Вы хотите чтобы каждая из этих 40 страниц присутствовала в выдаче? по сути никакой пользы для людей 40 страниц почти идентичного контента

Все как раз наоборот, потому что фото разные, и все эти страницы должны быть в выдаче, они одинаковые только по тегам. На одной фотке Маша сидит, а на другой стоит. Я мог бы дописывать в тегах что Маша сидит или стоит, но столько страниц я буду перебирать до пенсии, а если учесть что в день таких страниц по +100, это печалька

....
5. Маша и медведь #4
Будут дублями.

Хорошо, почему тогда советуют добавлять ID в title к таким страницам? Пишут что это поможет, но я не вижу в этом смысловой нагрузки, больше на спам походит.

В общем беда полная!

Может быть есть какие то пакеты для ноды или сайты с API которые определяют что нарисовано на картинке?

A
На сайте с 05.03.2006
Offline
282
#7

Хорошо, почему тогда советуют добавлять ID в title к таким страницам? Пишут что это поможет, но я не вижу в этом смысловой нагрузки, больше на спам походит.
В общем беда полная!

теоретически может помочь. Но по опыту если на странице только фото, то могут не только в дубли, но и в некачественные перевести. особенно если этих страницах нет посетителей. По метрике это определяют.

Станислав
На сайте с 27.12.2009
Offline
237
#8
Bartrushka:
контент юзер генерейтед?

Да, именно они

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий