bulatbulat48
По п.1. кажись разобрался - приставка /?to=2/ появляется из-за подключения связей между объектами. С этим моментом сейчас разбираюсь, с разработчиком модуля каталогов.. Почему то страницам с /?to=2/ присваивается link rel="canonical"
Тогда получается эти страницы нельзя закрывать в robots.txt? или если их закрыть - то ПС начнет индексировать нормальные адреса объектов - без /?to=2/ ???
Да индексируются и страницы самих объектов и iframe к каждой странице объектов.
Добрый день!
Начал анализировать проиндексированные страницы сайта и обнаружил следующие моменты:
1. На сайте создан раздел - каталог с видео.. ссылка на объект (видео) имеет следующую структуру - сайт.ру/video/item/-n-/
так вот обнаружил что в поиске попадаются следующие страницы:
- сайт.ру/video/item/-n-/
- сайт.ру/video/item/-n-/?to=2/
причем если есть страница с */?to=2/ - то в поиске нет нормальной с адресом сайт.ру/video/item/-n-/
не пойму откуда берется этот /?to=2/ ???
Как избавиться от этого /?to=2/ в поиске оставив только нормальную ссылку на объект?
1.1. каждый объект каталога видео имеет возможность получить код iframe для вставки его по тексту в любом другом месте, например при написании статьи - _<iframe src="http://сайт.ру/video/frame/-n-/?width=570" width="570" height="200"></iframe>
так вот в поиске присутствуют все iframe к каждой странице видео, такого вида - сайт.ру/video/frame/-n-/?width=570
Стоит ли закрыть от индекса эти страницы с iframe ?
DiKiJ
Т.е. над вопросом копирайтев и нарушения авторских прав сайтов источника даже не задумывались? и проблем не было?
А можно пример вличку?:
Еще раз огромное спасибо за ответы! Теперь конечно разница между копипастом и парсером становится очивидней)
не спорю... что это может быть элементарно.. просто нет возможности вникать в технические моменты реализации на конкретном сайте..
Сам сайт и тематика достаточно специфичны и узко направленны, учитывая что он не является коммерческим - то его основное назначение быть полезным другим, т.е. быть СДЛ (хотя вариантов монетизации я не исключаю, но из-за не желания отпугнуть посетителей избыточной рекламой - явной рекламы на сайте нет вообще, даже блока директа нет)..
Вопрос связан с тем, что не хочется копипастом - в результате создания блока с дайджестом новостей определенной тематики убить совсем сайт - загнав его под фильтры ПС...
MikhailMD
Спасибо за ответы!
тут не совсем соглашусь.. Провести модерацию со смартфона значительно легче - необходимо понять, что новость тематическая и не дубль уже имеющейся. А заниматься копипастом на телефоне не очень удобно - значительно больше действий - вставить название, текст, картинку, теги... Но это уже технический момент)
По ссылкам я Вас понял - открытые так открытые)
А есть ли требования по допустимому количеству копипаста? какое соотношение допускается и т.п.?
Ссылка на перелинковку почитал - сложновато это немного для меня( интересно сколько может стоить подобная оптимизация?
Посмотрел несколько.. Полный копипаст - внизу ссылка на источник и все..
Нет сайт не WP - парсер заказвать придется) Как показывает слежение за интересующими новостями через Google Alerts - необходимых материалов будет 3-10 в день.
Что такое СПД сайт - можно глупый вопрос?))
Ну если ввести ручную модерацию, перед публикованием такой новости - то можно избавиться от дублей новостей.
Просто тут прозвучало мнение - что открытая ссылка лучше, чем не открытая.. вот и пытаюсь понять почему..
Понятно что новости не должны быть единственным источником материалов на сайте.. И чем меньше на сайте Неуникального контента - тем лучше..
А молодой сайт - это какой имеется ввиду? Сайту больше года, ТИЦ 10..
Спасибо за информацию. Т.е. на внутренних страницах сайта, должно быть несколько ссылок на главную, с разными анкорами?)
Писать самому - это статьи пожалуста, я пишу.
А как можно писать самому новости? Т.е. о событиях произошедших где либо на нужную тематику? придумывать что ли?))
Спасибо всем, кто откликнулся. но ясности пока в голове не добавилось.
Задам пару уточняющих вопросов, по тому что отложилось):
В порядке убывания варианты публикования по полезности для ПС можно расположить следующим образом:
- Идеальный случай искать источники новостей, которые не публикуются в инете..
- Потом по ценности идет глубокий рерайт..
- Копипаст.
Как я понял, если я не гонюсь за тем, что бы страницы моего сайта лезли в ТОП выше страниц источников, то рерайт можно и не делать, а обойтись копипастом? - самым простым вариантом...
При этом есть два момента:
- первое, лучше брать новости с разных источников, как написал
разные источники - это как бы само собой получаются. Т.к. из всех новостей с разных сайтов разных регионов будут браться новости только одной конкретной тематики.
- второе, постараться новости брать с весомых источников и при этом делать на них открытые индексируемые ссылки -так?
Вот наверно правильно название тому, что хочу - дайджест новостей!:)
Может кто тут прояснить, почему ссылка на такие источники будет мне полезна?
Тематика сайта действительно узкая, в принципе других сайтов публикующих дайджест новостей по этой тематики не встречал. Но хочу отметить, что публикация этих чужих новостей - это только один из разделов сайта.. и в общем то не основной. Но который на данный момент будет давать большую часть материалов а в последующем надеюсь это станет просто одной колонкой по новостям на данную тему.
Если честно - не понял, что значит продвигать главную и как сделать весь сайт донором главной((
Брать с иностранных источников не получиться(( Тематика относиться к странам СНГ и больше РФ.
Да, Вы правы - хочу чего не знаю сам и естественно не знаю КАК))
Что касается неопубликованных источников - то я думал, может есть какие либо информационные агенства, которые раздают в электронном виде всю поступающую информацию, а новостные сайты уже сами выбирают - публиковать или нет и что в первую очередь. Но видимо это утопия)
Парсить или в ручную - пока не определился. Конечно хотелосьбы автоматизировать этот процесс, особенно если обойтись копипстом. Но это потребует времени на реализацию с помощью специальных людей), поэтому по началу скорее руками.
Я правильно понимаю, что технически возможно парсить из RSS источника только новости определенной тематики (т.е. содержащие определенные ключевые слова)?
И что касается открытой ссылки в копипасте - почему это будет полезно моему сайту?
Не ужели ни кто ни чего не подскажет?(