Яндекс новости, вопрос!

freeden
На сайте с 15.03.2008
Offline
136
1293

Добрый вечер господа!

Яндекс новости сегодня начали индексировать ленту ТЫЦ

немного времени спустя приходит письмо следующего содержания:

Уважаемые коллеги,

В Вашем экспорте http://news.yandex.ru/smi/tvoya-gazeta встречаются
идентичные по содержанию новости, которые тем самым дублируют друг друга.

Пример:
Народную избранницу народ...не поддержал 04.03.11
http://www.tvoya-gazeta.com/component/content/article/111-8--020311/568-2011-03-04-16-08-57.html
http://www.tvoya-gazeta.com/component/content/article/111-8-020311/568-2011-03-04-16-08-57.html

Очередной проект, чтоб не потерять авторитет 04.03.11
http://www.tvoya-gazeta.com/component/content/article/111-8--020311/567-2011-03-04-16-00-41.html
http://www.tvoya-gazeta.com/component/content/article/111-8-020311/567-2011-03-04-16-00-41.html

Убедительно просим не включать в экспорт для Яндекс.Новостей такие
дублетные ссылки.

--
Георгий Любарский,
контент-менеджер Яндекс.Новости

На что был дан ответ:

Здравствуйте Георгий!
В экспортируемом файле нет дублей, откуда вы их взяли?
На сайте конечно дубли есть, но это бич CMS джумла.
И как вы проиндексировали статью которая еще не опубликована на сайте??? http://www.tvoya-gazeta.com/component/content/article/111-8--020311/571-2011-03-09-16-54-26.html
Называется:
Какие доходы нужно декларировать в налоговой инспекции? 19:47 Твоя газета

Интервью с заместителем начальника ГНИ Алушты Сергеем Юрченко Ничто так наглядно не иллюстрирует особенности переходного периода, как нынешняя декларационная кампания. ...- Если говорить о доходах ...

Ответ от новостей:

Здравствуйте, Денис

Давайте мы сейчас со всем этим и разберемся.
Мы индексируем только то, что вы помещаете в экспортный файл
http://www.tvoya-gazeta.com/index.php?option=com_sdrsssyndicator&feed_id=2&format=raw
В правилах трансляции (во вложении) указано: транслировать следует то,
что выложено на сайте. Тем самым вопрос возвращается - отчего в экспорт
попала новость, которой нет на сайте. Пожалуйста, разберитесь с этим.
Далее: робот заходит к вам на сервер раз в 10 минут, сканирует
экспортный файл и берет все новости с уникальными url - считая их
оригинальными новостями. Значит, с вашей стороны можно отредактировать
экспортный файл. Кроме того, на сервере могут стоять программы,
генерящие переадресацию страниц с www и без www. Пожалуйста, разберитесь
с вашим экспортом - каким образом новости попадают в экспортный файл,
кто отвечает за то. чтобы туда попадали только новости с сайта,
отследите программы на сервере, которым разрешено менять адреса и т.п. В
ленте http://news.yandex.ru/smi/tvoya-gazeta не должно быть дублей -
туда не попадает то. что Яндекс сканирует "сам", только из вашего
экспортного файла.

Сразу скажу не силен в коде,

тут 5 статей : http://www.tvoya-gazeta.com/index.php?option=com_sdrsssyndicator&feed_id=2&format=raw

тут 11: http://news.yandex.ru/smi/tvoya-gazeta

где проблема???

freeden добавил 10.03.2011 в 00:33

??? никто ничего не скажет?

https://afisha82.ru Решил тряхнуть стариной... Кто в Крым хочет, ехайте не ссыте!
F
На сайте с 16.01.2010
Offline
267
#1

На Яндексе будут оставаться все новости из экспортного фала, чем дальше, чем больше, а не только то что у вас в данный момент в rss. А вот у вас нужно оставлять только последние n.

На момент первого захода новостного робота у вас там уже были новости от 4-го числа, их тоже до кучи загребло.

freeden
На сайте с 15.03.2008
Offline
136
#2
futuristian:
На Яндексе будут оставаться все новости из экспортного фала, чем дальше, чем больше, а не только то что у вас в данный момент в rss. А вот у вас нужно оставлять только последние n.

На момент первого захода новостного робота у вас там уже были новости от 4-го числа, их тоже до кучи загребло.

Так они там все от 4 числа, все 5 первые и единственные.

Откуда взялись дубли???

И откуда там взялась статья еще не опубликованная на сайте? и в rss её соответственно тоже нет.

F
На сайте с 16.01.2010
Offline
267
#3

Есть ещё новость от "09.03.11 19:47" и не продублирована. Это уже прошедшее число.

И кстати, Я.Новости учитывает дату и время из rss, а не время фактического получения фида, так что можно и в прошлом написать и в будущем, правда на определение первоисточника это не влияет.

На счет дублей не помогу, жомла для меня темный лес. Спросите в разделе веб-строительства, там иногда обсуждают дубли джумлы.

freeden:
И откуда там взялась статья еще не опубликованная на сайте? и в rss её соответственно тоже нет.

Очевидно так задумано.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий