RSS файл - как проверить соответствие спецификации + не индексируется

12
vchesnokov
На сайте с 11.11.2005
Offline
54
4017

Приветствую.

Создан RSS файл сообщений форума: http://www.fl34.ru/forumrss.xml, где-то 28 апреля. С тех пор уже майские страницы проиндексированы, а этого в списке яндекса нет, а google (http://www.google.com/search?&q=allinurl:www.fl34.ru/+site:www.fl34.ru) пишет "Формат файла: Неизвестный".

Вопросов, собственно, два:

1. Где в online можно скормить URL файла и проверить его соответствие спецификации RSS 2.0?

2. И в чём может быть проблема, приводящая к его неиндексации?

Заранее благодарен за дельные ответы.

Yours sincerely, Valery V. Chesnokov, косметика (http://www.fl34.ru/), кадровые программы (http://volgacv.fl34.ru/), торговые эксперты и терминалы MetaTrader (http://www.mqlsoft.ru/)
Mad Cat
На сайте с 29.01.2006
Offline
89
#1

http://feedvalidator.org/ - вот валидатор для RSS.

Профессиональное тестирование ПО и web-сервисов (http://www.testlab2.com)
vchesnokov
На сайте с 11.11.2005
Offline
54
#2
Mad Cat:
http://feedvalidator.org/ - вот валидатор для RSS.

Спасибо. Из трех замечаний, пожалуй, главное одно: Your feed appears to be encoded as "utf-8", but your server is reporting "US-ASCII".

Теперь ясно, я дал маху в такой мелочи... :)

vchesnokov
На сайте с 11.11.2005
Offline
54
#3

Один вопрос остался. Всё исправлено, валидатор выдаёт одно замечание по поводу отсутствия адреса email в теге author, но адреса почты я светить не хочу, думаю, это не критично. Но google почему-то выдаёт при анализе результатов http://www.google.com/search?&q=allinurl:www.fl34.ru/+site:www.fl34.ru__ на этот файл фразу "Формат файла: Неизвестный". Хотя отдаётся чётко xml (<?xml version="1.0" encoding="utf-8"?><rss version="2.0"><channel><title>....). Да и в Яндексе он так и не появился, хотя ссылок с головы сайта и форума на него немерянно :(.

Кто подскажет решение, в чём дело?

vchesnokov
На сайте с 11.11.2005
Offline
54
#4

Конкретизируем вопрос.

Как лучше отдавать заголовок с типом:

1. header("Content-type: text/xml");

2. header("Content-type: application/xml");

3. header("content-type: application/rss+xml");

4. иначе __________;

Revan
На сайте с 09.09.2005
Offline
321
#5

у меня для корректно индексируемого rss выдаются - формат файла неизвестный......... ;)

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.
vchesnokov
На сайте с 11.11.2005
Offline
54
#6
Revan:
у меня для корректно индексируемого rss выдаются - формат файла неизвестный......... ;)

Вам повезло. Я не вижу, что google сохраняет его в кэш, это нехороший признак, и в Яндексе в списке проиндексированных страниц её нет вообще, хотя ссылки на rss стоят с любой страницы форума.

Как вы отдаёте тип файла (см. выше варианты)?

T
На сайте с 16.02.2006
Offline
98
#7

Header("Content-Type: text/xml"); вроде как☝

icq - 9225229 Web-payment.ru/monitoring (http://web-payment.ru/monitoring) - лучший мониторинг курсов обменных пунктов
vchesnokov
На сайте с 11.11.2005
Offline
54
#8
Toshka:
Header("Content-Type: text/xml"); вроде как☝

Ваш RSS файл при этом корректно индексируется в google, yandex, rambler и т.д.?

J2
На сайте с 06.04.2005
Offline
15
#9

Что бы с RSS не было проблем надо помнить одно простенькое правило. XML это файлы передачи ДАННЫХ. Это я про то, что надо чётко разделять где данные, а где теги.

Сразу прошу прощения за такой примитив, но так как сам занимаюсь этими вещами очень часто встречаю что-то вроде:

<description><div>bla-"bla&bla<br>bla"-bla</div></description>

Здесь уже явно прослеживается ошибка, и не всякий ретранслятор будет разбираться... Верный вариант:

<description>&lt;div&gt;&quote;bla&amp;bla&lt;br&gt;bla&quote;-bla&lt;/div&gt</description>

На счёт header, ну вот пример:

header('Content-type: text/xml; charset=utf-8', true);
с уваженством ... пишу: Рецепт кролика Тоби (http://kurilka.co.ua/archives/savetoby/)
vchesnokov
На сайте с 11.11.2005
Offline
54
#10
jl2005:
На счёт header, ну вот пример:
header('Content-type: text/xml; charset=utf-8', true);

Так всё-таки:

1. header("Content-type: text/xml");

2. header("Content-type: application/xml");

3. header("content-type: application/rss+xml");

Я поставил сейчас:

header('Content-Type: application/rss+xml; charset=utf-8');

прогнал через http://feedvalidator.org/check.cgi?url=http%3A%2F%2Fwww.fl34.ru%2Fforumrss.xml и получил оценку "Congratulations!

This is a valid RSS feed.", т.е. "молодец, возьми с полки пирожок". Результат буду считать положительным, когда увижу эту страницу в списке индексированных без замечаний от поисковиков.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий