за идею спасибо, конечно. Хотелось бы уже готовое решение. Мне не нужно никакого эксклюзива.
Задача стандартная - создание сайтмап для яндекс.
Это понятно. Но пдф файлы имеют разные названия и пробелы стоят в разных местах.
Это описания и паспорта товаров. В названии файла присутствует название компании-производителя (которых несколько разных) и название товара (которые все разные).
Я думал, что у яндекса есть специальный сервис для создания sitemap.xml, раз сайтмап от гугла для него неподходит.
1. Сделал сайтмап на http://www.xml-sitemaps.com/
2. Открыл редактором WinHex.
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/
3. Заменил текст. Пробел заменил на %20
<?xml%20version="1.0"%20encoding="UTF-8"?> <urlset %20%20%20%20%20%20xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" %20%20%20%20%20%20xmlns:xsi="http://www.w3.org/
3. Сохранил
4. Сайтмап не открывается браузером. Ошибка "Invalid syntax for an xml declaration."
Вандалов, которые все портят без видимых мотивов, достаточно среди особей того возраста, который характерен для интернет-форумов.
Не тратьте время на посторонние сайты, их всех под себя не переделаешь. Лучше провигайте Ваш сайт по нужному запросу: сейчас он у яндекса на 4, у рамблера на 10, а в Гугле его вообще нет. По поводу Яндекса, вроде ситуация понятная и не сложная - запрос не конкурентный.
Если я правильно понимаю, то у ТС проблема не с гуглом, а с яндексом.
Яндекс не всегда принимает сайтмапы с этого сервиса, например у меня не принимает. По этому вопросу я даже тему открыл в разделе "яндекс" /ru/forum/320389
Для программиста может быть и проще, но я не программист. Есть робкая надежда, что правила написания пробелов в виде %20 уже кем то реализованы и удастся воспользоваться готовым решением.
Пробовал. У меня не получилось. Это полуживой сервис. Создает сайтмап только части сайта из нескольких десятков страниц. Либо вообще зависает и мигает надпись "Ожидайте ...." . Этим сервисом невозможно пользоваться для реальных нужд в повседневной практике.
у Яндекса и Гугла в вебмастере есть возможность сообщить этим ПС ссылку на сайтмап. Потом в том же вебмастере ПС будут давать информацию по сайтмапу: нормально ли он прочитался, сколько из него страниц уже проиндексировано.
Сделать сотню доков со ссылками на нулевой сайт, разместить на сотне сайтов, подождать пока эта сотня доков проиндексируется. А потом на нулевом сайте в вебмастере смотреть беки ?