Есть ли такая программа и кто готов ее написатью.

12 3
N
На сайте с 26.10.2009
Offline
152
2347

Доброе время суток.

Есть ли в интернете программа с таким функционалом:

1: Указывает путь к sitemap.xml или к HTML карте сайта.

2. Программа собирает все новости, категории, страницы. Здесь же выбор что собирать новости, категории, все или что-то отдельно и так далее.

3. Программа берет "Title" или "H1" загаловок.

4. Программа совмещает все в таком виде <a href="URL новости">TITLE новости</a>

5. Выдается полный список ссылок.

Поддержка популярных CMS(DLE/WP) и HTML.

Знает ли кто подобную программу? Кто сможет написать и за сколько?

[Удален]
#1
Nimor:
Здесь же выбор что собирать новости, категории, все или что-то отдельно и так далее.

А как она должна (сможет) определить, что есть что?

Nimor:
Поддержка популярных CMS(DLE/WP) и HTML.

sitemap.xml или есть или нет. На него же есть стандарты. Движок тут как бэ не причем.

ТС, насколько я понял Вам надо из сайтмапа просто получить ссылки в виде <a href="URL новости">TITLE новости</a>. Правильно?

N
На сайте с 26.10.2009
Offline
152
#2
А как она должна (сможет) определить, что есть что?

За этим и нужна поддержка движков.

sitemap.xml или есть или нет. На него же есть стандарты. Движок тут как бэ не причем.

Он нужен для правильного определения типа ссылок - категории, страницы и так далее.

Да, Вы правильно поняли.

Jade
На сайте с 13.12.2009
Offline
46
#3

Да, давно искал нечто подобное, присоединяюсь :)

Свежее решение (http://icqadvert.org/to/2324/) для конвертации трафика (http://bit.ly/IgWZQD) - спешите снять сливки!
[Удален]
#4
Nimor:
За этим и нужна поддержка движков.

А как ЭТО поможет определить? Я в том же ВП могу изменить ЧПУ так, что по урлу нельзя однозначно сказать это ссылка на страницу вывода постов одной категории или на страницу конкретного поста.

Nimor:
Он нужен для правильного определения типа ссылок - категории, страницы и так далее.

:) "тип ссылок" - нет такого в спецификации сайтмапа. Тем более так, как Вы себе представляете. Ибо в нём урлы на страницы сайта. А сочтёт ли вебмастер нужным показать в стаймапе ссылку на страницу категории (которая, кстати. всего лишь виртуальная, логическая структурная единица сайта), или нет - это его дело.

[Удален]
#5

Nimor, спасибо что создали тему. Вспомнила, что давно хотела себе такую программу.

Ваша тема послужила хорошим пинком в воскресенье утром для написания программы.

Написала программу со следующим функционалом:

1.берет урл site.ru/sitemap.xml

2.собирает с него все урлы

3.сохраняет список урлов в тхт файл

4.считывает файл с урлами и по порядку заходя на урл из файла читает его title

5.складывает это все в файл тхт(html как удобно) в виде:

<a href="урл 1">title страницы урл 1 </a>

<a href="урл 2">title страницы урл 2 </a>

<a href="урл 3">title страницы урл 3 </a>

.........................

и так по всему списку урлов.

Сам код написан на Ruby. С использованием gem

require 'nokogiri' и require 'open-uri'

Тестировала на своих сайтах, которые на Drupal, но думаю разницы в sitemap.xml от др. движков быть не должно.

Если кому интересно могу поделиться кодом программки.

С денвера ее конечно не запустишь, но если нужно, то интерпретатор руби под windows поставить можно очень просто.

Если кому нужно просто спарсить вашу карту в xml и получить список оформленных ссылок с анкором в виде тайтла(а с установкой руби возиться не хочется), то милости прошу в личку. За символическую сумму или просто за благодарность спаршу ваш sitemap.xml и выдам уже готовый список ссылок с анкорами.

[Удален]
#6
n.anastasia:
Nimor, спасибо что создали тему. Вспомнила, что давно хотела себе такую программу.
Ваша тема послужила хорошим пинком в воскресенье утром для написания программы.

Написала программу со следующим функционалом:
1.берет урл site.ru/sitemap.xml
2.собирает с него все урлы
3.сохраняет список урлов в тхт файл
4.считывает файл с урлами и по порядку заходя на урл из файла читает его title
5.складывает это все в файл тхт(html как удобно) в виде:
<a href="урл 1">title страницы урл 1 </a>
<a href="урл 2">title страницы урл 2 </a>
<a href="урл 3">title страницы урл 3 </a>
.........................
и так по всему списку урлов.

Сам код написан на Ruby. С использованием gem
require 'nokogiri' и require 'open-uri'
Тестировала на своих сайтах, которые на Drupal, но думаю разницы в sitemap.xml от др. движков быть не должно.
Если кому интересно могу поделиться кодом программки.
С денвера ее конечно не запустишь, но если нужно, то интерпретатор руби под windows поставить можно очень просто.
Если кому нужно просто спарсить вашу карту в xml и получить список оформленных ссылок с анкором в виде тайтла(а с установкой руби возиться не хочется), то милости прошу в личку. За символическую сумму или просто за благодарность спаршу ваш sitemap.xml и выдам уже готовый список ссылок с анкорами.

хотел бы приобрести у вас

sly-boots
На сайте с 23.05.2009
Offline
45
#7
n.anastasia:
Nimor, спасибо что создали тему. Вспомнила, что давно хотела себе такую программу.
Ваша тема послужила хорошим пинком в воскресенье утром для написания программы.

Написала программу со следующим функционалом:
1.берет урл site.ru/sitemap.xml
2.собирает с него все урлы
3.сохраняет список урлов в тхт файл
4.считывает файл с урлами и по порядку заходя на урл из файла читает его title
5.складывает это все в файл тхт(html как удобно) в виде:
<a href="урл 1">title страницы урл 1 </a>
<a href="урл 2">title страницы урл 2 </a>
<a href="урл 3">title страницы урл 3 </a>
.........................
и так по всему списку урлов.

Сам код написан на Ruby. С использованием gem
require 'nokogiri' и require 'open-uri'
Тестировала на своих сайтах, которые на Drupal, но думаю разницы в sitemap.xml от др. движков быть не должно.
Если кому интересно могу поделиться кодом программки.
С денвера ее конечно не запустишь, но если нужно, то интерпретатор руби под windows поставить можно очень просто.
Если кому нужно просто спарсить вашу карту в xml и получить список оформленных ссылок с анкором в виде тайтла(а с установкой руби возиться не хочется), то милости прошу в личку. За символическую сумму или просто за благодарность спаршу ваш sitemap.xml и выдам уже готовый список ссылок с анкорами.

Можно сделать утилиту с таким же функционалом, но под Windows..

Checker (/ru/forum/491264) - массовая проверка параметров сайтов SE Watcher (/ru/forum/569520) - определение позиций
[Удален]
#8
sly-boots:
Можно сделать утилиту с таким же функционалом, но под Windows..

Вы правы. Но в моем случае было проще написать это все на руби т.к. там есть такой хороший инструмент как require 'nokogiri', да и интерпретатор руби у меня стоит на каждой из windows.

kolyasik86:
хотел бы приобрести у вас

Нету за что платить. Несколько строк кода. Отдам его просто так. Пишите в личку куда выслать файл .rb?

N
На сайте с 26.10.2009
Offline
152
#9

n.anastasia, не за что.

Если у Вас нету Ruby, а хочется, то делаем так:

1) Находим Yazzle(в паблике есть рабочий) или покупаем.

2) Нажимем "Инструменты>Сайт>Карта сайта"

3) Вводим сайт. Включаем "title".

4) Сохранить как xml;csv

5) Открываем с помощью Exsel или OpenOffice Calc.

6) Ставим "Табуляция".

7) Удаляем все лишние колонки и оставляем только колонку с URL и Titles.

8) Открываем NotePad или же блокнотом. Заменям "/" на <a href="http://yoursite.ru/, потом .html на .html">, далее заменяем "переход следующей строки" или же последнее слово в "title"(у многих оно наверно по конструкции как у меня) на </a>.

9) Вот и все.

Выглядит сложно, но я справился за 10 минут. Разумеется зависит еще и от ЧПУ сайта. Но к моему сайту все подошло.

Да, а может закажем софт сразу на несколько человек? Если многим так надо.

[Удален]
#10
Nimor:
Если у Вас нету Ruby, а хочется, то делаем так:

1) Находим Yazzle(в паблике есть рабочий) или покупаем.
2) Нажимем "Инструменты>Сайт>Карта сайта"
3) Вводим сайт. Включаем "title".
4) Сохранить как xml;csv
5) Открываем с помощью Exsel или OpenOffice Calc.
6) Ставим "Табуляция".
7) Удаляем все лишние колонки и оставляем только колонку с URL и Titles.
8) Открываем NotePad или же блокнотом. Заменям "/" на <a href="http://yoursite.ru/, потом .html на .html">, далее заменяем "переход следующей строки" или же последнее слово в "title"(у многих оно наверно по конструкции как у меня) на </a>.
9) Вот и все.

Спасибо. Как вариант.

Но в случае если сайтов не 1 шт. а 5 или 10, а то и 100-ни, то это порядком утомляет.

Но для случая с 1-м сайтом сгодится.

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий