Контент сайта

12
Иван
На сайте с 20.11.2009
Offline
125
1686

Кто знает какая есть софтина для проверки контента на сайте, а именно:

1. Нужно понять где есть текст

2. Сколько там символов

3. Программа проходит по всему сайту сама и выдает все URL, напротив информация

Поделитесь, пожалуйста. Ищу вот уже с неделю

Кто хочет - ищет способ, кто не хочет - оправдание.
ValD
На сайте с 14.06.2007
Offline
146
#1

Screaming Frog SEO Spider. Офигенная штука.

В числе многих прочих данных считает количество слов на странице.

Платный, но стоит своих денег.

K
На сайте с 21.11.2007
Offline
80
kRt
#2
ValD:
Screaming Frog SEO Spider. Офигенная штука.
В числе многих прочих данных считает количество слов на странице.
Платный, но стоит своих денег.

зачем же так вводить людей в заблуждение. есть и бесплатная версия. в бесплатной ограничение на проверку в 500 УРЛов.

ValD
На сайте с 14.06.2007
Offline
146
#3
kRt:
зачем же так вводить людей в заблуждение. есть и бесплатная версия. в бесплатной ограничение на проверку в 500 УРЛов.

Если бы это было единственное ограничение, я бы это упомянул.

Увы, их множество, и бесплатная подходит только для оценки возможностей программы.

Иван
На сайте с 20.11.2009
Offline
125
#4
ValD:
Screaming Frog SEO Spider. Офигенная штука.
В числе многих прочих данных считает количество слов на странице.
Платный, но стоит своих денег.

Не то. Количество текста на странице указывает, но цифра неактуальна.

На одной странице говорит 1.721 слово.

Выделил ВСЮ СТРАНИЦУ, на ней всего 635

Ищем дальше...

ValD
На сайте с 14.06.2007
Offline
146
#5
Mr. Pinky:
Не то. Количество текста на странице указывает, но цифра неактуальна.

На одной странице говорит 1.721 слово.
Выделил ВСЮ СТРАНИЦУ, на ней всего 635

Ну так вы подойдите с точки зрения "сайт", а не "страница".

Всё, что Фрог считает помимо собственно текста, должно повторяться от странице к странице, т.к. наверняка это навигация-дизайн и т.п.

Достаточно определить примерно это число (с помощью заведомо пустой страницы, например) и вычитать его из результата.

K
На сайте с 21.11.2007
Offline
80
kRt
#6
ValD:
Если бы это было единственное ограничение, я бы это упомянул.
Увы, их множество, и бесплатная подходит только для оценки возможностей программы.

Да ладно?

Я прям не поленился и сходил на официальный сайт, вот что там пишут про ограничения:

The 500 URI crawl limit is removed
You can access ALL the configuration options
You can save and re-upload crawls
You can search for anything in the source code of a website with the custom source code search feature
You get support for any technical issues with the software

Ну расскажите теперь, что из перечисленного не позволит мне применить данную программу к целям поставленным ТС, если у меня сайт в 100 страниц?

Иван
На сайте с 20.11.2009
Offline
125
#7
ValD:
Ну так вы подойдите с точки зрения "сайт", а не "страница".
Всё, что Фрог считает помимо собственно текста, должно повторяться от странице к странице, т.к. наверняка это навигация-дизайн и т.п.
Достаточно определить примерно это число (с помощью заведомо пустой страницы, например) и вычитать его из результата.

Короче, это все - фигня.

Почему?

Потому что на страницах карточки товаров.

На одной карточке 50 символов, на другой 20, на следующей 100.

При этом цель (наличие текста на странице) невыполнима

Julia-V
На сайте с 05.02.2010
Offline
77
#8

Mr. Pinky, а Вы свой сайт смотрите или чужой? Если свой и есть доступ к БД, то проще сохранить таблицу из БД, где хранится информация карточек товаров, и уже ее обрабатывать (например, через функцию ДЛСТР в Excel).

ValD
На сайте с 14.06.2007
Offline
146
#9
kRt:
Да ладно?
Ну расскажите теперь, что из перечисленного не позволит мне применить данную программу к целям поставленным ТС, если у меня сайт в 100 страниц?

Сайт в 100 страниц - это не сайт в 100 ссылок для краулера.

Именно для 100, скорее всего, лимита 500 уже не хватит. А настроек типа "читать из списка, сканировать с глубиной ноль" в демо-версии нету.

Я, собственно, не утверждаю, что программу нужно непременно покупать, но она реально стоит своих денег.

Mr. Pinky:
Короче, это все - фигня.
Потому что на страницах карточки товаров.
На одной карточке 50 символов, на другой 20, на следующей 100.

При этом цель (наличие текста на странице) невыполнима

Если у вас настолько мало текста + нужно чекать именно в определённой небольшой области, то вариант с БД выше вполне хорош.

Краулеров, которые могут померять объём текста внутри определённого участка кода на странице, я сходу вспомнить не могу.

Такой скрипт можно накидать руками, это одна регулярка.

VulkanPartner
На сайте с 27.03.2014
Offline
91
#10

Mr. Pinky, такую софтину можно (хоть и серверную) заказать и напишут уверен довольно быстро и за недорого, судя по заявленным требованиям. Единственное, нужно будет боле конкретно уточнить критерии для

"Нужно понять где есть текст"

https://perestroika.team/ru/ (https://perestroika.team/ru/) Perestroika Affiliates- ведущая гемблинг-партнерка. RevShare - до 60%. CPA - до 150$.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий