Ленар Амирханов, автор популярного блога «Я в Блоге.ру», описал способ быстрого сбора мета-тегов страниц с помощью Google Docs, работающий для 95% сайтов.
Не все знают, что в Google Docs встроены не только стандартные функции, которые дублируют аналогичные из Excel, но и функции, которые позволяют спарсить отдельные элементы с обычных веб-страниц. Используя эти возможности, можно в два счета собрать мета-теги страниц, не прибегая к посторонним инструментам (зачастую платным).
Шаг 1. Заводим новую таблицу в Google Docs и вставляем список страниц, откуда нужно спарсить мета-теги
Шаг 2. Указываем, какие мета-теги собирать. Прописываем в строку формул функцию для парсинга
Для Title:
Для Description:
Для Keywords по аналогии с Description:
Кроме мета-тегов, можно собрать данные и из содержимого других тегов. Например, H1 (по аналогии с парсингом Title):
Как видно, сразу после написания формулы, Google Docs парсит данные.
Шаг 3. Получаем мета-теги для всех URL
Теперь осталось протянуть ячейки B2, C2, D2 и E2 вниз. Таким образом, получаем мета-теги для всех URL:
Результат сразу позволить увидеть страницы, где не заполнены какие-либо мета-теги. Тестовый файл с заполненными формулами
Единожды создав шаблон для парсинга мета-тегов, далее можно использовать его постоянно, существенно экономя время.