Теоретически, можно распарсить выдачу Гугла, но что это даст? Если бы в вас был список страниц до добавления, то можно было получить разницу между ними. А так это бесполезно
Если, как советовал SmileP, указать последние N дней, то это уже имеет смысл :) и объем работы значительно сократиться :) Но точный список вы так не получите - Гугл выдаст не только новые страницы, добавленные за указанный период, но и старые, которые он переиндексировал за это время.
У вас 36 css файлов 🤪 и 15 мелких картинок, которые можно свернуть в одну.
Думаю, что лучше будет всё же начать с уменьшения количества css файлов ;)
1) У вас сайт организации, но в меню нет раздела контакты. Хотя на сайте Яндекса есть подробная информация об этом http://platon.ya.ru/2116
2) У вас главная страница сайта и пункт меню "О нас" - это одно и то же. В меню "О нас", а заголовок на странице "Главная", что может запутать не только людей. Надо всё-таки отделить мух от котлет
3) На странице "Ваш вопрос" написано, что на этой странице я могу задать свой вопрос и получить на него ответ, но формы для отправки вопроса нет
4) На форуме тоже написано, что я могу задать свой вопрос и мне ответят. В чем смысл делать один и тот же функционал в 2 местах?
5) h1 на всех страницах однаковое <h1> - это ссылка на главную и это верхний баннер сайта!
6) На главной странице сайта тег тайтл пустой <title></title>, про h1 уже написано, <h2> на странице "Поиск на сайте", "Меню сайта" и т.п. не имеющее никакого отношения к контенту
7) или вот Title у страницы "Наши услуги", Title же в спиппет попадает. Представьте себе, что в выдаче яндекса человек видит "Наши услуги" и ... что он подумает? Наши - это чьи? Какие услуги? Кому услуги?
Ну пока хватит :)
Составьте список страниц сайта какой-нибудь программкой (или сервисом) для поиска битых ссылок или составления карты сайта
Потом сравните получившейся список страниц с тем, что, по идее, должно быть. Может найдете лишнее
..... Ждать
Возможные причины
1)
Сайт проиндексировался 2 раза с www и без www и у вас полезли дубли
http://www.arkiplus.ru/
http://arkiplus.ru/
Нужно настроить 301 редирект с www на без www
2)
Есть одна странная штука на сайте - это ссылки на картинки с двойным слешом в пути // типа этой
http://arkiplus.ru/upload/tmp//class/AImage/02e7063b926c5c4d007012fee478f2fc.png
Их у вас много - 104 штуки. Браузер их показывает нормально. А вот может ли их загрузить робот ПС?? Если не может и получает вместо них 404, то на такое количество потерянных картинок может обидеться
И лучше закройте от индексации http://arkiplus.ru/index.html или уберите эту страницу с сайта
bitwork, несколько замечаний:
1) меня смущает невидимая ссылка на каждой странице
<link itemprop="url" href="http://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D0%BB%D0%B0%D1%82%D0%BA%D0%B0" />
или уберите эту ссылку вообще, или сделайте её видимой для пользователей.
2) лучше вставить картинки в текст "по-нормальному", как тут в начале статьи http://palatking.ru/Tents/choosing_a_tent_General.html, а не всплывающими окошечками при наведении на иконку фотика. Думаю, что так информация будет лучше восприниматься читателем
3) сделайте шрифт внизу страницы темнее, а то этот светло-серый текст еле-еле видно (он может восприниматься как скрытый контент)
4) попробуйте добавить карту сайта для пользователей (поисковики это любят)
5) попробуйте добавить страницу "О себе"
В настройке хостинга есть такая штуковина "Поддомен по умолчанию" называется. Если идет на запрос на поддомен, которого не существует, например
http://qwerty.playgrad.ru/index.php?newsid=49231
http://qwerty.asdf.playgrad.ru/index.php?newsid=49231
ну и так далее, сколько фантазии хватит ;), то показывается "Поддомен по умолчанию"
Если на хостинге лежит несколько сайтов, то ... последствия очевидны
http://zxcvb.softorion.ru/
http://qwerty.zxcvb.softorion.ru/
Что делать?
Вариант 1: разруливать это самому внутри сайтов через .htaccess и/или php скрипты
Вариант 2: через настройки хостинга
пагинация - это разбиение на страницы
https://support.google.com/webmasters/answer/1663744?hl=ru
https://productforums.google.com/forum/#!topic/webmaster-ru/jWDLWuI9gmA
Ссылки на форумах очень часто идут с rel="nofollow", а иногда еще и заворачиваются в <noindex>