Если я правильно понимаю, то Алеша потратил на сбор семантического ядра 7 дней, а Вася потратил столько денег, согласно тарифу (допустим: MegaIndex) и выгрузил структуру Алеши за 10 минут. То есть если заблокировать штатного паука, то и информации о % конкуренции по запросу не будет. Понятно что целенаправлено можно сделать многое, но если не ставит заборы, то по газону ездить будет кто угодно, а это ресурс сервера.
С визуальной частью вроде разобрался, но вот со самой структурой (внутренней перелинковкой) не все так просто, построил ссылочный скелет, имею полное представление структуры, выбираю ту или иную модель перелинковки (понятно, исходя из желаемого результата продвижения будь то главная, категория или карточка), в примере я показал excel отчет, который на вид выглядит эффектно, все данные очевидны и ясны, понятно что это опыт, хочется относиться к данному делу хотя бы чуточку похоже, второй пример page weight, это единственное предложение, которым мы можем пользоваться?
Посоветуйте какими огородами пойти?)
Разобрался с диаграммой Fusion Table Google, чтобы сортировать для человека понятный вид, стандартной пробежки краулера (парсера) будет мало, дополнительно нужно будет создать колонку "раздел или категория", тем же краулеров (парсером) вытащить данные через xpath или другим удобным способом, так же можно по маркерам ссылки, для этого нужно, общий список ссылок, разбить по столбам:
1. Поиск / Замена: http://название сайта/ = пробел
2. Поиск / Замена: / = пробел
3. Если это Excel, то "данные > текст по столбам", если это LibreOffice, то "Data > текст по столбам".
Получится что, то вроде:
Думаю понятно!
Вопрос остался не закрытым, по поводу качественного анализа перелинковки, хочется набрать скилл гуру, подскажите качественный мануал, как правильно делать итоговую таблицу, благодарю!
Универсального способа нет (машино-автоматический), все проделывается в ручную, индивидуально. Нужно понять в каком стиле исполнение: табличный, блочная, фреймворк и т.д. Через консоль разработчика (гугл хром F12), визуально тыкаешь и понимаешь, кто за что отвечает (открываешь файл css, через тот же нотпад++ или brackets, функция: поиск/замена), в конце можно удалить не использующийся css код, здесь правда уже есть сервисы, которые помогут в полуавтомате это выполнить,
1) F12, где откроется таблица, справа в углу (...) вертикальные точки, в меню: More tools > Coverage. Бегая по страницам, будет выделяться зеленым (есть в шаблоне) и красным (отсутствует).
2) сервис uncss-online[.]ком, но тоже нужно учитывать, если динамический стиль, допустим если на главной нету .lostpassword, ты удалишь, а зайдешь на страницу восстановления пароля, то дизайн поедет, нужно учитывать все страницы.
Ну и конечно большая работа в фотошоп.