Антоний Казанский

Антоний Казанский
Рейтинг
802
Регистрация
12.04.2007
Должность
Частный интернет-маркетолог и SEO специалист
Интересы
Интернет-маркетинг, SEO, интернет реклама
Подробности на сайте https://akazansky.ru
Bjoerndalen #:
я говорю что Clean-param не выход

Тогда либо Disallow: /? либо noindex на все страницы, которые начинаются с ?.

Самая главная фишка (для Яндекса) - это то, что в Яндексе без нужного CTR по рабочим запросам поисковая видимость по этим запросам расти не будет. На этом базируется накрутка и всё быстрое продвижение в Яндексе.

Вторая главная фишка - это если кроме CTR вы ещё организуете стабильные конверсии, то станете лидерами топа.

Текстовая плотность, перелинковка, ссылки, объёмы текстов, всякие pagespeed-ы для Яндекса глубоко вторичны.

Bjoerndalen :
Это только часть, набор символов после знака "?"

Приведите полный список.

Пока всё покрывается правилом:  yandex-source&hhtmFrom


Bjoerndalen :
набор символов после знака "?" может быть совершенно любая, так что закрытие их от индекса через Clean-param не выход.

Если эта разница в части после "=", то это неважно, какой там набор символов.


Bjoerndalen :
На таких страницах у меня естественно стоит rel=canonical на основную, но яндексу плевать, при добавлении в индекс он пишет "Страница попала в поиск, поскольку во время её сканирования роботом её содержимое существенно отличалось от содержимого страницы по адресу", хотя естественно содержимое страницы идентично основной, но он видимо не умеет это определять.

Правильно, потому что это не ультимативное правило, это лишь рекомендация и Яндекс может переопределить правило (как в вашем случае).


Bjoerndalen :
Также недавно попробовал закрыть их в роботсе строкой Disallow: *? , Яндекс сначала выкинул часть из индекса основываясь на этом правиле, затем опять стал добавлять, то есть и это ему плевать.

Пробуйте Disallow: /?


Bjoerndalen :
Поддержка несет какую-то пургу противоречащую друг другу из сообщения в сообщение.

Что конкретно друг другу противоречит? Приведите последовательно и точно, что у вас вызывает противоречие.


Bjoerndalen :
Склоняюсь к тому чтобы наглухо закрыть все подобные страницы метатегом noindex, но это крайний случай.

Да, это тоже вариант.

Brat_Sergij #:
У кого-нибудь есть список ботов-краулеров, наподобие SemrushBot, AhrefsBot и т.п.? Тех, что занимаются анализом сайта, и которых можно заблочить через robots.txt

Только не в robots-е, а в htaccess:

---

SetEnvIfNoCase User-Agent "Abonti|AspiegelBot|aggregator|AhrefsBot|Aport|asterias|Baiduspider|BDCbot|bidswitchbot|Birubot|BLEXBot|BUbiNG|BuiltBotTough|Bullseye|BunnySlippers|Butterfly|ca\-crawler|CamontSpider|CCBot|Cegbfeieh|CheeseBot|CherryPicker|coccoc|CopyRightCheck|cosmos|crawler|Crescent|CyotekWebCopy/1\.7|CyotekHTTP/2\.0|DataForSeoBot|DeuSu|discobot|DittoSpyder|DnyzBot|DomainCrawler|DotBot|Download Ninja|EasouSpider|EmailCollector|EmailSiphon|EmailWolf|EroCrawler|Exabot|ExtractorPro|Ezooms|FairShare|Fasterfox|FeedBooster|Foobot|Genieo|GetIntent\ Crawler|Gigabot|gold\ crawler|GrapeshotCrawler|grub\-client|Harvest|hloader|httplib|HTTrack|humanlinks|HybridBot|ia_archiver|ieautodiscovery|Incutio|InfoNaviRobot|InternetSeer|IstellaBot|Java|Java/1\.|JamesBOT|JennyBot|JS-Kit|k2spider|Kenjin Spider|Keyword Density/0\.9|kmSearchBot|larbin|LexiBot|libWeb|libwww|Linguee|LinkExchanger|LinkextractorPro|linko|LinkScan/8\.1a Unix|LinkWalker|LinkpadBot|lmspider|LNSpiderguy|ltx71|lwp-trivial|lwp\-trivial|magpie|Mata Hari|MaxPointCrawler|MegaIndex|memoryBot|Microsoft URL Control|MIIxpc|Mippin|Missigua Locator|Mister PiX|MJ12bot|MLBot|moget|MSIECrawler|msnbot|msnbot-media|NetAnts|NICErsPRO|Niki\-Bot|NjuiceBot|NPBot|Nutch|Offline Explorer|OLEcrawler|Openfind|panscient\.com|PostRank|ProPowerBot/2\.14|PetalBot|ProWebWalker|ptd-crawler|Purebot|PycURL|python-requests|Python\-urllib|QueryN Metasearch|RepoMonkey|Riddler|RMA|Scrapy|SemrushBot|serf|SeznamBot|SISTRIX|SiteBot|sitecheck\.Internetseer\.com|SiteSnagger|Serpstat|Slurp|SnapPreviewBot|Sogou|Soup|SpankBot|spanner|spbot|Spinn3r|SpyFu|suggybot|SurveyBot|suzuran|sqlmap|SWeb|Szukacz/1\.4|Teleport|Telesoft|The Intraformant|TheNomad|TightTwatBot|Titan|toCrawl/UrlDispatcher|True_Robot|ttCrawler|turingos|TurnitinBot|UbiCrawler|UnisterBot|Unknown|uptime files|URLy Warning|User-Agent|VCI|Vedma|Voyager|WBSearchBot|Web Downloader/6\.9|Web Image Collector|WebAuto|WebBandit|WebCopier|WebEnhancer|WebmasterWorldForumBot|WebReaper|WebSauger|Website Quester|Webster Pro|WebStripper|WebZip|Wotbox|wsr\-agent|WWW\-Collector\-E|Yeti|YottosBot|Zao|Zeus|ZyBORG" bad_bot

Deny from env=bad_bot

--

annaov #:

Вижу, что программа имеет два вида данных, в процессе работы.

1. Непосредственно уже полученные (распарсенные).
2. Выставленные в очередь, по которым она идет (могут опережать первые в 2-3 раза по объему)

Вряд ли стоит разделять, тут просто надо понимать, что сначала краулер находит определённый объём ссылок, потом распаршивает их, обрабатывает доп. линки, сравнивает их с уже имеющимися, добавляет новые и закидывает их в очередь.

Поэтому в очереди вы видите одну цифру, а в обработанном перечне уже результат обработки.


annaov #:
Когда проект большой, бывает, что именно окончание его идет очень нудно (где счет перевалил за миллион(ы)

За миллионы? Тогда здесь конечно нужны хорошие мощности.


annaov #:
Как получить, на экспорт, эту очередь еще непроверенных данных, ведь где то она в базе программы лежит?

Думаю, что никак, в программе, на сколько я знаю, это не предусмотрено.

Если найдете способ - расскажите :)


annaov #:
Нет ли в ней встроенной возможности себя пересохранять (дамп обхода), например, каждый час. А то обидно.

По времени такой возможности нет.

На мой взгляд, можно примерно определить в какой период (т.е. на каком объеме она падает) и потом вручную на рабочих интервалах делать паузы, сохранения и возобновлять с точки остановки.

Скорее всего программа падает, потому что исчерпывает рабочую память или отведённое ей пространство, поэтому я и сказал, что здесь нужны хорошие мощности. Парсить миллионники - задача конечно не простая.

geekboris #:
спасибо за мнение, 

Пожалуйста.


geekboris #:
зп на испытательный указана.

Да, одна цифра указана, но будет лучше, если соискатель сразу увидит за какую сумму ему предлагается работать на испытательном сроке и на какую сумму он может рассчитывать после прохождения испытательного срока.

Формулировки вида "как проявит" или "в зависимости от заявленных скиллов" как правило не мотивируют, потому что оставляют право работодателю платить например на 5 тыс. рублей больше после испытательного срока.


geekboris #:
касательно работы... а почему не будет то? работы там очень и очень не мало и именно сеошной. 

Пожалуйста. Разъясню и как SEO-шник и как человек с опытом управления, который формировал команду и нанимал SEO-шников.

Отвечу - человек будет проявлять свои лучшие качества только в зоне своих компетенций. SEO-шник привык работать с клиентским сайтом, поэтому весь свой опыт, инструментарий, приёмы и наработки он будет надеяться направить на сайт.

Когда специалиста загружают смежной работой - да, это может быть допустимо в рамках доп. нагрузки, но это не может быть основной его частью работы, поэтому не задействуя и не реализуя весь свой потенциал, даже если он придёт и какое-то время проработает (если вдруг ему была срочно нужна работа и он попал к вам) - далее он будет искать себе более удобное и перспективное для себя место.

Поэтому я вам и посоветовал искать специалиста по продвижению маркетплейсов - это другой профиль и другая специфика, несмотря на схожие черты.

Brat_Sergij :
Подскажите, какой онлайн сервис проверки уникальности лучше использовать

Я пользуюсь Адвего, мне хватает :)


Brat_Sergij :
дает наиболее достоверные результаты?
Brat_Sergij :
Например, для одного и того же текста text.ru выдает 38,28% уникальности, в это же время content-watch.ru и адвего - 85%. Кому верить - непонятно...

Верить глазам и собственному разуму - смотрите какие источники используют программы и какие там фактически совпадения по неуникальности. 

Если одна программа использует рабочий источник, а другая не использует - вот вам основание для различия. 

Кроме того - проверяйте вручную через цитаты части текста и сравнивайте с результатами обработки используемых программ.

Жорик #:
А какая микроразметка подойдет для информационно-образовательных статей? Аля H1 -> тело статьи. Дайте ссылочку, плиз,

Пожалуйста, ссылка.

Спускаетесь вниз, там есть примеры, 


Aisamiery #:
Вы так и не уловили суть к сожалению

Cуть чью? Что в вашем понимании суть? Я вам последовательно, ответственно, содержательно и честно ответил на все ваши вопросы и замечания. Потратил на это достаточно времени. Более того - помог определиться с вашим личным вопросом, в ответ я не получил даже банального спасибо.

Видимо вы разочарованы исчерпаемостью  своих доводов, поэтому снова начинаете опускаться до огульных критических замечаний. 


Aisamiery #:
в текущей момент занимаетесь какой то демагогией

Это не демагогия, это чёткие и содержательные ответы на ваши вопросы. Вам, похоже, они не нравятся, но это уже ваша личная реакция и позиция.


Aisamiery #:
это CMS но не CMS

Да. Потому что Тильду никто полноценной CMS не называет, она всегда была и остаётся конструктором и онлайн сервисом, даже несмотря на то, что функционально сайт можно перенести на отдельный домен и самостоятельный хостинг.

Тут всё предельно понятно и практически обоснованно.


Aisamiery #:
плаваете и путаетесь в понятиях

Никаких плаваний и запутываний, всё очень конкретно.


Aisamiery #:
хотите делать работу заново которую на самом деле не делали (вы не верстали и не натягивали на тильду, а все что натянули и сверстали можно экспортировать), так что по сути вы сэкономили 3 месяца фулстек программиста и этот бюджет на старте.

Какую-то ерунду пишите.

Какие 3 месяца, какой экспорт? Я вам ещё раз говорю (вы не слушаете), CMS или даже фреймворк выбирается под конкретную задачу.


Aisamiery #:
Вы вначале говорите что клиенты рассчитывают на рост и у тильды нет возможностей, но рост ваш ограничен всего несколькими десятками тысяч рублей.....

И? И что за многозначительно многоточие? Вы точно также указали общий бюджет 150K на свой проект.

Первые 2-3 месяца у клиента может быть одна задача, через пол года - другая. По возможности клиент накапливает рабочие бюджеты и мы подключаем доп. задачи. Что за странное онемение?


Aisamiery #:
в общем вы пытаетесь на придумывать кучу требований которые максимально не подойдут тильде (при том именно ей)

Почему напридумывать, всё это документально обосновывается и иллюстрируется в прототипе.


Aisamiery #:
при том они настолько расплывчатые, что вы смогли притянуть только коменклатуру и фильтры по сути

Конкретные примеры - в конкретных рабочих примерах, я вам в общих чертах объясняю как это реализуется.

Хотите совсем конкретные примеры - сайт выше я вам уже давал.


Aisamiery #:
но для этого есть другие инструменты из категории которая решает такие же проблемы как и тильда только с фильтрами и номенклатурой

Какой-то набор слов.


Aisamiery #:
Есть даже "селфхостед тильда" которую можно поставить на свой хостинг и не платить абонентскую плату а еще можно допиливать под любые нужды вэбмастера, но это я вам оставлю на собственное гугление если уж будет интересно.

Я эти селфхостед Тильды практически через раз отфутболиваю в клиентских заявках. Поверьте, все это я уже неоднократно видел и отдельные сайты на Тильде на самостоятельном хостинге никакой погоды здесь не делают.

В моей рабочей реальности ни один из знакомых мне программистов модернизировать и костылить Тильду не будет, она заслужила себе репутацию конструктора для лендосов и небольших визиток на несколько страниц. 

Проекты с перспективой развития на месяцы и годы вперед не рассматриваются на Тильде, ни мной, ни остальными SEO студиями и SEO специалистами. Не верите - поспрашивайте специалистов вне этого форума, пообщайтесь со студиями - вы получите практически одинаковые ответы. 

Просто возьмите на себя этот труд и вы поймете, что вы взялись за неблагодарное занятие спорить с большинством. 

То, что вы старательно отстаиваете позицию - ваше личное дело, я же говорю за себя и за устоявшуюся практику.

Коллеги выше лишь подтверждают мои слова, но вы решили снова занять позицию гордого нонконформизма.


Aisamiery #:
Предлагаю на этом демагогию закончить

Для меня это не демагогия, для меня это содержательный разговор.

Впрочем, закончим.

callidus #:
Следуйте тренду ))

Ну давайте попробуем :)


callidus #:
По теме: конечно, 2 вхождения ВЧ ключей в точной форме

Поисковые системы определили новые квоты по 2 ВЧ на страницу? :)

Всего: 12940