Если вы знаете тему, то в вашей голове уже есть много много запросов по ней... достаточно подробно написать.
Если нет, то
Идёте в какой-нибудь fastkeywords.biz (за справкой гуглите)
Вбиваете типа гриб* (морфологии он не понимает).
Скачиваете .txt или др.
Сортируете...
... очень очень косвенно о конкурентности может говорить количество найденных документов по этому запросу.
Про НЧ (не путать с НК) есть стандартные заблуждения (провоцируемые вордстатом)... пока не увидели НЧ-толпу в своей стате заходов. Вордстат не показывает реального порядка слов (поскольку это не нужно клиентам Директа) и то, что реже 6 (вроде бы) показов/мес. Но есть темы, в которых заходов по запросам ~1/мес — больше, чем по СЧ (у этого форума так). Вам в этом придётся разобраться самостоятельно. Но яндексоиды говорили о ~половине неповторяющихся запросах/день... в месяц наверное 1/3, в год 1/4 ?
Ещё одной проблемой является то, что мы имеем дело с цыфрой 1, а реально — с (1±1), т.е. этот запрос может оказаться неповторимым, поэтому и нужна какая-то совсем другая мера для НЧ запросов (пытался об этом поговорить в своей прошлогодней теме, но безрезультатно), иначе думать об них — получается частично.
Вот вот!
И есть примеры, как ему насовали того, чего нет.
Эту задачу ПС себе не ставят как первостепенную. Ну найдут 115-ю копию, это скорее всего копипаст...
А уже есть вопросы:
Что если у меня много тегов <noindex> в коде?.. что тогда в форму совать?
Что если хочется подправить текст? (а тут ещё одна возможная дыра)
Да хотя бы себе самим.
После введения матрикснета они громко говорили, что мол это качественный скачок и т.п... а на самом деле это было лишь усложнение лабиринта из всего того же самого. Человек, т.е. рерайтер... этого бота обходит очень легко (и в свободном мире тоже). Так что на ложку оригинальности будет создаваться бочка псевды (для матрикснета). Ну, и опять будут срочно нужны сцылки, теперь уже для тица.
Качественного скачка технологии поиска... не получается и не предвиделось изначально. А значит — всяческие миралинксы и т.п. догонят и засрут. А Я.дебилы ужесточат АГС — и будут больше гробить правильных сайтов (по неизбежной ошибке). Т.е. это имеет значение — чья технология выигрывает — поисковика или ГСтроя. Хотя искателю будет виден неизбежный баланс.
ПС — крупнейший игрок и... формирователь тенденций. И за неправильные — ответственности может возникнуть не на одну несчастливую инкарнацию.
Не отсеивая.
Эта форма фактически является признанием того, что они даже с копипастом не всегда могут автоматом разобраться — кто первоисточник. А уж с г-рерайтом и подавно. И даже бесполезно показывать им на это, они годами не реагируют, ожидая жареного петуха.
А придётся же... монополисту.
Да, поспешил. В выдаче может быть то, чего в индексе (в кэше) нету.
Но есть повод задуматься о реальном поведении бота.
404 — не гарантия непопадания в индекс. Там реально 404.
HTTP/1.1 404 Not Found
ps /ru/forum/647967
Дыра №1
Тексту на новом сайте заранее отказано в праве считаться оригинальным.
Рерайт искалки различать так и не научились.
Поэтому, рерайтеры пойдут на молодые сайты, униКализируют, добавят в форму, получат подтверждение... и лучшую позицию. Ибо:
Современным ПС пора бы явно признаться в том, что именно они и являются основной причиной ГСтроя — давно и просто обогнавшего все остальные тенденции...
.. там Сегаловичу черти не снятся ещё?
А бот не умеет это отслеживать прямо. Только по косвенным признакам, поэтому регулярно удаётся найти то, что противоречит рекомендациям — писанным для людей.
А поскольку, всё будет опять «в интересах ползателя» (часто выдуманного), то ... ГСтрой, ищите дыры.
http://www.google.com/search?ie=UTF-8&hl=ru&q=site:404.yandex.ru
Определение НЧ не может быть таким, как сказано выше. А в вордстате много чего просто нет и не может быть, поскольку этот сервис не для подбора запросов.