Вы, наверное, искали однотипные запросы вроде уже упомянутого поиска текста книг. Они в реальных условиях находятся элементарно, все равно 80% книг идет с lib.ru. А попробуйте-ка отыскать что-нибудь действительно стоящее! Скажем, запрос, взятый из Кубка по поиску (соответственно, на момент его проведения ответов на страницах Кубка не было) "первый генеральный консул России в Болгарии" -- в Google нет ответа на вопрос ни на одной странице (хотя сам документ есть), в Яндексе 9-я ссылка (во время Кубка 8-я). Или такое: "Что подарил царь Николай Первый одному из актеров Александрийского театра". В Яндексе вторая ссылка (во время Кубка 1-я), в Google снова ни одного ответа, хотя в базе 3 страницы с ответами. И т.д.
Перед Кубком по поиску я тестировал все 4 поисковика, и, в итоге, Яндекс шел с огромным отрывом впереди -- почти по любому информационному запросу он легко затыкает за пояс Апорт, Рамблер, Google. Никогда Google не поможет найти информацию (скажем, текст по цитате), если я помню ее примерно -- он тупо выдает 0 результатов. Яндекс играючи решает самые сложные задачи.
Возьмем ту же "Капитанскую дочку" -- скажем, вы хотите вспомнить, в каком полку был Петруша. Задаете "Петруша приписан к полку" -- Google тупо не дает ничего , а Яндекс 4-й ссылкой выдает текст "Капитанской дочки". Опять же, можно говорить, что в тексте было не "приписан", а "записан", но Яндекс-то находит ! А Google пасует.
В итоге, я подсчитывал, гораздо выгоднее по затратам времени работать с Яндексом, а уж если не получилось найти, то в этих редких случаях пользоваться Апортом и Google, реже Рамблером.
С уважением,
Александр Садовский.
[This message has been edited by funsad (edited 27-12-2001).]
Я уже писал выше, что анализ расстояния на клавиатуре между клавишами (в данном случае "д" и "й") может помочь исключить многие варианты.
Анализ контекстов, в которых это слово встречается.
Расчет вероятности ошибки такого рода и, после сопоставления частот слов, вывод о том, опечатка это или другое слово. Скажем, "дети" встречается в Яндексе 3794631 раз, а "йети" -- 5516. Даже если считать "йети" неверным написанием слова "дети", то получается, что ошибку делают в одном из 689 случаев. Довольно редкий случай, правда? Даже ошибки вида "Ельцин/Ельцын" имеют соотношение не больше 100-150.
Если выяснены контексты, где встречается данное слово (то есть это заведомо опечатка), "правильную" форму можно попробовать определить, вычисляя вес PageRank страниц с тем и другим словом. Предположительно, более весомые страницы чаще бывают грамотными.
И т.д.
У кого-то предубеждение к рекламе. Другой уже увидел нужную ссылку среди обычной выдачи. Может, рекламодатель поместил неудачный текст объявления (по моему опыту, CTR может меняться в 6-10 раз, в зависимости от текста объявления, не отходящего от темы запроса), или разместил по не лучшим словам (в зависимости от подбора слов, CTR может меняться в сотни раз).
Поэтому, на мой взгляд, CTR 3% обусловлен заметным числом неудачных объявлений с низким CTR, а не невозможностью достижения высокого CTR.
Это не аргумент, так как индексирующих поисковиков в рунете совсем не много. При этом по той же статистике SpyLog Punto на данный момент отстает по хитам в 346 раз, по посетителям -- в 66 раз. Поэтому говорить серьезно, что этот раздел каталога SpyLog действительно ставит всех на свои места, нельзя. Тут нет ни Рамблера, ни Google (если бы можно было выделить запросы на русском), да и общий список индексирующих машин едва наберет десятк имен.
Три напутствующих совета, проверенных на личном опыте:
1. Внимательно отнеситесь к словам, которые следует исключить. В принципе, лучше это сделать после первой кампании с "широким" таргетингом, чтобы можно было увидеть, какие именно формулировки дают клиентов. Но если бюджет не позволяет экспериментов, то в большинстве случаев "плохие" слова можно найти сразу -- уж очень отличаются запросы "трактор беларусь купить" и "трактор беларусь ремонт". В большинстве случаев исключением всех "плохих" слов можно сэкономить от 30% до 70% бюджета.
2. Внимательно составляйте объявление, а если бюджет позволяет, сделайте по 3-5 совершенно разных вариантов объявления (то есть меняя не только слова и их порядок, но и используя разные мотивы -- в одних случаях качество, в других цена и т.д.). При этом не забывайте о психологии восприятия рекламы -- так как объявление текстовое и короткое, рекомендую почитать советы Огилви по выбору заголовков. В итоге, уверен, если оставить только одно из 5 объявлений, CTR его будет вдвое лучше, чем у самого слабого объявления.
3. Оценивайте эффективность объявления и ключевого слова не по CTR и не по покупкам -- тут слишком велик случайный фактор. Для суммы $25, то есть 1250 показов, при CTR в 3% будет 37 посетителей, что при прекрасном OCR для оптовых товаров в 5% даст от силы 2 покупателя. Очевидно, это нулевая статистическая достоверность. Оценивайте эффективность по поведению посетителей на сайте -- есть масса моделей, позволяющих сделать достаточно точные выводы об эффективности рекламы до первой покупки.
Что почитать? Рекомендую статью Якоба Нильсена: http://www.webmascon.com/adv/4a.asp
Также могут быть полезны история провала кампании:
и обсуждение на searchegnineforums.com и на webmasterworld.com: http://searchengineforums.com/Forum28/HTML/001190.html http://www.webmasterworld.com/forum3/1427.htm
[This message has been edited by funsad (edited 26-12-2001).]
О, пора переходить на личности и начинать кулачный бой. Причем тут злопыхательство? Я указал, что система еще очень далека от совершенства. Превращение слова "йети" в "дети" не может произойти из-за опечатки (буквы на клавиатуре слишком далеко), произношение также разное, контексты, в которых эти слова встречаются, тоже не похожи. Поэтому вероятность ошибки такого рода ничтожна. Но если fuzzy-Punto этого еще не знает, значит, ему предстоит расти и расти. Логично?
Так что давайте не искать друг в друге "комплименты". Лучше потратить это время на совершенствование потенциально полезного инструмента.
Оказывается, "фуджицу" и "фуджитсу" -- совсем непохожие слова. А вот "Гейтс" и "Йейтс" -- ну прямо близнецы! Я даже обознался раз, глядя на изображение йети -- то ли йети, то ли Йейтс. Кстати, не ищите "йети" в Punto, там обитают лишь "сети", "дети", "тети", "лети", "пети" и другие загадочные создания.
В NorthernLight : http://standard.northernlight.com/cgi-bin/cl_alert.pl
и в метапоисковике ProFusion : http://www.profusion.com/alerts.asp
Статью уже выложили на сайте. Она
разбита на три части, вы можете найти их тут: