Опечатки. Мысли.

Kislov
На сайте с 29.04.2006
Offline
185
794

http://company.yandex.ru/news/2008/0516/

Яндекс находит нужные сайты даже по запросам с опечатками. Ежедневно новая версия поиска выявляет опечатки в 2,5 млн запросов и подсказывает пользователям правильное написание. Опечатки в миллионе запросов исправляются автоматически.

Вот я и задумался, как очистить базу от опечаток. Есть ли софт готовый?

booch
На сайте с 06.03.2007
Offline
125
#1

Такая фича давно была замечена.

Да и тема была недавно, где чел спрашивал подобный софт.

Идея года! Такого в онлайн играх ещё не было. (http://ams-ter.mybrute.com) Перспективный блог (http://seoamster.ru)
LL
На сайте с 27.09.2007
Offline
39
#2
Kislov:
Вот я и задумался, как очистить базу от опечаток. Есть ли софт готовый?

качественно это сделать можно, только если самим же яндексом и проверять, ну и гугл задействовать: пачка проксей, серв, скрипт десятиминутный - геморно и долго для огромных баз, зато чистые будут :)

-EX-
На сайте с 07.07.2006
Offline
180
#3

Хм... Неужели этих самых опечаток в базе настолько много, что от этого можно потерять ощутимое кол-во трафика?

С уважением, Андрей aka EX
ciber
На сайте с 04.01.2008
Offline
215
#4

Потеря трафа действительно некислая, но удалением очепяток из базы проблему не решить. А даже наоборот усугубить можно, акромя яши есть еще рама и гоша.

Kislov
На сайте с 29.04.2006
Offline
185
#5
la-la-la:
качественно это сделать можно, только если самим же яндексом и проверять, ну и гугл задействовать: пачка проксей, серв, скрипт десятиминутный - геморно и долго для огромных баз, зато чистые будут

Этот метод реализации мне и пришел в голову. Если бы кто-нибудь открыл онлайн-сервис. Там можно подключить и кеширование результатов и поработать с морфологией.

-EX-:
Хм... Неужели этих самых опечаток в базе настолько много, что от этого можно потерять ощутимое кол-во трафика?

Базу Пастухова полистай - увидишь.

Kislov добавил 21.05.2008 в 16:13

ciber:
Потеря трафа действительно некислая, но удалением очепяток из базы проблему не решить. А даже наоборот усугубить можно, акромя яши есть еще рама и гоша.

Я в первом посте не правильно выразился. Цель - исправить опечатки.

-EX-
На сайте с 07.07.2006
Offline
180
#6
Kislov:
Базу Пастухова полистай - увидишь.

Ее не имею... Сам собираю базу...

ciber
На сайте с 04.01.2008
Offline
215
#7
Kislov:


Я в первом посте не правильно выразился. Цель - исправить опечатки.

И что тебе это даст кроме уменьшения кол-ва страниц в серпе? В базе пастухова присутствуют и правильно написанные и написанные с ошибкой. Страницы с очепятками неплохо рулят в тойже раме. и от туда неплохой трафик. да и яша не все очепятки исправляет

fogmaker
На сайте с 13.02.2007
Offline
41
#8
Kislov:
Я в первом посте не правильно выразился. Цель - исправить опечатки.

Сереж (извини за обращение, если что), а можешь просветлить - зачем очепятки в базе корректить? Мб и не прав, конечно, но, считаю, что они имеют право быть. И даже очень. Это касается не только енотного сегмента, но и рушного. Магадан - Магаданом, но релевантность запросу не отменял никто пока еще. Или я не прав?

…waiting for a miracle. (https://fogmaker.net/)
Kislov
На сайте с 29.04.2006
Offline
185
#9
ciber:
И что тебе это даст кроме уменьшения кол-ва страниц в серпе? В базе пастухова присутствуют и правильно написанные и написанные с ошибкой. Страницы с очепятками неплохо рулят в тойже раме. и от туда неплохой трафик. да и яша не все очепятки исправляет
fogmaker:
Сереж (извини за обращение, если что), а можешь просветлить - зачем очепятки в базе корректить? Мб и не прав, конечно, но, считаю, что они имеют право быть. И даже очень. Это касается не только енотного сегмента, но и рушного. Магадан - Магаданом, но релевантность запросу не отменял никто пока еще. Или я не прав?

Как-то об этом я не подумал. Тогда смысла нет их исправлять. Спасибо за объяснения :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий