Автокорректор выборок ключевых слов (исправление опечаток)

12
LA
На сайте с 03.06.2008
Offline
105
2678

Друзья дорвейщики, пилил этот мелкий скрипт для себя, но считаю, что он может пригодится кому-то ещё.

Я использую несколько баз для выборки ключевых слов, но в некоторых базах в ключах присутствуют опечатки, что как мне, так и поисковым системам совершенно не нравится. Профита от таких опечаток сейчас ноль, только общее СЯ портят.

Поэтому сделал небольшой скрипт и выложил его в открытый доступ, чтобы все те, кому не безразлично количество трафика, заюзали его и исправили в один клик все опечатки в ключевых словах.

Можете похаять или похвалить, но надеюсь, что не останетесь равнодушными :)

Ссылка на скрипт (работает в онлайне, использует технологии Яндекса): http://saippuakauppias.github.io/autocorrector/

realefs
На сайте с 27.06.2010
Offline
87
#1

спорное решение, для словарных слов пойдет, а вот для сленга и т.д. только убьет ключи.

например мобильная игрушка "shadow fight" русскоязычным трафиком обзывается "шедоу файт" (в вариациях).

соответственно корректор из

шедоуфайт

шэдоуфайт
шедовфайт
шедоу файт
шэдоу файт
шедов файт

превращает в

шедоуфат

шэдоуфат
шедовфат
шедоу файт
шэдоу файт
шедов файт

так что неизвестно что хуже, очепятки и сленг или подобная "коррекция"

Рубероид дорожает.
LA
На сайте с 03.06.2008
Offline
105
#2

realefs, согласен, что для некоторых тематик ключевых слов всё же стоит вначале задать себе вопрос "а нужно ли мне это?" :) Для тех тематик, с которыми я работаю, это полностью себя оправдывает, т.к. там не используется лексиконов, сленга, и прочего - чисто русский язык.

V
На сайте с 31.01.2008
Offline
146
#3

Чет я ниче не понял, для чего это http://saippuakauppias.github.io/autocorrector/

если есть это https://tech.yandex.ru/speller/

Единственное что могу предположить, что здесь http://saippuakauppias.github.io/autocorrector/ ключики дорвейщиков могут оставаться в базе, подпись то у топикстартера "хитрожопый"

jpg lord.jpg
LA
На сайте с 03.06.2008
Offline
105
#4
vitvvs:
Чет я ниче не понял, для чего это http://saippuakauppias.github.io/autocorrector/
если есть это https://tech.yandex.ru/speller/

Автокорректор использует Яндекс.Спеллер. Предложу реальный кейс, который и вынудил меня написать этот "исправитель ошибок". У меня есть выборка ключевиков, где в каждом третьем ключе есть опечатка, я вставляю эту выборку в Яндекс.Спеллер (или Word, без разницы), тыкаю на кнопку проверки и у меня появляется диалоговое окно, в котором написана опечатка (одна!), и вот так из выборки в миллион ключей я сижу и на каждую опечатку вижу это сраное диалоговое окно, в котором надо нажать кнопку "Пропустить" или "Заменить". Теперь представьте мой батхерт, когда я так протыкал минут 20, а в итоге и половину выборки не обработал. За*бался! Поэтому решил запилить свой исправитель орфографических ошибок, который будет в один клик заменять все опечатки и не надо мудить и терять время на то, чтоб клацать кнопку "Заменить" в обычных проверках правописания.

vitvvs:

Единственное что могу предположить, что здесь http://saippuakauppias.github.io/autocorrector/ ключики дорвейщиков могут оставаться там

Чето паранойа вас не отпускает :) Никаких бекдоров там нету, ключи никуда не таскаются - зачем мне они? Если есть куча многомилионных баз, откуда я могу сделать выборку по своим запросам, а не воровать чужие выборки, не зная куда потом сливать этот трафик)) Да и, если присмотреться, там всё написано на html+js, так что не стоит труда потратить 5 минут, чтобы увидеть, что кроме использования яндексовского спеллера там никуда запросы не уходят и данные не передаются третьим сторонам. :)

V
На сайте с 31.01.2008
Offline
146
#5

Альфред ты что ли? Не узнал тебя сразу :)

глянул с кодом все ок, забираю свои слова обратно

заметил еще спеллер от яши понимает несколько строк в запросе

http://speller.yandex.net/services/spellservice.json/checkText?text=%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%B5%D0%B4\n%D0%B8%D1%81%D1%87%D0%BE&callback=fix_spell

дабы поберечь лимиты на запросы, а они там 10 000 в сутки, можно доработать

N0
На сайте с 11.09.2010
Offline
126
#6

Тоже делал такой, на php. Выкладывал на баблоруб. В запросе по 20 ключевиков отсылает

LA
На сайте с 03.06.2008
Offline
105
#7
vitvvs:
Альфред ты что ли? Не узнал тебя сразу :)
глянул с кодом все ок, забираю свои слова обратно
заметил еще спеллер от яши понимает несколько строк в запросе

http://speller.yandex.net/services/spellservice.json/checkText?text=%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%B5%D0%B4\n%D0%B8%D1%81%D1%87%D0%BE&callback=fix_spell

дабы поберечь лимиты на запросы, а они там 10 000 в сутки, можно доработать

ак я, ктож ещё то :) Как VVS Edition твой? Давно дело было, но вдруг чего выкрутил из этого под себя? Я вот как Super Pack забросил, так 5 лет не лез в блек сео, скиллзы качал, сейчас опять время пришло вернуться обратно, перекручиваю чужие наработки, делаю полуприват интересный :-) Если дело хорошо пойдет, то через полгода опять бахну тут бомбу ;-)

По поводу спеллера - да, там можно и по несколько строк за раз обрабатывать, я самый примитивный вариант сейчас сделал. Если будет кто-то желающий, кто знает git и js, то пущай засылают пулл-реквест там, я допилю и одобрю. Если нет, то по мере надобности сам допишу, но не обещаю. Там ещё пару плюшек можно завернуть сверху, если захотеть.

V
На сайте с 31.01.2008
Offline
146
#8

ой да я бомбу та накатил, хочешь в личку отпиши покажу

Здесь если кто помнит по желанию скрин только оставить смогу, продавать не буду

я всегда за развитие этой темы, но больше не в паблике, в паблике могу только показать скрины, палить ничего не буду

ps skype отпиши сразу пообщаемся или добавляйся мой скайп мой ник здесь

5P
На сайте с 15.03.2010
Offline
125
#9

что у вас за бомбы такие? намекните плиз) любопытно

›› CBD Partners (https://u.to/j-WKFw)
LA
На сайте с 03.06.2008
Offline
105
#10
5LJRRP:
что у вас за бомбы такие? намекните плиз) любопытно

бомба в первом посте, больше тут ничего нету )

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий