Программа очистки русских кеев

Kislov
На сайте с 29.04.2006
Offline
185
#81
kornet:
wordstat яндекса серверным скриптом

Если запрос там есть, значит его кто-то ввел. Не все грамотные, отсюда и опечатки.

mih4
На сайте с 15.04.2007
Offline
145
#82

предлогаю повыкладывать свои BadWords.txt по разным тематикам.

выкладываю которую начал собирать по медицине.

txt BadWords.txt
K
На сайте с 08.04.2008
Offline
32
#83
Kislov:
Если запрос там есть, значит его кто-то ввел. Не все грамотные, отсюда и опечатки.

Да вполне возможно, я с Вами согласен, но ру доры делаются в основном под яндекс.

Вот смотрите что получается - запрос в Яндекс в случае с яндексом поэтому смысла в таких кеех для него нет, кроме того мне кажется большое число грамматических ошибок может быть дополнительной причиной быстрого бана.

С гуглем конечно другая ситуация - запрос в Google но если учесть процент трафа с него и процент неверно набранных запросов, то смысла в них я не вижу.

Это конечно мое личное мнение, но я думаю, если сделать такую опцию в программе, то она будет востребована…..

Zebrum CMS со скидкой (http://zebrum.ru/?c=D25CCA4F76)
Kislov
На сайте с 29.04.2006
Offline
185
#84

kornet, Вы только представьте чего будет стоит научить софт русскому языку.

Egi[s]
На сайте с 08.04.2007
Offline
244
#85

Идея есть, но операция по такой проерки потребует много времени, быстрого интернета и много трафика))

K
На сайте с 08.04.2008
Offline
32
#86
Kislov:
kornet, Вы только представьте чего будет стоит научить софт русскому языку.

Я понимаю что научить программу русскому языку очень сложно, но нам и не надо этого делать, нам не нужна правильная стилистика и орфография, нам надо что б не было грамматических ошибок в словах, я так понял что Egi, хочет реализовать онлайновую проверку грамматики в программе, но мне кажется не получится сделать по той причине что у каждого вебмастера в определенных тематиках есть слова которых нет в словарях русского языка, поэтому может попробовать сделать так:

Берем словарь русского языка, благо в инете их навалом, пусть он будет в файле GoodWords.txt, при проверке слова из запросов сравниваются с теми что есть в словаре, если слова нет то ключевик удаляется и записывается в файл log.txt, после обработки просматриваем лог файл и если считаем что кей по слову с грамматической ошибкой удален не верно добавляем нужное слово в файл GoodWords.txt, в следующий раз такие запросы удалены не будут таким образом мы обучаем программу нужным нам словам, после нескольких прогонов разных баз получаем рабочий словарь в файле GoodWords.txt. Важно что при таком алгоритме работы можно научить программу не только русским но и английским словам это смешанные запросы со словами типа web, online и т. п.

Эту опцию можно сделать отключаемой, и файл GoodWords.txt выкладовать дополнительно, кому он не нужен просто не будут его скачивать

[Удален]
#87

ага примерно 180к слов + склонения падежи и т.п. очень весело. подождем до понедельника вобщем.

ciber_tmp добавил 24.04.2008 в 04:23

Kislov:
Если запрос там есть, значит его кто-то ввел. Не все грамотные, отсюда и опечатки.

К сожалению доры на опечатках теперь не рулят есле конечно серфер не нажмет на "Запрос исправлен"

Добрый дорвейщик
На сайте с 11.12.2007
Offline
83
#88
Kislov:
kornet, Вы только представьте чего будет стоит научить софт русскому языку.

До уровня мсофиса можно. А он (уровень), у него (офиса) не такой уж и низкий ;).

Egi[s]
На сайте с 08.04.2007
Offline
244
#89

моим способом можно будет обрабатывать около 10к кеев за час, качество на высоте, может кто сам догадается, что я придумал :)

Добрый дорвейщик
На сайте с 11.12.2007
Offline
83
#90
'Egi[s:
;3165497']моим способом можно будет обрабатывать около 10к кеев за час, качество на высоте, может кто сам догадается, что я придумал :)

Постинг в Яндекс и последующий его парсинг с целью выявления был ли исправлен запрос...

ПС. Я так наугад ляпнул 😂

ПСПС. Кеи подбираются один раз в жизни (ну грубо говоря), зачем такая скорость нужна?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий