Возможно лучший в мире дорген

N0
На сайте с 11.09.2010
Offline
107
#191
billypelegrini:
Не совсем, это надо показыать пошагово.

Если это действительно работает (даёт траф и деньги), то по шагам я бы не показывал в паблике. Иначе, что помешает конкурентам или любому прогеру это повторить? (ну кроме сложности).

"сделать то-то" - по таким запросам много хороших статей и можно составить текст из нескольких статей.

Дорген пока не по любым тематикам работает? А что делать с тематиками, в которых мало нормальных текстов, но при это трафа тонны? Типа Download (куча одинаковых или слегка отличающихся текстов по ключу).

"viewsonic vp2770-led manual"

"how to write a good compare and contrast essay"

"скачать ведьмак 3"

-)

ps: посмотрел выдачу по "скачать ведьмак 3", а там все тексты в гугле разные, на первый взгляд. Видимо давно не заглядывал в выдачу.

"И так шаг за шагом текст по опорным точкам предложений." - крайне затратно парсить постоянно гугл. И прокси нужны крутые. Или есть своя технология парсинга без проксей?

Смутно припоминаю, что я уже видел такой дорген.

billypelegrini
На сайте с 20.02.2019
Offline
33
#192
Neo00007:
Если это действительно работает (даёт траф и деньги), то по шагам я бы не показывал в паблике. Иначе, что помешает конкурентам или любому прогеру это повторить? (ну кроме сложности).

Это слишком сложно чтобы воспроизвести в продакшне без мегаскилов. Потому публикую, и потмо гугл все равно перебанит половину, то есть там и рикменеджмент и эконимуку включать.. без скилов это просто набор букв, потому делюсь не стесняясь.

---------- Добавлено 29.02.2020 в 16:45 ----------

Neo00007:
"И так шаг за шагом текст по опорным точкам предложений." - крайне затратно парсить постоянно гугл. И прокси нужны крутые. Или есть своя технология парсинга без проксей?

Я паршу кажись 7-9 поисковиков, этого хватает чтобы не попасть на прокси.

Добавим оптимизацию. Итого --предложжение из 3-4 кусков по мофологии. И там ещё много чего можно убрать, так вкратце получается рабочий интрумент, не лабораторный.

Dos3
На сайте с 07.01.2011
Offline
360
#193

мне че одному кажется это бредом ? :D

billypelegrini
На сайте с 20.02.2019
Offline
33
#194

ты просто не вникал в суть))

Dos3
На сайте с 07.01.2011
Offline
360
#195
billypelegrini:
Рерайт по сути

рерайт :D

уже давно в доргенах и морфология, и стыковка по запятым... я еще у себя сравнение фраз в % делал

зачем каждый раз в поисковик лезть, почему не базу наполнять ?

как быть с другими языками, тот же арабский ?

да и на Русском не для всех тематик пойдет/нужно

---------- Добавлено 29.02.2020 в 17:13 ----------

в итоге все равно приходим к агрессивному сливу, редирект, клоакинг итд

billypelegrini
На сайте с 20.02.2019
Offline
33
#196

Базу очень большая получается. Я хотел далеть базу но для доргена сильно овер.

Я беру просто верх поиска и замешиваю, тупо спин. Все выкладки по тексту больше эксперимент, тупо нерентабельно. И гонять всем подряд, через дни отчек, дальше забаненные убираются а остальные дальше прогон и допостинг.

---------- Добавлено 29.02.2020 в 18:13 ----------

Dos3:
я еще у себя сравнение фраз в % делал

не помню как называется алго, тоже делал

---------- Добавлено 29.02.2020 в 18:16 ----------

Dos3:
как быть с другими языками, тот же арабский ?

тот алго что описал выше с любыми языками катит.

N0
На сайте с 11.09.2010
Offline
107
#197
Dos3:
я еще у себя сравнение фраз в % делал
billypelegrini:
не помню как называется алго, тоже делал

similar_text и levenshtein.

Для вывода похожих ключей - норм. Для сравнения предложений или сравнения ключа с предложениями - не очень.

billypelegrini
На сайте с 20.02.2019
Offline
33
#198

Да, Левеншетйном делал, но это сечас не работает, классические стат- алгоритмы уже просто типа энциклопедии, поиск не на них работает.

Dos3
На сайте с 07.01.2011
Offline
360
#199
billypelegrini:
Базу очень большая получается. Я хотел далеть базу но для доргена сильно овер.

ну так повторные предложения убирать

а зачем одно и тоже парсить снова и снова, в пределах тематики...вопрос риторический

---------- Добавлено 29.02.2020 в 20:34 ----------

Neo00007:
Для вывода похожих ключей - норм. Для сравнения предложений или сравнения ключа с предложениями - не очень.

норм - для поиска предложений с фразами близкими к ключу, не используя морфологию для этого

хотя я года 4 назад побаловался и использовал дальше просто сниппеты

billypelegrini
На сайте с 20.02.2019
Offline
33
#200

Dos3, такое ощущение что ты или теоретик что врядли или работаешь чисто на готовом софте, то есть свой софт не производишь и никак с группами программеров вообще не.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий