la-la-la

Рейтинг
39
Регистрация
27.09.2007
Dmytro:
... Из сделанных на фришках (народ, почта, бай, бум) около 30 доров в индекс попали только два, да и то лишь с 1 главной страницей. Собственно, за что можно получить бан автоматом: шаблон (это спорно, да и у человека, который учил меня тогда дорвейному делу, на этих же шаблонах доры вылазили без проблем ...

это сколько лет назад тот человек учил тебя доры на фрихостах "бай, бум" делать?

да, особенно жди, пока они на почте вылезут

Kolyaj:
И не дай бог Алекс Экслер упомянет слово "эротика" у себя на сайте, у него будет только порно-траф.

на том сайте еще много чего можно найти... и, если Алекс Экслер упомянет на странице своего сайта слово "эротика", кроме того станет слишком часто упомянать "стриптиз видео" и "фото девушек", то логично было бы не показывать картинки с его сайта при поиске с семейным фильтрм, особенно картинки со страниц со словами "эротика", "стриптиз", etc. Имхо

семейный фильтр жжот

Pall:
Епт. Ну ка расскажите мне, как алгоритм будет оценивать категорию картинки (адалт-не адалт), если она имеет тайтл "Фильм", альт "Фильм" и ближайшее окружение текстом к ней тоже "Фильм"? 🙅
З.Ы. За успешную попытку распознавания порнушки на картинках безоговорочно выдают нобелевку, кстати. :) За 10 лет никто так и не получил и даже не пытался, по моему....

оценивать можно ресурс в целом, на сайте, откуда дернута эта картинка, можно найти "эротика"...

в тему: http://www.nr2.com.ua/technology/174049.html

---

когда-то (уж точно больше года назад) о программе читал где-то, которя выявляет картинки с изображениями голых тел, анализируя фрагменты картинки цвета человеческой кожи (их кол-во на картинке, положение и т. п.). Точно не вспомню где читал и как называлась прога, но с задачей, судя по описанию, справлялась достойно

response:
кстати, именно хорошую статью а не текст можно таки выдернуть на автомате. попробовать во всяком случае. Отталкиваться, например, от того утверждения, что хороший документ есть сеошный документ, соотв. ввести критерии на семантику, и попробовать фильтровать подобным образом. Думаю может получиться нормалек.

это, конечно, что-то умное... в общем можно и так, товарищ проктолог 😂

только по такому признаку можно найти, а не выдернуть... выдернуть статью без мусора никак не получится (конечно, нет ничего невозможного, но...), к тому же найденное (именно по такому прзнаку) в большинстве статьей являться не будет, уж лучше искать раздел "Статьи" на сайте

response:
А про настройку под конкретные источники я тебе так скажу, что ты можешь всю ночь парсить сайт, и потом увидеть, что оказывается контент там заюзанный и непригодный, а пробники, которые ты брал до этого, ну они просто были исключением, которое не попало в индекс (хотя ты сам наверняка с подобным сталкивался)

ох и о разном мы говорим...

response:
Я когда-то давно собирал порно рассказы, так я почти весь стульчик собрал вручную в опере минут за сорок, и этого контента хватило не на одну пачку говнотекстов.

вот так Культ Технологии, наверное, давно это было :)

response:
тебе чтобы найти достаточно контента для своих доров, в принципе и пары недель "поиска источников на автомате" хватит, без особых заумностей.

мне хватит десятиминутного затачивания парсера под несколько источников, которые я найду за минут 5 и двухчасовой работы парсера - и вообще без заумностей :)

но мы о разном, я о невозможности полной автоматизации собирания статей, именно статей, а не просто текста, это не про доры

response:
некоторые не парятся и пытаются выглядеть гуглем

ага, попутно рождая темы в разделе гугла "Гугл ложит мой сервак, не смотря на роботс, что мне делать?"

=> поиск источников статей на автомат ставится как нефиг делать ? 🙄

видели мы кравлеры, только не понял, к чему это было

школьнег_29A:
ага, онотолей неодобряет )

онотоле меня преследует!!1 сегодня в офлайне 2 надписи встретил, это какой-то знак 100%

универсальный парсер статей

если задача - собрать статьи, чтобы использовать их именно как статьи, а не набивка для доров, то полный автомат никак невозможен... лучше потратить минуту на составление регэкспа и в результате иметь базу статей, чем собрать кучу говна на автопилоте, тем более поиск источников статей на автомат тоже особо не поставишь

у меня на СМС в данный момент на russiapays конверт 6.21$ \ 1k - несомненно, голимый, давно забил на ихнюю СМС партнерку из-за этого (траф на мой аккаунт ХЗ кто льет, просто шаблоны моих доров доконца не переделали, около 400 уников в сутки с фрихостов всяких), а вот на рускамс траф с блогов очень даже хорошо конвертится, но тут главное правильно юзверя еще на блоге обработать...

VipRaskrutka:
Ага, теперь даже редко захожу в данный раздел, скучно у вас тут...

д-а-а, хоть ты бери да сам какого-нить "Арбейтен 4.5 Beta" зарегистрируй...

Всего: 302