Neo00007

Рейтинг
126
Регистрация
11.09.2010

Использование чужих фоток, защищённых авторским правом и при этом домены для доров на себя - вот и будет ответственность, по 10 тыс за каждое фото 😉

Авторство доказывается в суде легко - предоставление файла исходника.


Если тексты-копипаст - тут не так всё строго, потому что тяжело доказать авторство в суде. Просто попросят удалить через whois почту или жалобу в хостинг. Иногда и жалоба регистратору.

Ещё могут быть:

абуза от РКН за какой-нибудь дурацкий ключ, запрещённый законом.

DMCA/РКН по фильмам, сериалам, играм, книгам, софту.

и в каждой тематике ещё свои абузы посильнее (фарма, гемблинг в РФ).

Каширин #:

На чем сеть обучали - это без разницы.

Ну и вообще, зачем сеть у себя ставить, когда можно:

1. Пользоваться обученной сетью.

2. Дообучить обученную

3. Вообще пользоваться нахаляву всем по API.

1. Я пояснил человеку, какое оборудование нужно, чтобы "Пользоваться обученной сетью": сервер с 4 штуками Nvidia Tesla A100 80g.

3. Есть ссылка на API?

Или под халявой вы имеете ввиду: взять у какой-либо корпорации временный, бесплатный доступ к серверам с кучей карточек A100?

_alex__ #:
Интересует какие примерно деньги(сервера) будет стоить запуск этого для генерации или рерайта тысяч английских описаний определенных product name?

Посчитал сколько стоило оборудование для обучения сетки:

сеть обучали на кластере из 800 карточек NVIDIA TESLA A100

каждая по 11157 $

допустим из-за опта цена была 10 тыс $

итого 8 миллионов $

если покупали по курсу 75, то яндекс потратил 600 млн р. )

—————————————————

почитал на гитхабе, что надо для запуска (генерации):

200 гб видеопамяти суммарно (но в реальности надо больше)

они тестировали на 4ёх A100 80g и 8 штук V100 32g

4 штуки A100 это 44 тыс $

🤷‍♂️

Соответственно надо искать сервера с такими конфигурациями карт.

Правда они ещё приписку оставили:

"но способен работать с различными конфигурациями с общим объемом памяти GPU ≈200 ГБ, которые правильно делят весовые размеры (например, 16, 64, 128)."

AleksL #:
Стоимость создания доров, прелендинга (домен, PBN сетка, закупка ссылок, возможно рерайт статей и пр. расходы)?

Всё лишнее.

Добываем ru дропы по 150 р. Несколько или несколько десятков. В идеале тематичные/близкотематичные.

Покупаем инструменты, какие нужны. Или программируем свои, тогда кроме дешевых доменов, других расходов нет.

Если ваша тематика не популярна у дорвейщиков, то значит есть очень большой шанс, что будет траф (через несколько месяцев после создания). Но если нет опыта создания доров и опыта добычи дропов, то вряд ли что-то путное получится.

AleksL :
спарсить ничего не получилось

парсите не поисковик, а xml сервисы. Это лучше, чем платить за прокси.

Ещё вариант: 

если нужен яндекс - парсите его выдачу в другом поисковике. Без прокси.

Но понадобится сервис или программы разгадывания капчи.


Кратко на счёт целесообразности:

давно ничего не работает, зря потратите время.


А если всё таки хотите потратить время и деньги на эксперименты, то не пробуйте популярные тематики. Берите самое нейтральное и "статейное". Тогда копипаст будет жить.

И лучше покупать дропы. В идеале тематичные.

Если свежереги, то отстаивать минимум полгода на уникальном контенте и только потом заливать копипаст.


"Вопрос к практикам, насколько технически сложно реализовать схему СДЛ со спарсенным контентом? "

СДЛ - это нормальный шаблон + нормальные заголовки (ключи) + нормальный контент.

С шаблоном проблем не будет.

Ключи - если возьмёте дорвейные ключи, т.е. не адекватные заголовки, а ключи (то, что люди вводили в поисковик), то уже будет не СДЛ. Парсите заголовки у нормальных сайтов. Или пытайтесь состряпать свои уникальные и адекватные заголовки из ключей.

Контент - надо настроить параметры парсера так, чтобы он брал только большие статьи. Если тематика не попсовая, то контент должен выйти нормальным. Статьи ведь будут из топа по ключу. Придумайте как разнообразить контент в соответствии с тематикой, например разные источники парсинга, составление одной статьи из нескольких, таблицы, списки и т.п.

Тогда сайт может быть полезен людям и будет траф.

Удачи.

billypelegrini #:
та есть профит но нужно больше

в 100500 раз пишу:

Покажи ты этот профит. Сколько потрачено, сколько получено.

Иначе эта тема это 2,5 года троллинга о том насколько хороша "лопата для добычи золота".

Бумеранг777 #:
тебе же пишут выхлоп интересен а не производительность.

Ему это 2 с половиной года пишут. Но это бесполезное занятие.

billypelegrini #:
Финансия считает что я должен свалить из темы, да у меня есть недостатки, но как на меня он перегнул изрядно. Но.. мы должны учесть и другие мнения, потому мы проведём голосование: вы можете высказаться обо мне, софте моих и его софта недостатках, подытожив словом "свалить" или словом "остаться". Если победит первое я уйду из темы и покину форум навсегда, но если победит второе то я доведу софт до ума. Вот так.

Ваши перепалки или ты - как личность и т.п. - это всё не важно.

Есть продукт, дорген. Он нужен, чтобы генерить доры, которые будут приносить деньги. Если доры, которые на нём сгенерены не приносят денег - то такой продукт никому не нужен.

Можно сразу сказать "дорген всего лишь инструмент", ну так есть и jako бесплатный или платные  Thunder и  Pandora. Зачем ещё один дорген?

Может у этого доргена какой уникальный способ генерации текста, который нравиться поисковикам?

Траф есть?

SenSS #:

X-Parser не может нормально парсить выдачу яндекса)))

С помощью хпарсер лет 5-6 парсил рамблер (у которого выдача яндекса). Поскольку парсишь статьи, то ниче страшного, что какой-то урл будет немного не на той позиции как в оригинальной выдаче яндекса.

Последний раз парсил в мае или июне 2020, там вроде новая капча появилась, но думаю проблем быть не должно.

x-parser + capmonster = парсил без прокси и без расходов. Иногда бывало 200-300 капч за сутки, а иногда 20 тыс. Потому что:

парсил в 12-14 окон хпарсера, в каждом по 50 потоков. Выдача тоже 50 результатов. Итого 600-700 потоков (конечно нужен соответствующий проц и соединение напрямую, без роутера). По несколько статей на ключ. 10 гб статей в сутки.

Кроме этого, есть платные сервисы для парсинга xml яндекса и гугл. Они есть в хпарсер. Недавно так гугл парсил, всё ок.

Бумеранг777 :
Не по ключевым словам а чтобы парсил весь контент на нужном сайте.

x-parser может парсить не только по ключам, но и по урлам.

Можно в настройках указать нужный режим:

или он попытается вытащить только статью с помощью своих алгоритмов, либо просто весь возможный текст со страницы. Ну и ещё разные варианты.

Плюс может смешать части из нескольких статей, чтобы получить одну новую статью.

Всего: 410