Чем сейчас генерировать контент

12
_
На сайте с 12.04.2018
Offline
23
#11

Яндекс выложил в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках.

https://searchengines.guru/ru/news/2055274

https://github.com/yandex/YaLM-100B

Интересует какие примерно деньги(сервера) будет стоить запуск этого для генерации или рерайта тысяч английских описаний определенных product name?

Яндекс выложил в открытый доступ YaLM 100B - Новости
Яндекс выложил в открытый доступ YaLM 100B - Новости
  • 2022.06.23
  • searchengines.guru
Яндекс выложил в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. Это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира. YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из...
Каширин
На сайте с 03.01.2004
Offline
1018
#12
_alex__ #:
Интересует какие примерно деньги(сервера) будет стоить запуск этого для генерации или рерайта тысяч английских описаний определенных product name?

У меня есть такая штука :) лучше придумай, как ее монетизировать! ;)

N0
На сайте с 11.09.2010
Offline
126
#13
_alex__ #:
Интересует какие примерно деньги(сервера) будет стоить запуск этого для генерации или рерайта тысяч английских описаний определенных product name?

Посчитал сколько стоило оборудование для обучения сетки:

сеть обучали на кластере из 800 карточек NVIDIA TESLA A100

каждая по 11157 $

допустим из-за опта цена была 10 тыс $

итого 8 миллионов $

если покупали по курсу 75, то яндекс потратил 600 млн р. )

—————————————————

почитал на гитхабе, что надо для запуска (генерации):

200 гб видеопамяти суммарно (но в реальности надо больше)

они тестировали на 4ёх A100 80g и 8 штук V100 32g

4 штуки A100 это 44 тыс $

🤷‍♂️

Соответственно надо искать сервера с такими конфигурациями карт.

Правда они ещё приписку оставили:

"но способен работать с различными конфигурациями с общим объемом памяти GPU ≈200 ГБ, которые правильно делят весовые размеры (например, 16, 64, 128)."

Каширин
На сайте с 03.01.2004
Offline
1018
#14
Neo00007 #:

сеть обучали на кластере из 800 карточек NVIDIA TESLA A100

—————————————————

почитал на гитхабе, что надо для запуска (генерации):

200 гб видеопамяти суммарно (но в реальности надо больше)

они тестировали на 4ёх A100 80g и 8 штук V100 32g

4 штуки A100 это 44 тыс $

🤷‍♂️

Соответственно надо искать сервера с такими конфигурациями карт.

Правда они ещё приписку оставили:

"но способен работать с различными конфигурациями с общим объемом памяти GPU ≈200 ГБ, которые правильно делят весовые размеры (например, 16, 64, 128)."

На чем сеть обучали - это без разницы.

Ну и вообще, зачем сеть у себя ставить, когда можно:

1. Пользоваться обученной сетью.

2. Дообучить обученную

3. Вообще пользоваться нахаляву всем по API.

N0
На сайте с 11.09.2010
Offline
126
#15
Каширин #:

На чем сеть обучали - это без разницы.

Ну и вообще, зачем сеть у себя ставить, когда можно:

1. Пользоваться обученной сетью.

2. Дообучить обученную

3. Вообще пользоваться нахаляву всем по API.

1. Я пояснил человеку, какое оборудование нужно, чтобы "Пользоваться обученной сетью": сервер с 4 штуками Nvidia Tesla A100 80g.

3. Есть ссылка на API?

Или под халявой вы имеете ввиду: взять у какой-либо корпорации временный, бесплатный доступ к серверам с кучей карточек A100?

BrainDead
На сайте с 18.02.2007
Offline
121
#16
Каширин #:

На чем сеть обучали - это без разницы.

Ну и вообще, зачем сеть у себя ставить, когда можно:

1. Пользоваться обученной сетью.

2. Дообучить обученную

3. Вообще пользоваться нахаляву всем по API.

А какие ресурсы нужны, чтобы дообучить модель?

_
На сайте с 12.04.2018
Offline
23
#17
Каширин #:

У меня есть такая штука :) лучше придумай, как ее монетизировать! ;)

Не понятно самое главное - качество, а точнее будет ли гугл считать качественным этот генеренный контент.
Это только экспериментально можно установить.
Мне бы так - я отдаю несколько сотен исходных статей оформленых простыми тэгами, и кей к каждой статье.
Получаю размноженные статьи.

Каширин
На сайте с 03.01.2004
Offline
1018
#18
Neo00007 #:
3. Есть ссылка на API?

API сколько угодно: https://huggingface.co/

Hugging Face – The AI community building the future.
Hugging Face – The AI community building the future.
  • huggingface.co
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Каширин
На сайте с 03.01.2004
Offline
1018
#19
BrainDead #:

А какие ресурсы нужны, чтобы дообучить модель?

Google Colab хватит

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий