Sly32

Рейтинг
372
Регистрация
29.03.2012
Vladimir-zenno #:
Вы даже не можете код открыть и посмотреть
Я же посмотрел и сказал, как это работает))) Да можно было и не открывать, достаточно глянуть в стартпост
Vladimir-zenno :
В комплекте словарь на 93 тыс слов, которые имеют до 230 форм каждого слова, связи через синонимы.
Vladimir-zenno #:
с чего вы думаете, что я вам стану рассказывать конкурентное преимущество?
С того, что если я хочу что-то отрекламировать, я пишу про преимущества своего продукта. что в нем есть такого чего нет у других. Тут банальная подборка слов из базы. Ладно, еще спрягать умеет. Дальше что? Это работа для студента первого курса БГУИР. 
Фишки есть? Если я в базу вобью неправильный синоним - она и будет его пихать? 
Vladimir-zenno #:
если Вы программист - делайте свои софты

Я и делаю) Тут чисто развлечься. Иногда шарлатанов вывести на чистую воду(это не про вас) Что-то понять..

Vladimir-zenno #:
напиши здесь ваше предложение и я добавлю функционал

Я не испытываю нужды в  словоподборщике для написания литературных опусов, справлюсь своими знаниями. Хвала небесам, я не имею отношения к этой деятельности. 😂 Эту фразу я писал как будто через ваш синонимайзер)

Vladimir-zenno #:
либо удалиться и заняться делом.

какие дела - сегодня суббота 😎 Мне и так индусы за неделю мозг вынесли)

Vladimir-zenno #:
я учился в то время, когда все про ии вообще ничего не понимали
Так это заметно. Извини, но на том уровне понимания работы ЛЛМ ты и остался. Я вот закончил БГУИР в Минске, это повод для хвастовства? Про этот УИИИИ в общем то все понятно. Инфоцыгане.
Vladimir-zenno #:
если вы такой программист - но такой, что думаете что я вам расскажу, то не поленитесь и посмотрите код
Ты мне предлагаешь рыться в DLL/XML? Мне это не настолько интересно) Но я могу и сам рассказать что это - просто БД, по которой ты ищешь синонимы простой фильтрацией. Банально. Для аналогичных продуктов  использую более продвинутые алгоритмы. Хотя бы эластик. А семантическим поиском, эмбеддингами тут и не пахнет.
Я прав?
SimpleHosting #:
Дай.
Сам напиши)) Как у нас в детстве говорили - "дай уехал в китай" ))) бесплатно я могу подсказать как исправить, что добавить. За кого то писать - нет. тем более - заготовка у тебя уже есть, она норм, только допилить.

Osmxnxn #:
Лучше, примерно как Opus 4,1, только в 15 раз дешевле.
Я уже попробовал сам. Норм, но стал гораздо дольше думать и менять без спросу то, что не просили. Приходится под него писать деатлизированный кастомный промпт, иначе его заносит


Vladimir-zenno #:
я специально так написал, чтобы было не так как у всех и это мне больше нравится
Да нет тут авторства - это коверкание нормальных лексически конструкций. Не звучит.
Vladimir-zenno #:
Есть пруфы работы с софтом, что бесприбыльный ИИ контент - может стать прибыльным при участии человека.

Да что за глупость! Не нужно транслировать все эти страшилки, что человек написал там что-то и его заменили этой программой. Это только боты типа  нехаоса постят из темы в тему такую чушь. Я активно использую множество агентов, но все результаты перепроверяются. 
Недавно нужно было перевести более 150 страниц текста польского. В итоге написал себе приложение, в которое загружаешь документ, оно его распознает и переводит на нужный язык. Перевод через ЛЛМ, для OCR bcgjkmpe. tessaract, но уйду также в EasyOCR, который использует ИИ - так гораздо выше точность.

Vladimir-zenno #:
но ещё во время учёбы в Университете Искусственного Интелекта у Дмитрия Романова,

Так вот где собака порылась))) Отлично еместо для образования! Советую для прочтения
https://habr.com/ru/articles/732556/

И ты так и не ответил на вопрос - как твой лексикон делает подборку синонимов?

Антоний Казанский #:
Не сильно ли у вас завышены требования? Софт модернизируется годами, а тут человек прикручивает фичи и отдаёт в паблик, пока остальные набирают для него резко критические отклики.

Ой слушай, прикрутить ЛЛМ по АПИ это 50 строк кода, делается за полчаса, доступно для выполнения школьникам. 

Нет, в целом   Vladimir-zenno конечно молодец, что что-то реально делает. Но проблема в том что польза от этой работы как от толочь воду в ступе...  Практической ценности нет, тексты я вижу просто нечитабельные. 

Ну и когда человек оперирует неподтвержденными данными - теряется доверие. Ты же маркетолог, понимаешь, что рекламируя свой продукт нужно рассказывать про его преимущества, а не хаять другие бездоказательно. Когда начинают писать про 99% - п онятно что за этим ничего не стоит.

Антоний Казанский #:
Поэтому, когда человек предлагает инструмент, на мой взгляд, как минимум не стоит нападать на него, что этот инструмент не удовлетворяет чьим-то личным ожиданиям.

Да никто особо и не нападает))) Человек хотел критики - человек ее получил. Будет за что похвалить кроме усердия - похвалим.
Пока что за старание - 10, за результат - 3. 
Но дискуссия интересная, надеюсь автор не сбежит из-за критики и будем мужественно обороняться. Может мы оценим, может он получит нужную инфу.

SimpleHosting #:
Девиз программы - экономика должна быть экономной, а не - перфекционизм.

Не совсем согласен, но суть в том, что заразил ты меня своим энтузиазмом и решил тоже себе собрать свой МСР сервер, только настоящий а не игрушку как у тебя. Так как работаю в VSCode - под него и пилил. 

Сам МСР  обернут в докер-контейнер, надеюсь не нужно обьяснять преимущества изолированной среды. Запускается независимо, подключается через расширение. Умеет читать проект, выводить список файлов, умеет также писать, то есть есть полноценный агент-режим,  а также запускать когда код  в консоли. 

Не зависит от ЛЛМ вообще, могу сипользовать с какими угодно.

Ну вот мучаюсь с FAISS - много памяти жрет, думаю как улучшить.

SimpleHosting #:
Работает,
Ну так и не ломай. Допиливать надо если есть интерес к Пайтону, а не потому что я сказал. Я еще могу массу предложить улучшений. Например тут вычитывается файл целиком и по нему идет поиск. Это долго и дорого. 
Я бы разбивал файлы на чанки и уже их индексировал с помощью векторов. Тогда больше релевантного контекста попадет в промпт.
Историю чата сделать для интерактивной работы, чтобы не лезть постоянно в контекст.
БД прикрутить чтоб быстрее было, причем NoSQL.
Научить работать с любыми ЛЛМ не только гугловой. 
SimpleHosting #:
import os
Ну чтож, ИИ норм написал, учись у него. Проверил, работает? Визуально - должно. С промптом бы я поработал, ну и контекстный поиск  можно было бы улучшить. 

Тут просто поиск по словам, я бы делал вектора.

minsky #:
Но ты же физ лицо, не распостаняется, если и зарабатываешь на сайте за счет рекламы, просто оплачиваешь налог на проф доход или подоходный

Оплата профдохода тоже считается предпринимательской деятельностью, так что подпадает по 60 указ.

Но там есть коллизии -  

Если сайт ориентирован на белорусскую аудиторию (например, с .by-доменом), то для такой деятельности ресурсы должны размещаться в национальном сегменте (хостинг в РБ или с использованием .by/.бел).

И вот это или можно толковать двояко. Ну и плюс  формально Адсенс - оказание услуг за рубежом, это тоже может трактоваться как то, что нет необходимости хоститься в РБ, как как услуги на территории не оказываются.

И в дело вступают наши милые налоговые и регистрирующие/контролирующие органы, которые могут это крутить, как им удобно...

не хаос #:
"Белеет парус одинокий", " Я помню чудное мгновенье" алгоритмы никогда не напишут, хоть триллионы вбухивайте в хайп и разработку.
А они и не должны. Но к слову - и ты не напишешь и 99.99% посетителей этого форума не напишут. Бугатти Вейрон - произведение исскусства, но на нем не вспашешь поле.  Каждый инструмент - для своего дела. Пора бы уже понять.
Всего: 7407