Тестанул, одни ошибки на нормальном тексте от толкового редактора и Ai.
Начало: пишет ошибку, что между первым заголовками идёт вводная часть. Де факто - это стандарт записей.
Синтаксис: адекватные люди прогоняют текст через анализаторы + вычитывается статья. В обоих случаях получил: текст скользит.
Энциклопедия: никакой нормальный автор не напишет: где-то в 2018. А тут это как пример отсутствия ошибок. Тем более в тексте отсылка к документу.
Порезка на куски: опять же, это стилистическое правило. Лимит символов и предложений. Это называется юзабилити. )
Кавычки - нормальные владельцы сайтов лет так много пускают текст через типограф или аналоги. Это не критерий Аи.
Про градус накала - это вообще что такое? Как понять выгорает и бесится? Редактор и автор за это деньги получает.
Де факто: назвать надо не анализатор Ai, а анализатор качественного текста.
Сереж, клиентское SEO и состоит из череды ТЗ, рабочих прений и проверки исполнения.
А современное SEO без маркетинга - это разве, что в наборе разрозненных задач без ясной зоны ответственности.
В том и проблема, что многий шум специфический. И, де факто, под каждый новый проект нужны будут новые данные. И просто разбивать по смыслам, делать словарь, разделять действия, сущности и характеритики, увы, не выходит. Никак.
Сциенисты и аналитики, обучатели. Ребята, которые прям сильны в этих историях.
Ты уверен, что хочешь продолжать детский сад?
В том и проблема, что ты всё ещё не понимаешь задач и объёма. Из того, что делаю я - текстовой аналитики вообще нет. Потому что она не нужна. Имеет смысл атомарный анализ сайтов конкурентов. Но это далеко не одно и тоже.
Каких? )
Ты не обучешь модель на эти задачи в универсальном исполнение. А обучать под каждую нишу - это фигня.
Слушай, ну я готов купить кластеризатор за 5к$. )
Точно отдельный. Потому что есть кластеризация по СЕРПу, а есть по интенту. Это разные вещи. Кардинально. Эмбединги гипотетически можно использовать для сило-структурирования, но есть вариант в том, что это будет, ммм, излишне. На данный момент все мои игры и общение с ребятами с МТС и Альфа банка не привели ни к какому прогрессу. Т.е. рабочего варианта нет. Даже теоретически. Если тебе прям интересно, что, как и зачем делается, напиши и я тебе объясню с картинками. В данной версии бота кластеризатора нет вообще, будет только утверждение страниц конкурентов, семантика с этих конкретных страниц и Ai анализ схожести. Аналогично - контент план по сырой семантике.
Ты вот вроде осознал объём SEO. Умножь на 100. Тогда будешь близок. Этот бот не будет решать задачи SEO со старта до финиша. Там будет основная аналитика и рекомендации.
У нас нет программистов за 3 копейки. Разве что джуны. Я сам джун (в лучшем случае). Но в круге общения есть и тимлиды с бэкграундом работы в Гугл (США). Ещё у знакомой сыну 13 лет. Уже 3 года занимается обучением моделей, аналитикой и предсказаниями )