- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
На форуме много споров по поводу качества текста. Решил выложить для теста немного текстовки из моего бредо-генератора, кому надо берите - если нужно больше, выложу еще.
Генерируется по цепям Маркова из большого исходника, вот пример:
Интересно мнение, такое живет и будет жить? Или надо дальше экспериментировать.
Больше бредотекста в прикрепленных архивах:
Как Ленин - жило, живет и будет жить ) Экспериментировать никогда не надо прекращать.
По всей видимости в генераторе знаки препинания считаются как обычные слова. Направление верное =)
BredoGen морковка живёт, пока живет, распознать яше её не составляет труда и следующий алгоритм тому подтверждение, тут всё опять же упирается в вычислительные мощности самого яндекса. Да и сам текст уже не так сильно влияет на индекс лезет как на синонимах мешанине так и на простом простом копипасте. Просто если нет возможности производить качественный текст в обльших количествах в индекс нужно вылазить за счёт других факторов.
Интересно мнение, такое живет и будет жить
а почеу нет?
По всей видимости в генераторе знаки препинания считаются как обычные слова.
Нет, разбивал только по словам которые больше 3 букв, но сохранял знаки препинания. Сейчас база для сборки больше 2 гигов, это несколько миллионов звеньев. Было обработано больше 10 гигабайт текстов! (книжек, статей, сайтов) Текст очень уникальный - тщательно отфильтрован весь мусор. (зоо, дети и др.) В выдачу залетает нормально, но есть проблемы при подмешивании ключей, думаю как лучше замешать.
Еще немного текста, если надо больше, спрашивайте - выложу еще.
1. Текст не проходит даже самых простых статистических проверок.
2. Текст (частично) не уникален по 4-шинглам.
*Бросил на него короткий смешок и такое иногда лезет в третью* можно роман так написать. Потомки будут восхищаться глубочайшим смыслом :)
статистических проверок.
Что не так со статистикой?
Однако ритм их движений языком вдоль побережья на яхте. Супер!!! 😂
По теме: а в чём смысл этой титанической работы? Зачем нужно обрабатывать по 10 Гиг текста? Поясните, плз.
Зачем нужно обрабатывать по 10 Гиг текста?
Чтобы набрать большое количество разных вариаций. Больше цепей, лучше уникальность - проще вычислить мало употребляемые сочетания и удалить. Пропадает необходимость парсить новые тексты. Даже при совпадении по шинглам источники будут разные.