- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
если очень приближенно то в готовом виде алго для сниппета - берем запрос, переводим в нормальную форму - ед число, им. падеж итд, лему берем и ищем ее в лематезированном тексте, далее по номеру позиций забираем предложения. две строки и пару циклов.
типа того, можно упростить в части (переводим в нормальную форму - ед число, им. падеж итд,)
так как поисковик уже отсортировал сайты по ключу думаю можно просто брать первые 4-5 знаков из слов запроса
---------- Добавлено 15.09.2016 в 10:56 ----------
сам пробую делать по схеме /ru/forum/comment/14676530
только проверку на соответствие ципф ещё не сделал,
ищю простой код для получения ципфы на пхп
по Ципфу - верхнюю точку берешь за 0.95 от нее отсчитываешь веса других точек, делаешь такие весовые матрицы для 10-11-12 словных итд предложений, а далее просто ложишь посчитанные веса слов на эту матрицу и смотришь расхождения, в местах склеек дергаешь шинглы.
на практике можно делать проще - берешь норм форму по всем словам, смотришь какие самые увесистые, берешь 3-4 и дрегаешь с ними парную чатсь речи. Совпадает с запросом хоть одно - предложение релевантно, а вообще можно просто нормализовать и предложение и запрос и по нему смотерть, опечатки, слэнг и прочие расхождения только нейронкой поймать можно.
---------- Добавлено 15.09.2016 в 11:27 ----------
берет лему, этой лемой проверяешь предложения в цикле, впринципе этим можно обойтись для первой версии алгоритма.
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.
может накатаеш готовый код для определения ципфы текста на рнр (думаю всем интересно будет)
только не надо phpMorphy использовать
---------- Добавлено 15.09.2016 в 16:26 ----------
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.
и трафика ихмо.
итого задача сводится к 3м критериям:
мрфология
Ципф
уникальность
+ желательно читабельность и хотябы отдаленное наличие смысла.
чем Morphy плох?
Морфология, Ципф, леммы - это все красиво только на словах и для единичных экспериментов. Практика требует немного другого. Генератор должен быть легким и быстрым - вы же дорвеи генерить собрались, а не графоманить и сервера насиловать.
Идеальный дорген/генератор сайтов/лендингов etc
Гениальный дорген/генератор сайтов/лендингов etc
Все гениальное - просто!
поэтому первым делом надо и про производительность не забывать
динамический дор-закинул ключи и всё.
Если бы ПС имели простые алгоритмы можно было бы пойти по пути упрощения, а сейчас стоит задача сделать сложное простым в использовании.
простой и быстрый - это пачка парсеров с шаблонизатором. это уже реализовано, так что если не востребованы алгоритмы генерации контента могу оставить их для приват версии, или сделать 2 на выбор.
AESCBC192, давайте уже скрины тестов каких нибудь по индексу, жизни доров, трафу, профиту.
после мутим свой ленд и продаем дорген за 100500кк баксов )))
AESCBC192, что за "алгоритмы генерации контента" у тебя?
Уже хоть что-то реализовано или пока на стадии мечтаний? Пример текстовки показать можешь?
ЗЫ. В хотя бы отдаленное приближение к полезности генерированной текстовки для юзера верится с трудом. Именно текстовки. Про медийку Бабулер все расписал в своей ветке - с ней проще.