- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Посмотрите на Google, он как 5 лет назад ел морковку так и сейчас ест.
И не только гугл, и яндекс и рамблер. И судя по своим наблюдениям, дело далеко не в контенте, и способах его генерации. А точнее, не только в контенте.
Обычный Марков, не адалт, отлично кушается яндексом, тот же самый алгоритм, но адалт, заходит намного хуже. (для яндекса, для гугла особых отличий не видно)
Но интересно посмотреть на иные способы генерации текста. Пожалуйста пример скиньте. :)
Посмотрите на Google, он как 5 лет назад ел морковку так и сейчас ест. И двигается флагман рынка в другом направлении.
Если Яндекс начнет учитывать морфологию и что еще сложнее семантику предложений страницы и сайта в целом, уйдет вниз определенное множество сайтов, и среди них белые, которые несут полезную информацию. Это не тривиальная задача, в которой много исключений. Определение грамотно составленного текста не гарантирует, полезность этого текста для пользователя. И наоборот полезный для пользователя контент, может быть и не грамотным. Хотя это в принципе решать Яндексу, он лучше всех знает, что полезней для пользователя :)
а разве яндекс не учитывает морфологию? насколько мне известно вы ошибаетесь.
ознакомьтесь http://download.yandex.ru/company/iworld-3.pdf
а дорген какой юзаете для этого?
самописный
php+mysql
еще не юзаю, пишу 😎
можно посмотреть пример вашего текста?
а разве яндекс не учитывает морфологию? насколько мне известно вы ошибаетесь.
ознакомьтесь http://download.yandex.ru/company/iworld-3.pdf
Конкретно они открыто не говорят, что и как они учитывают. Из того документа, ясно что
уровня лингвистической обработки. Не вдаваясь в подробности, приведу только
список задач, решаемый лингвистическими или окололингвистическими приемами:
• автоматическое определение языка документа
• токенизация (графематический анализ): выделение слов, границ предложений
• исключение неинформативных слов (стоп-слов)
• лемматизация (нормализация, стемминг): приведение словоизменительных
форм к «словарной». В том числе и для слов, не входящих в словарь системы
• разделение сложных слов (компаундов) для некоторых языков (например,
немецкого)
• дизамбигуация: полное или частичное снятие омонимии
• выделение именных групп
и что они вероятнее всего не делают:
словообразовательного, синтаксического и даже семантического анализа. При
этом под семантическим анализом чаще подразумевают какой-нибудь
статистический алгоритм (LSI, нейронные сети), а если толково-комбинаторные
или семантические словари и используются, то в крайне узких предметных
областях.
Да лемматизация упоминается, ну это и в принципе и ожидаемо, при поиске необходимо приводить в фразы в «словарную» форму. Но это не означает что Яша будет оценивать фразу "безногие девушка приползет" и пессимизировать (фильтровать, банить) за это. Семантика, скорее всего в далекой и неясной перспективе.
что-б поисковики отличали статистический правильный бредо-текст от нормального ручного нужно немеряно ресурсов тратить
цепи Марков - это частный случай теории графов, а графы - это и есть статистический метод
Конкретно они открыто не говорят, что и как они учитывают.
Да лемматизация упоминается, ну это и в принципе и ожидаемо, при поиске необходимо приводить в фразы в «словарную» форму.
http://yandex.ru/yandsearch?text=%D0%B3%D0%BE%D0%BB%D1%8B%D0%B5+%D0%B1%D0%B0%D0%B1%D1%8B&stparhome=bno
http://yandex.ru/yandsearch?text=%D0%B3%D0%BE%D0%BB%D1%8B%D1%85+%D0%B1%D0%B0%D0%B1&stparhome=bno
может так вам будет понятней, или так
http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0&stparhome=byes
http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D1%85+%D0%BE%D0%BA%D0%BE%D0%BD&stparhome=byes
и мне тоже пример текста если можно. Спасибо
может так вам будет понятней, или так
http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0&stparhome=byes
http://yandex.ru/yandsearch?text=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D1%85+%D0%BE%D0%BA%D0%BE%D0%BD&stparhome=byes
Обе выдачи соответствуют леммам словосочетания "пластиковые окна". Лучше, понятное дело, употреблять все леммы или наиболее употребляемые при генерации контента. Семантика ТЕКСТА СТРАНИЦЫ особой роли не играет.
Скиньте ссылочку на чудогенератор плиз. Посмотреть примеры.
Обе выдачи соответвуют леммам словосочетания "пластиковые окна". И в первом и втором случае процентное соотношение частоты нормальной формы "пластиковые окна" выше, но это уже другая тема 🚬
ты притворяешься?
леммы (лексемы) не относятся к морфолгии?
vitvvs добавил 13.03.2009 в 21:01
Выше на этой странице ты писал
Если Яндекс начнет учитывать морфологию и что еще сложнее семантику предложений страницы и сайта в целом, уйдет вниз определенное множество сайтов, и среди них белые, которые несут полезную информацию.
теперь на мой пример ты отвечаешь
Обе выдачи соответствуют леммам словосочетания "пластиковые окна". Лучше, понятное дело, употреблять все леммы или наиболее употребляемые при генерации контента. Семантика особой роли не играет.
ты в с своем уме? При чем здесь семантика, мы говорим о морфологии.