- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Пришлось как-то делать нечто, типа "автоматического каталогизатора".
При всей сложности задачи, програмная часть была небольшой.
Все свелось к "словарям" по темам и словарям синонимов.
После "проката" были отсеяны самые "популярные" и самые "редкие" слова, за
исключением обще-литературных слов, которые есть даже в ISPEL.
имхо, где, как не у Янь, самые полные словари?
имхо, такая задача реальна... Наверное вопрос времени.
Перелопатить всю Базу Яня на этот предмет...
Разработчик,
Так для Яндекса "тематика" - это только рубрика ЯК. Определять тематику точнее - это задача для ИИ - ПС вряд ли сейчас ставят перед собой задачу создания ИИ.
Проверив релевантность этого форума на предмет всяческих "ангедридов, хлоридов и гликолей", можно с 99,99% уверенностью утверждать, что этот форум не относится к разделу "Химия" и химической пром-ти.;)
alut, пусть MiRaj снова "умилится", но ссылка на фразу Яндекса "мы учитываем текст со страницы, на которой стоит ссылка" на форуме была. И "рабочие" алгоритмы, имхо, есть..
Если Вас интересует это вопрос "по сути" - могу поделится реальными алгоритмами и не тольок своими.
можно с 99,99% уверенностью утверждать, что этот форум не относится к разделу "Химия" и химической пром-ти.;)
Не может быть..А если через 15 минут в Курилке тема появится с названием "отравился дигидридниколем", то что даст Ваш анализ?
DrJeans, с "космотнавтами", все просто. А вот причины появления/исчезание тематик у сайтов некаталогжных - пока факт, но загадочный. Может глюк, может "пробы пера".
А по поводу тематичности.. Тематику страницы определить, все просто. Сайта - уже сложнее. А вот что яша считает однотематичными сайтами, и чем он при этом руководствуется - ??? и большой
Будем ждать тогда..
А зачем, или тоже всерьез заинтересовались тИЦем, или тематичность ссылок стала рулить и в остальных направлениях.
Не может быть..А если через 15 минут в Курилке тема появится с названием "отравился дигидридниколем", то что даст Ваш анализ?
Всю туже точность... Каково % соотношение "дигидридниколем" к общей массе слов на этом форуме?
Точно также можно выделить наиболее часто употребляемые жаргонизмы этого форума, которые во многих других отраслях не встречаются...
Я не говорю - насколько Яндекс это использует.
А по поводу тематичности.. Тематику страницы определить, все просто. Сайта - уже сложнее. А вот что яша считает однотематичными сайтами, и чем он при этом руководствуется - ??? и большой
Просто? Ок, тогда оцениваем тематичность всех исходящих ссылок со страницы и вот она, градация по тематичности ссылки?
Всю туже точность... Каково % соотношение "дигидридниколем" к общей массе слов на этом форуме?
Всё ту же - значит по-прежнему "никакую" :) Больше знаков после запятой нужно использовать)
Тематику страницы определить, все просто.
\
есть примеры когда Яндекс лагает с определением тематики для страницы (судя по выдаче дирета)