- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Где можно узнать про то, как можно интеллектуальным образом выбирать новостные заголовки от сми по ключевым словам, таким как убийства,грабеж..?
Например вот: http://en.wikipedia.org/wiki/Naive_Bayes_classifier
Вцелом работает неплохо, если процент неверных определений не особо критичен.
Есть вроде более точные методы типа SVM (Support Vector Machine) и др, но их я пока не пробовал только присматриваюсь.
По-русски что-нибудь есть интересное?
хорошая коллекция ссылок разных. Внизу есть ссылки по IR
http://www.miralab.ru/tools/service/
морфология
http://www.aot.ru/
стемминг
http://linguist.nm.ru/stemka/stemka.html
Стемминг этот кстати вполне себе работает. Портировал его на php и юзал в поиске по сайту. Хорошее решение на сильно ограниченном хостинге (читай дешевом ;)
ps. А Вам мб подойдет просто нечеткий поиск в строке по шаблонам без заморочек с классификацией и тп.
А возможно ли написать на PHP робота, который будет лазить по сайтам сми, читать их rss и выбирать новости и добавлять их в свою бд..
А возможно ли написать на PHP робота, который будет лазить по сайтам сми, читать их rss и выбирать новости и добавлять их в свою бд..
Ничего сверх трудного тут нету, только аназиз новостей наверное будет ресурсоемким.
Делать сайт на чужих новостях бессмысленно.
В августе прошлого года я запустил скрипт, который из RSS-лент загружает новости и картинки в мою базу, а дальше новости просто публиковались на сайте (все было красиво, по разделам, с комментариями посетителей)
Траффик был только с Яндекса. С Гугля зашло человек, может 10 за пол-года.
А в конце апреля этого года и с Яндекса посетителей обрубило.