Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science

Тема для кандидатской, например - Использование лексических цепочек для создания дайджестов или обзоров прессы. Весьма востребовано. :)

vjazanie:
Необходимо:
3 раза в день мониторить "Яндекс.Поиск по блогам", с целью найти упоминания о компании, в любом контексте
Результаты мониторинга выкладывать в закрытый ЖЖ(т.е. необходима регистрация в ЖЖ)
Периодичность мониторинга:
ситуация на 8-9 утра по Мск
ситуация на 15-16 дня по Мск
ситуация на 9-10 вечера по Мск
/ в выходные можно мониторить 1-2 раза в день /

При мониторинге необходимо прочесть записи из найденных блогов, чтобы понять, что речь идет именно о компании, а не просто так, пустой разговор.

Оплата - фиксированная, т.е. количество найденного не влияет.
Размер оплаты - даже не представляю :(
Судя по затратам времени на 1 мониторинг, предложу 30$ в неделю.

Если есть вопросы - задавайте, постараюсь ответить.

А Вас только Яндекс-блоги интересуют? А если взять весь охват Интернета в режиме реального времени?

8Racer:
Спасибо! :)
Только я не очень понял, что значит "ключи для запросов"? Через что организован процесс запроса к Google? Эх, ссылочку бы...))))) [совсем наглею]

Google вроде бы закрыл API несколько лет назад, даже для некоммерческих организаций, а вот Yahoo до сих пор успешно раздает.

По оптимизации нужно делать отдельную конференцию - слушатели пошли не те, что раньше. Сейчас в основном люди приходят послушать о последних тенденциях развития украинского интернета, да и потусоваться и наработать новые контакты.

в) плагиат - обнародование (опубликование), полностью или частично, чужого произведения под именем лица, не являющегося автором этого произведения.... "

Забавно - получается, судя по этому закону, публикация на любом сайте чужого текста с подписью автора и указанием печатного источника не наказывается украинским законодательством.

Остался вопрос - где найти словари по тематикам?

Еще есть хороший и быстрый способ получить словарь по нужной тематике. Если есть готовая база, можно прогнать по ней базовый список запросов из семантического ядра и получить поиском список документов - если один и тот же документ будет находиться несколькими характерными запросами, можно с заданной вероятностью относить его к нужной рубрике. Дальше дело техники - разобрать тексты на лексемы и посчитать словари.

Метод хорош тем, что может работать совершенно автономно, дополняя готовые словари новыми терминами.

ТС, Ваш пост сам по себе страшилка. Бредовая. Обкуриваться надо меньше. Не ИМХО.

Аргументируйте, а то ваш пост выглядит, прямо скажем, некрасиво.

Vyacheslav Tikhonov, может быть, делом займётесь?

Goodwin, я и делом занимаюсь, а не языком треплю. Если кому-то что-то не нравится, идет изучать форумы по разведению домашних животных. ;)

Ещё один Дон Кихот.

Штраф за флуд. Вы правы, с такими "экспертами" форум точно деградирует..

в любом случает, качество решения будет ниже чем результат обезьянки за клавиатурой. если конечно обезьянка не очень тупа.

Проблема в том, что набрать столько обезьянок, которые бы оценили в течение часа поток из нескольких тысяч документов, нереально. Нужно программное решение.

я понимаю, что если есть заказ ві не будете заниматься предсказанием потенциальных трузатрат и сравнением с другими решениями. но задача на первій взгляд весьма нетривиальна.

Обычно чем сложнее задача, тем интереснее ее решать. Здесь точно есть какая-то фишка, лежащая в области психологии, а не информационных технологий. Например, средняя длина слов в тексте меньше, если хвалят, и больше, если ругают. :)

Хорошие новости, плохие новости.

Не похоже, чтобы все это на сайте делал автомат.

Всего: 847