- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:
http://www.almaden.ibm.com/cs/crawler
Здесь они кратко описывают свои цели:
The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.
Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?
Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:
http://www.almaden.ibm.com/cs/crawler
Здесь они кратко описывают свои цели:
The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.
Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?</font>
Ну вот уже нашел, чем они занимаются: "Умная поисковая машина"(CLEVER search engine):
Enhancements to HITS algorithm. A number of algorithmic methods to improve the precision and functionality of the basic HITS algorithm. There are several such related efforts, in Almaden and elsewhere (see for instance our SIGIR98 Workshop paper).
Hypertext Classification. Classifying hypertext into a hierarchical topic taxonomy: using a hyperlink induced feature set to significantly improve classification accuracy (see the VLDB Journal paper).
Focused Crawling. Using Hypertext classification and topic distillation tools to focus a crawler to work within a specific topic domain, ignoring unrelated and irrelevant material. (see the WWW8 paper.)
Mining Communities. The web is home to more than 100,000 communities: groups of people and web pages created and maintained by them based on a shared interest on a particular topic. Finding and organizing them within an organized informational framework presents significant technical challenges. (See the WWW8 paper.)
Modeling the web as a graph. What is a good stochastic model for the web as a graph? An answer to this question would give us ways of predicting the growth and interconnection structure of the web, and allow us to tune efficient algorithms for the web. (See the VLDB 99 paper.)
Звучит совсем неплохо. Если это удастся воплотить в жизнь.
http://www.almaden.ibm.com/cs/k53/clever.html
Все-таки не свовсем понятно, что они задумали.
А в логах их полно в последнее время, это точно. И еще AskJeeves активизировался.
Вот у меня статистика за послений месяц по "импортному" сайту:
IBM/Almaden 6475
Google 505
OpenFind 8
Yandex (RUSSIA) 7
Inktomi 5
Lycos 4
Altavista 1
Просканировала, похоже, весь сайт - да некоторые страницы ещё и по 2 раза. Приходит почти ежедневно. Если она так шустро будет и в будующем работать - то флаг ей в руки.
Однако думается мне, ibm вряд ли будет делать "собственеый" se, скорее просто лицензировать технологий и индексы для 3rd parties. Но новой поисковке с хорошим и шустрым роботом я был бы рад
p.s. Подбор литературы вроде бы неплохой. Притом, судя потому что много .ps - литература научного характера. У нас ряд товарищей думаю займутся reverse engeneering
Вот и ко мне это чудо наконец то заглянуло, но взяло только индекс (пока ?)
Ко мне "это чудо" еще год назад заглядывало...
А тему подняли двухлетнюю...
Блин! На дату не посмотрел :)
Avatar, зачем поднял-то?
Да я собственно на дату тоже не смотрел, нашел поиском по форуму...
Видать какую нибудь ссылку на меня нашел этот бот.