AOL поделилась данными о поисковых запросах

K. Ermakov
На сайте с 10.12.2004
Offline
328
1245
AOL on Monday said it released a small portion of keyword search information for about 658,000 anonymous AOL users in a move that ignited a firestorm of criticism on the Internet amid calls for tighter protection of the privacy of users' Web searches.

Источник

This collection consists of ~20M web queries collected from ~650k users over three months.
The data is sorted by anonymous user ID and sequentially arranged.

The goal of this collection is to provide real query log data that is based on real users. It could be used for personalization, query reformulation or other types of search research.

И, что интересно,

This collection is distributed for NON-COMMERCIAL RESEARCH USE ONLY.
Any application of this collection for commercial purposes is STRICTLY PROHIBITED.

:idea:

http://www.gregsadetsky.com/aol-data/

С уважением, Константин Ермаков, absite.ru: онлайн кроссворды (http://absite.ru/); searchsuggest.ru: поисковые подсказки доставляют (http://searchsuggest.ru/).
NeMaster
На сайте с 17.10.2001
Offline
255
#1

база реальная,

интересно увидеть анализ этой базы, типа распределения кликов по серпу, кол-во поисков за сессию

Профессиональное продвижение (/ru/forum/976946) сайтов. Узнать подробнее (http://pro-prodvizenie.ru/) на моём сайте.
Unlock
На сайте с 01.08.2004
Offline
786
#2

Качаю сейчас, интересно посмотреть что там есть ;)

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.
AiK
На сайте с 27.10.2000
Offline
257
AiK
#3

Общую статистику можно тут глянуть:

http://www.earnersforum.com/showthread.php?t=3953

Но куда как интереснее подглядывать по каким запросам приходят на сайты конкурентов :)

!Иван FXS
На сайте с 16.11.2001
Offline
119
#4

А кто-нибудь понимает, что - в этих АОЛ-овских данных - означают серии из одинаковых запросов (от одного и того же AnonID)?

AiK
На сайте с 27.10.2000
Offline
257
AiK
#5

клики по разным урлам

!Иван FXS
На сайте с 16.11.2001
Offline
119
#6

В первом же файле из первых 6 записей 4 - это две пары одинаковых запросов ВООБЩЕ БЕЗ КЛИКОВ.

Дальше - полно и более длинных таких серий ...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий