这些数据来自于1999年9月28日(太平洋标准时间)一整天msnbc.com和msn.com新闻相关部分的互联网信息服务器(IIS)日志。数据集中的每个序列对应于24小时内用户的页面视图。序列中的每个事件都对应于用户对页面的请求。请求不会记录在最精细的细节级别,即URL级别,而是记录在页面类别级别(由站点管理员确定)。这些类别包括“首页”、“新闻”、“科技”、“本地”、“意见”、“空中”、“杂项”、“天气”、“健康”、“生活”、“商业”、“体育”、“摘要”、“bbs”、“旅游”、“msn新闻”及“msn体育”。通过缓存机制提供的任何页面请求都没有记录在服务器日志中,因此也不存在于数据中。