竞赛中使用的数据主要包含四个部分,分别为用户基本信息数据、用户申购赎回数据、收益率表和银行间拆借利率表。下面分别介绍四组数据。
用户信息表: user_profile_table 。 我们总共随机抽取了约 3 万用户,其中部分用户在 2014 年 9 月份第一次出现,这部分用户只在测试数据中 。因此用户信息表是约 2.8 万 个用户的基本数据,在原始数据的基础上处理后,主要包含了用户的性别、城市和星座。具体的字段如下表 1 :
表1用户信息表
列名 | 类型 | 含义 | 示例 |
user_id | bigint | 用户 ID | 1234 |
Sex | bigint | 用户性别( 1 :男, 0 :女 ) | 0 |
City | bigint | 所在城市 | 6081949 |
constellation | string | 星座 | 射手座 |
用户申购赎回数据表: user_balance_table 。里面有 20130701 至 20140831 申购和赎回信息、以及所有的子类目信息, 数据经过脱敏处理。脱敏之后的数据,基本保持了原数据趋势。数据主要包括用户操作时间和操作记录,其中操作记录包括申购和赎回两个部分。金额的单位是分,即0.01 元人民币。 如果用户今日消费总量为0,即consume_amt=0,则四个字类目为空。
表格 2 :用户申购赎回数据
列名 | 类型 | 含义 | 示例 |
user_id | bigint | 用户 id | 1234 |
report_date | string | 日期 | 20140407 |
tBalance | bigint | 今日余额 | 109004 |
yBalance | bigint | 昨日余额 | 97389 |
total_purchase_amt | bigint | 今日总购买量 = 直接购买 + 收益 | 21876 |
direct_purchase_amt | bigint | 今日直接购买量 | 21863 |
purchase_bal_amt | bigint | 今日支付宝余额购买量 | 0 |
purchase_bank_amt | bigint | 今日银行卡购买量 | 21863
公告来自 2015年阿里巴巴大数据竞赛-黄金联赛
温馨提示
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。
温馨提示
帮助与反馈
热门问题 |