资金流图流出 赛题与数据

竞赛中使用的数据主要包含四个部分,分别为用户基本信息数据、用户申购赎回数据、收益率表和银行间拆借利率表。下面分别介绍四组数据。

1.用户信息表 

用户信息表: user_profile_table  我们总共随机抽取了约 3 万用户,其中部分用户在 2014  9 月份第一次出现,这部分用户只在测试数据中 。因此用户信息表是约 2.8  个用户的基本数据,在原始数据的基础上处理后,主要包含了用户的性别、城市和星座。具体的字段如下表 1 

 
表1用户信息表

列名

类型

含义

示例

user_id

bigint

用户 ID

1234

Sex

bigint

用户性别( 1 :男, 0 :女 

0

City

bigint

所在城市

6081949

constellation

string

星座

射手座


2. 用户申购赎回数据表 

用户申购赎回数据表: user_balance_table 。里面有 20130701  20140831 申购和赎回信息、以及所有的子类目信息, 数据经过脱敏处理。脱敏之后的数据,基本保持了原数据趋势。数据主要包括用户操作时间和操作记录,其中操作记录包括申购和赎回两个部分。金额的单位是分,即0.01 元人民币。 如果用户今日消费总量为0,即consume_amt=0,则四个字类目为空。

 
表格 2 :用户申购赎回数据

列名

类型

含义

示例

user_id

bigint

用户 id

1234

report_date

string

日期

20140407

tBalance

bigint

今日余额

109004

yBalance

bigint

昨日余额

97389

total_purchase_amt

bigint

今日总购买量 = 直接购买 + 收益

21876

direct_purchase_amt

bigint

今日直接购买量

21863

purchase_bal_amt

bigint

今日支付宝余额购买量

0

purchase_bank_amt

bigint

今日银行卡购买量

21863

温馨提示

非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。

温馨提示
温馨提示
帮助与反馈

热门问题