庆祝「国庆 75 周年」点亮纪念头像
打开微信扫码参加活动
近年来,学术数据呈现指数增长趋势,全球学术论文已超过3亿篇,学术工作者也已达到1亿人。然而,这些学术数据中仅有大约3%的数据包含语义标注信息。语义缺失严重制约了学术大数据的服务能力和产业发展。本次开放学术精准画像大赛正是为了丰富学术数据中的语义标注信息。
本次竞赛由清华大学、Microsoft Research、中国工程院知识中心以及中国科学院文献情报中心联合组办,清华大数据产业联合会、IEEE Computer Society协办,主要目的是构建精准的学术画像,具体内容包括:挖掘学者的描述信息、研究兴趣和学术影响力等,探究前沿的学术画像技术。
参赛选手根据学术数据挖掘系统AMiner.org和Microsoft Academic Graph提供的数据集,提取学者的个人描述信息,分析学者的研究兴趣,以及预测学者的论文引用情况,从而更好地面向学术界提供专家信息、评估学者研究成果、介绍科学研究进展、展示学术发展动态。
参赛选手根据学术数据挖掘系统AMiner.org和Microsoft Academic Graph提供的数据集,提取学者的个人描述信息,分析学者的研究兴趣、预测学者的论文引用情况,从而更好地面向学术界提供专家信息、评估学者研究成果、介绍科学研究进展、展示学术发展动态。任务具体描述如下:
任务1: 学者画像信息抽取
学者画像信息具体包括学者的主页地址、性别、职位等。随着互联网越来越普及,与学者相关的网页的数量和内容的丰富度、复杂度都大大增加,其中包含了学者的大量冗余信息。通过整合互联网上多种来源的学者数据,采用合适的机器学习模型,获得学者的精准信息是一项潜在有效的学者画像技术。
任务2: 学者兴趣标签预测
研究兴趣是学者画像的重要组成部分,其不仅是学者本身的研究心得或研究拓展方向的集中体现,也能从中窥视不同背景的学者对研究领域热点或学科研究趋势的关注度、敏感度的集体反映。与学者画像信息抽取类似,通过整合互联网上的大规模多源信息,可以对学者的研究兴趣进行判断。
任务3: 学者未来影响力预测
学术影响力用来衡量学者在专业理论及技术方面的影响,常用的评价指标有论文被引量、期刊影响因子、作者H指数等,其中论文被引量是一个重要而直观的指标。本任务的目的是基于学者当前的相关学术数据,预测其未来某段时间内的总论文被引量。
7 月 18 日 : 比赛开放提交答案入口
7 月 18 日- 9 月 14日:比赛期(比赛期间可随时报名和提交答案)
9 月 14日 23:59 (UTC时间):发布最终测试集
9 月 15日 23:59 (UTC时间):测试集结果提交截止
9月16 - 20日:公布比赛最终排名
10月15日(待定):颁奖活动
一等奖 1 支队伍,奖金:¥1万美元(约¥67550)
二等奖 2 支队伍,奖金:各5000美元(约¥33750)
三等奖 4 支队伍,奖金:各2500美元(约¥16875)
比赛期间所有的周冠军队伍都将获得由微软提供的小礼品,以及由大赛组委会颁发的获奖证书 & 技术图书哦~
比赛的微信讨论群。加入微信讨论群请添加请添加“数据竞赛小助手”(ID:shujujingsai)为微信好友并在申请时备注“机构+姓名+微软杯”,由小助手统一添加进群。如果备注不正确申请不会被接受。
暂时没有相关通知公告~
还木有评论,赶快抢个沙发!
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。
庆祝「国庆 75 周年」点亮纪念头像
打开微信扫码参加活动