任务设定:
目标是需要参赛者构建挖掘系统,可以针对任意给定的实体(表示为E),自动构建该实体的关系网络(首先需要挖掘出与核心实体有直接或间接关系的实体集合(表示为R(E)),关系类型为封闭集合,然后需要对R(E)进行候选关联实体集合的分层及每层内的实体排序和截断,最终形成关系网络)。
demo 结果见http://tupu.baidu.com/tupu/139401.html(赵薇的关系网络)。
本次任务设定及竞赛数据由百度SSG互联网数据研发部提供。
训练阶段:
实体列表:提供100个核心实体集合
实体圈子:针对每个核心实体,提供该实体关系网络的正确结果
包含实体的数据:针对每个核心实体,提供包含该实体或关联实体的文本/网页集合(已进行entity linking处理)
关系类型训练数据:提供20个关系类型及其训练数据
测试阶段:
给定50个核心实体列表,针对列表中每个核心实体,系统需要自动给出该实体的圈子数据(即与核心实体直接或间接关联的实体集合,例如给定一位女明星姓名,需要挖掘出该明星的丈夫是谁,以及丈夫的朋友等)
输入:核心实体,以及包含该实体及候选关联实体的句子/网页数据
输出:核心实体的圈子数据结果(与核心实体直接或间接关联的实体集合,形成关系网络)。格式为:
Relation + \t + 实体S + \t + 实体O + \t + 实体S的ID + \t + 实体O的ID + 关系在网络的层数(核心实体到其直接关系为第一层, layer-one、layer-two、layer-three)
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。