开放数据列表

NLPCC数据集

The Conference on Natural Language Processing and Chinese Computing,会议提供了不同task的各个领域的数据集

ReferItGame

ReferItGame数据集包含 130,525 个表达式,用于引用 19,894 个自然场景图像中的 96,654 个对象。

LFW (Labeled Faces in the Wild)

LFW数据集包含了从网络上收集的13233张人脸图像。这个数据集包含了5749个身份和1680个拥有两个或更多图像的人。在标准的LFW评估协议中,验证精度报告在6000对脸。

Visual Question Answering (VQA)

视觉问答 (VQA)是一个包含关于图像的开放式问题的数据集。这些问题需要对视觉、语言和常识知识的理解才能回答。数据集的第一个版本于 2015 年 10 月发布。VQA v2.0于 2017 年 4 月发布。

UCF101

UCF101数据集是UCF50的扩展,由13,320个视频片段组成,分为101个类别。这101个类别可以分为5种类型(身体运动,人与人的互动,人与物的互动,演奏乐器和运动)。这些视频剪辑的总长度超过27小时。所有视频均来自YouTube,固定帧率为25fps,分辨率为320x240。

SQuAD

SQuAD 是斯坦福大学于2016年推出的数据集,一个阅读理解数据集,给定一篇文章,准备相应问题,需要算法给出问题的答案。此数据集所有文章选自维基百科,数据集的量为当今其他数据集(例如,WikiQA)的几十倍之多。一共有107,785问题,以及配套的 536 篇文章。

Natural Quetions

[Google 发布](https://ai.googleblog.com/2019/01/natural-questions-new-corpus-and.html)用于训练和评估开放领域(Open-domain)问答系统的大型[语料库](https://so.csdn.net/so/search?q=语料库&spm=1001.2101.3001.7020) Natural Questions(NQ)。该数据集包含了 30 万个自然产生的问题和对应的回答注释,每个回答都是人工从维基百科页面找到

Open Images

谷歌于2016年推出了Open Images,约900万张图像的协作版本,注释了数千个对象类别的标签。到了2018年,已更新到了Open Images V4,该版本总共包含了1540万个用于600个对象类别的边界框,使其成为拥有对象位置注释和30万多个可视关系注释的最大数据集。

ShapeNet

ShapeNet建立一个丰富的注释,大规模的3D形状数据集。为世界各地的研究人员提供这些数据,以支持计算机图形学、计算机视觉、机器人和其他相关学科的研究。

Charades

Charades数据集是为了对日常任务进行独特的洞察而收集的,比如喝咖啡,坐在椅子上穿鞋,或者依偎在沙发上的毯子上看着笔记本电脑上的东西。这使得计算机视觉算法能够从我们日常动态场景的真实和多样化的例子中学习。

MultiDoc2Dial

MultiDoc2Dial(Multipul Document to Dialogue)是一个可用于open QA领域的数据集,有多段对话以及对话相关的文档组成,每一个turn种包含多个utterance,在一个turn种可能包括多个相关文档。

IMDB

包含来自互联网电影数据库IMDB 的50000 条严重两极分化的评论。非常经典的情感分析数据集