这里有数百个计算机视觉数据集。

数据对于模型训练而言非常重要,但寻找合适自己项目的数据集却并不简单。计算机视觉社区经常出现新的数据集,但研究者很难追踪新型数据集。

于是,哥伦比亚大学博士冯捷在 2017 年 8 月创建了一个专用于搜索计算机视觉数据集和代码/模型的搜索引擎 VisualData。

该网站现已收集 281 个计算机视觉数据集,用户可以在该网站上通过简单的搜索找到适合自己项目的数据集。

用户注册网站后可以实时收到新数据集、代码发布的消息,还可以点击“Add my dataset”贡献自己的数据集。

此外,每个数据集都有多个标签,如图像分类、目标检测、图像搜索、3D 重建等,还标注了数据集的公开状态、是否已有代码,以及数据集的流行度。

VisualData 网站上数据集示例。

用户可以点击数据集,查看数据集详情。点击“View Dataset”跳转链接,查看该数据集相关链接,比如 GitHub 项目等。

每个数据集的流行度得分就是根据用户查看数据集详情以及点击数据集链接的频率来计算的。

VisualData 网站创建者冯捷 2017 年获得哥伦比亚大学博士学位,现任亚马逊应用科学家,研究兴趣为计算机视觉和机器学习。

他在 reddit 上表示,他首先写脚本来监控大量数据源(如 arXiv、实验室主页、社交媒体等),然后手动评估这些自动收集到的数据集,再更新到 VisualData 网站上。

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

图像搜索是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。图像搜索方法一般有两种:通过输入与图片名称或内容相似的关键字来进行检索;或者通过上传与搜索结果相似的图片或图片URL进行搜索。

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。