点赞再看,养成习惯,微信公众号搜索【JackCui-AI】关注这个爱发技术干货的程序员。本文 GitHub Jack-Cherish/PythonPark 已收录,有一线大厂面试完整考点、资料以及我的系列文章。
一、前言
数据是深度学习的血液。
数据的好坏,很大程度上影响了模型的效果。
数据集难找?
贴心的 Jack,今天给大家带来了一个数据集搜索工具「BIFROST」。
二、BIFROST
「BIFROST」一个集美貌与才华的网站。
BIFROST:https://datasets.bifrost.ai/
收录了多达 1899 个开源图像数据集。
数据集,分门别类,整齐划一。
网站根据数据集类型,将数据集分为 Humans、Geospatial、Autonomous Cars、Retail、Nature 等多个种类。
Humans - 人类
Autonomous Cars - 自动驾驶汽车
Retail - 零售
Faces - 人脸
最关键的是,网站支持数据集搜索功能。
一键搜索,免费获取,直接链接到原始数据库,帮你快速找到合适的数据集。
搜索可以根据条件进行筛选,:任务类型,数据格式,最小图像数量。
其中任务类型主要包括:图像分割,目标检测、图像分类、姿态估计、视觉推理、3D重建、视频分类等。
数据格式包括:YOLO、PASCAL、COCO等。
数据的详情页,介绍也很详细。
以 VOC 2012 数据集为例,打开数据。
除了可以浏览一些样例数据,还有数据的简介、图片数量、标签数量、数据集大小、数据格式和尺寸等信息。
甚至,还提供了数据分布。
哪种类别数据多,清晰可见。
三、总结
找数据集,不妨试试「BIFROST」。
网站需要翻墙才能登陆。
虽然有限制,但各种开源免费的数据集都是国外的,没有个翻墙手段,怎么能行呢?
哦,对了。七夕,快乐。
文章持续更新,可以微信公众号搜索【JackCui-AI】第一时间阅读,本文 GitHub Jack-Cherish/PythonPark 已经收录,有大厂面试完整考点,欢迎Star。