Untuk mendukung perkuliahan Big Data, latihan, dan keperluan lainnya, maka kususun halaman ini, dari berbagai sumber. Ini daftar sumber download dataset yang bersifat publik :
- https://datasetsearch.research.google.com/
- https://research.google/tools/datasets/
- https://www.kaggle.com/datasets
- http://aws.amazon.com/datasets
- https://github.com/awesomedata/awesome-public-datasets
- https://commoncrawl.org/the-data/get-started/
- https://datasets.quantumstat.com/ (dataset NLP)
- https://archive.ics.uci.edu/ml/datasets.php (classification, regression, clustering)
Last update : 23 November 2021