Untuk mendukung perkuliahan (Big Data, Data Science, NLP, dll), latihan, dan keperluan lainnya, maka kususun halaman ini, dari berbagai sumber. Ini daftar sumber download dataset yang bersifat publik :
- https://datasetsearch.research.google.com/
- https://research.google/tools/datasets/
- https://www.kaggle.com/datasets
- https://huggingface.co/datasets
- https://www.tensorflow.org/datasets/catalog/overview
- http://aws.amazon.com/datasets
- https://github.com/awesomedata/awesome-public-datasets
- https://commoncrawl.org/the-data/get-started/
- https://ourworldindata.org/ (menarik, ada visualisasinya juga)
- https://datasets.quantumstat.com/ (dataset NLP)
- https://archive.ics.uci.edu/ml/datasets.php (classification, regression, clustering)
Last update : 11 Desember 2024