Arquivos .parquet de exemplo
Apache Parquet · categoria Dados Científicos
Parquet é um formato colunar binário otimizado para analytics em larga escala. Padrão no ecossistema Hadoop/Spark/DuckDB/Polars/Pandas, oferece compressão eficiente e leitura seletiva de colunas — fundamental para data lakes.
Quando usar .parquet
- Data lakes em S3/GCS/Azure
- Analytics com Spark, DuckDB, Polars
- Treinamento de modelos de ML
Ficha técnica
- MIME type
- application/vnd.apache.parquet
- Padrão
- Apache Parquet
- Compressão
- Snappy, Gzip, ZSTD
Baixar arquivos .parquet de exemplo
Hospedados no nosso servidor — basta clicar para baixar.
Carregando arquivos…
Formatos relacionados
Perguntas frequentes
Parquet ou CSV?
Parquet é 10-100x menor e mais rápido para analytics. CSV é melhor para troca humana.