Arquivos .parquet de exemplo

Apache Parquet · categoria Dados Científicos

Parquet é um formato colunar binário otimizado para analytics em larga escala. Padrão no ecossistema Hadoop/Spark/DuckDB/Polars/Pandas, oferece compressão eficiente e leitura seletiva de colunas — fundamental para data lakes.

Quando usar .parquet

  • Data lakes em S3/GCS/Azure
  • Analytics com Spark, DuckDB, Polars
  • Treinamento de modelos de ML

Ficha técnica

MIME type
application/vnd.apache.parquet
Padrão
Apache Parquet
Compressão
Snappy, Gzip, ZSTD

Baixar arquivos .parquet de exemplo

Hospedados no nosso servidor — basta clicar para baixar.

Carregando arquivos…

Formatos relacionados

Perguntas frequentes

Parquet ou CSV?

Parquet é 10-100x menor e mais rápido para analytics. CSV é melhor para troca humana.