Skip to content

Hive 表 Parquet & Orc 性能测试

Published: at 00:00

Hive 表 Parquet & Orc 性能测试

说明
数据格式: 复杂的多层Json格式
数据记录数:60207297
数据大小:79.0G
数据压缩方式: Snappy

运行环境:
	1.21 PB Disk
	960 GB Memory
	480 VCores
	Spark on Yarn

	executor-memory: 4g
	num-executors: 100
容量对比
ParquetOrc
NONE230.3G
Uncompressed236.1G
SNAPPY73.1G73.0G
Gzip46.6G
ZLIB51.7G
写入时长
ParquetOrc
NONE22:34
Uncompressed21:02
SNAPPY19:1019:43
Gzip27:30
ZLIB21:59
查询时长