Apache Parket adalah "columnar" Data format penyimpanan yang khusus dibuat untuk Apache Hadoop keluarga proyek.
Parket dianjurkan untuk digunakan dengan data yang besar, terutama karena menggunakan sistem kompresi data yang kompleks, bergantung pada serangkaian dioptimalkan catatan shredding dan re-assembly algoritma.
ini memungkinkan data yang akan dipecah, diselenggarakan dalam format bersarang, dan dipasang kembali setiap kali bertanya.
Format Parket juga dapat digunakan di luar ekosistem Hadoop, yang khusus dirancang untuk menjadi seperti agnostik mungkin, bekerja dengan semua jenis kerangka pengolahan data dan model penyimpanan data.
< strong> Apa yang baru di rilis ini:
- Ubah nama paket dan pakar koordinat untuk org.apache
- Tambahkan statistik encoding ke ColumnMetaData li>
- Streaming barang bekas API
- jenis logis New
Apa yang baru di versi 2.3.0:
- Ubah nama paket dan pakar koordinat untuk org.apache
- Tambahkan statistik encoding ke ColumnMetaData li>
- Streaming barang bekas API
- jenis logis New
Pembatasan :
- Proyek masih dalam pembangunan di repositori Apache Incubator dan mungkin berubah drastis dari versi ke versi.
Komentar tidak ditemukan