Parquet

Apache Parquet is een gratis en open-source kolomgeoriënteerd gegevensopslagformaat van het Apache Hadoop- ecosysteem. Het is vergelijkbaar met de andere bestandsindelingen voor kolomvormige opslag die beschikbaar zijn in Hadoop, namelijk RCFile en ORC. Het is compatibel met de meeste frameworks voor gegevensverwerking in de Hadoop- omgeving. Het biedt efficiënte datacompressie- en coderingsschema 's met verbeterde prestaties om complexe data in bulk te verwerken.

Het open-sourceproject om Apache Parquet te bouwen, begon als een gezamenlijke inspanning van Twitter en Cloudera. Parquet is ontworpen als een verbetering ten opzichte van het Trevni kolomvormige opslagformaat, gemaakt door Hadoop-maker Doug Cutting . De eerste versie, Apache Parquet 1.0, werd uitgebracht in juli 2013. Sinds 27 april 2015 is Apache Parquet een door Apache Software Foundation (ASF) gesponsord project van het hoogste niveau.

In Parquet wordt compressie kolom voor kolom uitgevoerd, waardoor verschillende coderingsschema's kunnen worden gebruikt voor tekst- en integergegevens. Deze strategie houdt ook de deur open voor nieuwere en betere coderingsschema's die kunnen worden geïmplementeerd zoals ze zijn uitgevonden.
20191030103431.png
Conference by app developers, for app developers!
20191030100036.png
Voor professionals met passie voor digitale revolutie!
20191030101402.jpg
De grootste Nederlandse site over Android
20200707165104.png
Meer meisjes en vrouwen in bèta, techniek en IT
20191029200614.jpg
Drive value with data
20200608191257.png
Dé leukste website op het gebied van zorg in Nederland
© 2019-2021, alle rechten voorbehouden.
TechVisor
Het vizier op de tech industrie.