Apache Impala

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.
Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne s'appuie pas, ou pas assez, sur des sources secondaires ou tertiaires ().

Pour améliorer la vérifiabilité de l'article ainsi que son intérêt encyclopédique, il est nécessaire, quand des sources primaires sont citées, de les associer à des analyses faites par des sources secondaires.

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Apache Impala

Informations
Développé par Cloudera et Apache Software FoundationVoir et modifier les données sur Wikidata
Dernière version 4.3.0 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/apache/impalaVoir et modifier les données sur Wikidata
État du projet en développement
Écrit en C++, Java et PythonVoir et modifier les données sur Wikidata
Système d'exploitation MultiplateformeVoir et modifier les données sur Wikidata
Environnement Machine virtuelle JavaVoir et modifier les données sur Wikidata
Licence Licence ApacheVoir et modifier les données sur Wikidata
Site web impala.apache.orgVoir et modifier les données sur Wikidata

modifier - modifier le code - voir Wikidata (aide) Consultez la documentation du modèle

Apache Impala est un moteur de requêtes SQL open source de Cloudera (MPP) pour les données stockées dans des clusters d'ordinateurs exécutant Apache Hadoop[2].

Description

Cloudera Impala est un moteur de requête qui s'exécute sur Apache Hadoop.

Impala apporte la technologie évolutive et parallèle des bases de données Hadoop, permettant aux utilisateurs d'émettre des requêtes SQL faibles latences aux données stockées dans le HDFS et Apache HBase sans nécessiter le déplacement des données ou transformation. Impala est intégré avec Hadoop pour utiliser les mêmes fichiers et formats de données, ainsi que les frameworks de sécurité et management de ressource utilisés par MapReduce, Apache Hive, Apache Pig et autres logiciels Hadoop[3].

Impala est favorisée par les analystes et les data scientists pour effectuer des analyses sur des données stockées dans Hadoop via des outils de SQL ou des outils d'informatique décisionnelle. Le résultat est un traitement massif sur les données et des requêtes interactives qui peuvent-être effectuées sur le même système en utilisant les mêmes données et méta-données – en évitant de migrer l'ensemble de données dans les systèmes spécialisés ou sur des formats propriétaires tout simplement pour effectuer des analyses.

Fonctionnalités :

Au début de 2013, un format de fichier en colonnes appelé Parquet a été annoncé pour les architectures y compris Impala. En , Amazon Web Services a annoncé un soutien pour Impala. Au début de 2014, MapR ajouté le support pour Impala. En 2015, un autre format appelé Kudu a été annoncé, que Cloudera a propose de donner à la Fondation Apache Software avec Impala. En , Impala devient un projet Apache Incubator.

Historique

En , Cloudera annonce vouloir donner Impala à la Apache Software Foundation[4].

Voir aussi

  • Presto — Moteur de requêtes SQL open source créé par Facebook et soutenu par Teradata. Optimisé d'analyse interactive pour architecture temps réel distribuée
  • Dremel — est un outil similaire proposé par Google
  • Apache Drill — Projet open source similaire inspiré de Dremel
  • Cloudera — La distribution Hadoop initiatrice du projet Cloudera Impala
  • Hadoop
  • Presto
  • Catégorie:Écosystème Hadoop

Références

  1. « Release 4.3.0 », (consulté le )
  2. « Cloudera Impala » (consulté le )
  3. (en) Timothy Prickett Morgan, « Cloudera revs up Impala SQL for Hadoop », The Register, (consulté le )
  4. (en) Andrew Brust, « Impala, Kudu, and the Apache Incubator's four-month Big Data binge », ZDNet, (consulté le )
  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Cloudera Impala » (voir la liste des auteurs).

Liens externes

  • Cloudera Impala site du projet
  • Impala GitHub code source du projet
  • Impala Project Page site web du projet
v · m
Méthodes
Services
Exploration de données
Outils
Organismes
v · m
Concepts
Architecture
Outils
Programmation
Statistique
Articles liés
v · m
Écosystème Hadoop
Distributions Hadoop
Base de données
Flux de données
Interrogation
Machine Learning
SQL
Gestionnaire de cluster
Format de fichier
Vrac
  • icône décorative Portail de l’informatique
  • icône décorative Portail des données
  • icône décorative Portail des bases de données