Retrouvez-nous le 14 mai au Google Cloud Summit à l'Accor Arena - Paris !

logo saagie red

ETL et ELT, de quoi s’agit-il ? Quelle est la différence ?

Alors que les entreprises font de plus en plus appel à l’analyse de données, les besoins pour des processus efficaces de traitement des données vont crescendo. 

Les ETL et ELT sont justement deux outils répondant à ces besoins. ETL est l’acronyme de « Extract Transform Load », tandis que ELT signifie « Extract Load Transform ». 

Bien qu’ils aient l’air similaires en apparence, ils répondent à des besoins différents, comme nous allons le voir dans cet article. Mais d’abord, intéressons-nous aux concepts communs aux deux.

Qu’est-ce que ETL et ELT ?

En bref, il s’agit de processus permettant de mettre en place des pipelines de données pour gérer et automatiser le transit et la mise en forme de données entre des sources de données et l’utilisateur final.

Il s’agit donc de l’acronyme de trois mots anglais qui désignent les trois étapes principales entrant en jeu dans ces deux processus :

La première différence entre ETL et ELT est l’ordre d’exécution de ces étapes. Cependant, en pratique, les différences les deux processus vont plus loin, comme nous allons le voir plus bas.

Pourquoi mettre en place des processus ETL ou ELT ?

La mise en place et l’utilisation de ces processus peuvent être motivées par différentes raisons :

Les différences entre ETL et ELT

En plus de l’inversion des étapes « Transform » et « Load » entre ces deux processus, il existe plusieurs différences significatives.

Tout d’abord, il est intéressant de noter que les deux ne sont pas apparus au même moment : les processus ETL ont été popularisés et utilisés bien avant leurs cousins ELT. Ce décalage temporel explique peut-être partiellement un autre point de divergence : les technologies employées.

Le processus ELT s’inscrit dans une logique big data. Par conséquent, il utilise des outils de calcul distribués tels qu’Apache Hadoop et des solutions de stockage de type data lake.

À l’inverse, l’outil ETL, historiquement antérieur, utilise des technologies qui ne sont pas nécessairement spécifiques au big data. En particulier, le stockage se fera couramment via des bases de données RDBMS (SQL).

Les avantages respectifs de ces deux processus

Ces différences technologiques se traduisent par des avantages différents dans chacun des cas.

Les avantages de l’ETL :

Les avantages de l’ELT :

Le choix de l’une de ces deux approches doit se faire en fonction de vos besoins et de vos ressources. Si certains outils ELT, comme Talend, sont aujourd’hui très à la mode, il ne suffit pas de suivre la tendance. Au contraire, il est nécessaire de mettre en place une stratégie data globale à l’échelle de votre entreprise et adaptée à vos problématiques avant de choisir quels outils utiliser.