Epsilon Rationalise une Base de Données Existante

Talend Data Integration permet la création d'un fichier regroupant des données démographiques depuis des formats multiples.
Nous étions satisfaits de l'utilisation de Talend Open Studio for Data Integration. Cependant, lorsque nous développions notre fréquence d'utilisation, nous étions confrontés à des problématiques de travail collaboratif, de centralisation des projets et du code, etc. Nous avons alors décidé de souscrire à Talend Data Integration et nous ne regrettons pas cet investissement.
Aaron Dix, Senior Technical Manager, Data Engineering

Leaders des services de marketing direct

Créée en 1969, Epsilon est le leader du 'permission marketing', elle a été désignée numéro 1 aux USA parmi les entreprises de services marketing et numéro 1 parmi les agences de marketing direct par l'hebdomadaire Ad Age. Avec ses trois divisions, Purple@Epsilon, Marketing Technology et Epsilon Targeting (dont Abacus), Epsilon allie la force des annuaires de données clients et métiers les plus importants au monde à des techniques innovantes et reconnues dans le monde afin de garantir le succès des campagnes marketing des clients internationaux. Ses services incluent un consulting stratégique, une base de données, un système de fidélisation de la clientèle, des données propriétaires, de la modélisation prédictive, une large gamme de services interactifs et innovants comprenant le développement de la marque et de la promotion, le web design, le déploiement des stratégies d'email marketing, l'optimisation pour les moteurs de recherche et la création de mailings. En tant qu'entreprise dédiée aux services marketing, la clientèle d'Epsilon a le choix entre une gamme complète de services et plusieurs solutions online ou offline. Epsilon est également le plus important fournisseur d'emails basés sur le concept du 'permission marketing' au monde.

Le problème d'Epsilon était typique d'une entreprise qui agrège des données pour ses clients. Les données arrivaient dans des formats différents et nécessitaient un traitement manuel fastidieux. Epsilon avait besoin de rationaliser le processus d'intégration.

Interfacer avec des systèmes existants

Epsilon avait déjà expérimenté des outils propriétaires en interne et réalisé qu'elle ne voulait pas dépendre d'une solution limitée lorsqu'elle menait un nouveau projet. « Nous souhaitions une solution plus axée sur l'intégration de données » déclare Aaron Dix, Senior Technical Manager du groupe Data Engineering.

Bien que le coût était un facteur déterminant dans le choix d'une solution open source, Epsilon s'est aperçue que parmi tous les produits testés, la solution Talend était la plus facile d'utilisation. Les programmes utilisés en interne étant développés sous Java et Perl, les développeurs se sentaient à l'aise avec la technologie Talend. « Nous avons rapidement constaté que Talend surpassait certains des produits que nous testions, » explique Aaron Dix. « Cependant, le fait que le projet inclue le code existant, que nous avions besoin d'intégrer à nos propres solutions, a été un facteur décisif dans le choix de la solution. Grâce à ses applications externes faciles d'utilisation via le système ou via les pilotes Java, Talend nous permet d'interfacer aisément nos systèmes avec les processus externes. Nous avons donc pu remplacer ou superposer la majeure partie de notre technologie existante avec Talend et il est devenu bien plus facile de la maintenir. »

Mise en place d'une base de données démographiques

Le projet d'Epsilon nécessitait la mise en place d'un fichier compilé regroupant des données géographiques et démographiques (âge, groupe ethnique, activité professionnelle, revenu, etc.) avec plus de 800 autres caractéristiques en annexe. Ces données arrivent sous plus d'une douzaine de formats différents, elles sont traitées avec la solution Talend puis chargées dans une base de données. « C'est une base de données conséquente, » explique Aaron Dix, « elle contient environ 430 millions d'entrées. Nous aurions pu diviser le travail entre plusieurs serveurs mais cela nous aurait fait perdre du temps et aurait nécessité un traitement manuel. » « A l'origine, les données sont importées dans des fichiers plats fixes ou délimités dans des formats ASCII, DOS ou UNIX, » poursuit Aaron Dix. « Talend intègre ces fichiers et les charge ensuite dans la plateforme Alterian Integrated Marketing. La solution Talend permet également de récupérer des fichiers et possède une gamme de composants très efficaces qui s'intègrent parfaitement à notre utilisation. »

« La génération de code est aussi un plus. Nous pouvons contrôler un job en examinant le code généré et ensuite l'adapter en fonction de nos besoins. Nous pouvons aussi créer un code qui sera ensuite exécuté depuis nos processus Talend. Lorsque nous ajoutons des routines, nous créons ou importons des composants issus de l'abondante bibliothèque de composants de Talend. Nous pouvons réutiliser environ 80% des composants en appelant simplement la routine développée. »

De Talend Open Studio for Data Integration à Talend Data Integration 

Avant de souscrire à la solution d'entreprise Talend Data Integration, Epsilon utilisait la solution Talend Open Studio for Data Integration, solution sous licence GPL. « Nous étions satisfaits de l'utilisation de Talend Open Studio for Data Integration, » explique Aaron Dix, « cependant, lorsque nous développions notre fréquence d'utilisation, nous étions confrontés à des problématiques de travail collaboratif, de centralisation des projets et du code, etc. Nous avons alors décidé de souscrire à Talend Data Integration et nous ne regrettons pas cet investissement. » Au-delà de la valeur ajoutée des caractéristiques développées pour des projets de plus grande ampleur, la souscription à Talend Data Integration comprend en plus un support technique et les garanties légales.

« Si vous travaillez sous différents systèmes, le produit reste efficace même s'il s'agit d'un simple test. Au lieu d'exporter manuellement votre code dans différents systèmes, Talend Data Integration vous laisse générer ce code et le tester sur les différents systèmes depuis un référentiel unique. Cela facilite sa réutilisation et le travail collaboratif, » poursuit Aaron Dix. Talend Data Integration est également utilisée par d'autres services de l'entreprise. « Nous avons un banc d'essai pour les projets ad hoc, » explique Aaron Dix. « Talend nous permet d'importer des données sous différents formats et de créer rapidement une base de données où nous pouvons les analyser. Nous possédons 10 licences à ce jour et nous envisageons d'en souscrire d'autres. »

Aller plus loin avec l'open source

En ce moment, Epsilon expérimente Talend Data Integration MPx Edition, dernière solution Talend basée sur la technologie FileScale, une technologie unique permettant aux organisations d'exécuter des traitements de données hautement parallèles. Talend Data Integration MPx Edition permet aux entreprises de traiter de gros volumes de données dans un temps extrêmement court et élimine les limitations caractéristiques des architectures traditionnelles d'intégration de données. « Nos jeux de données sont assez importants et se développent très rapidement. Nous sommes constamment à la recherche de technologies permettant d'accélérer et d'optimiser la parallélisation. Talend Data Integration MPx Edition est en cela une solution intéressante, » déclare Aaron Dix.