Groupon tire le meilleur parti de Talend Data Integration

De meilleures affaires avec Talend
Talend est une solution facile à utiliser, adaptable et extrêmement polyvalente. A l’aide de l’interface graphique, nous pouvons relier facilement et rapidement un grand nombre de sources via des connecteurs standards.
Rafael Herrera, , Responsable mondial de la BI chez Groupon

Client

Lancé en novembre 2008 à Chicago, Groupon a, depuis, ouvert plus de 1000 implantations régionales et s’appuie aujourd’hui sur plus de 10 000 salariés répartis dans 48 pays. De nombreux consommateurs de New York à Hong Kong et d’Oslo à Cape Town ne peuvent plus imaginer leur vie sans Groupon. La plate-forme Groupon propose des milliers de bonnes affaires chaque jour. Site majeur au cœur de l’organisation Groupon, le bureau de Berlin a en charge les systèmes d’information, la gestion des produits et le marketing en ligne, pour le compte de plus de 35 pays.

Le business model de Groupon a révolutionné la manière dont les entreprises conquièrent de nouveaux clients. Outre le fait que ses partenaires cherchent à séduire des clients, à vendre des produits ou à promouvoir les meilleurs séjours touristiques, Groupon interagit avec plus de personnes, de manière plus directe et plus rapidement que tout autre site. Dans le monde entier, des centaines de millions d’abonnés à la newsletter et d’utilisateurs de smartphones recourent à Groupon pour trouver les meilleures choses à faire, à voir, à manger et à acheter. La clé de la réussite de Groupon réside dans des tarifs imbattables, obtenus auprès des meilleurs partenaires locaux, ce qui donne aux consommateurs toutes les raisons de faire confiance au site et d’essayer une nouvelle expérience d’achat.

Challenge

L’infrastructure informatique de Groupon supporte l’ensemble des activités commerciales de la société. La croissance exceptionnelle de Groupon – qui est passé, en quelques années seulement, du statut de start-up à celui d’un géant d’Internet – a toutefois généré une pression considérable sur cette infrastructure. L’important volume de données – qui représentent un élément vital de Groupon – pose d’importants défis. Chaque jour, l’entreprise doit traiter plus d’un teraoctet de données brutes en temps réel et stocker ces informations dans plusieurs bases de données.

Le bureau de Berlin gère ces données pour le compte de plus de 30 pays d’Europe, d’Amérique du Sud, d’Asie et de la région Pacifique (qui inclut l’Australie et la Nouvelle Zélande). Pour soutenir les prises de décision du management, Groupon s’appuie sur une plate-forme décisionnelle MicroStrategy, exploitant elle-même un datawarehouse Teradata. MicroStrategy assure en outre le reporting. Groupon utilise les solutions d’intégration de données de Talend pour charger dans le datawarehouse des données issues de différentes sources, puis pour les transformer et les exporter vers plusieurs systèmes cibles.

Solution

« Comme toutes les start-up, nous avons démarré nos activités avec une infrastructure informatique reposant quasi entièrement sur des technologies open source » se souvient Rafael Herrera, Responsable mondial de la BI chez Groupon. « La principale priorité pour nous à l’époque – parallèlement à la maîtrise des coûts – était l’évolutivité. Nous cherchions un système capable de supporter notre rythme accéléré de croissance. Simultanément, nous exploitons des solutions propriétaires, ce qui signifie que le modèle de licence n’est pas un élément déterminant pour nous. La technologie open source de Talend est aujourd’hui un composant stratégique de notre système d’information. »

Depuis 2011, la plate-forme d’intégration de données centrale de Groupon repose sur Talend. Au début, l’entreprise a déployé Talend Open Studio for Data Integration, la version communautaire gratuite de Talend. Devant le succès obtenu par les premiers projets d’intégration, la direction a rapidement décidé de migrer vers Talend Data Integration.

Chaque jour, Groupon exécute environ 1000 jobs d’intégration de données, impliquant des opérations d’extraction, de transformation et de chargement (ETL). Certains de ces jobs sont exécutés une fois par jour, d’autres toutes les heures, voire même plus fréquemment. En parallèle, la solution d’intégration de données de Talend charge des données dans plusieurs bases de données. Hormis le datawarehouse principal Teradata, Groupon exploite des bases de données PostgreSQL et Exasol, ainsi qu’une solution de CRM de Salesforce. Les systèmes d’e-mailing marketing et de traitement des transactions en ligne (OLTP) forment les principales sources de données.

La plupart des données gérées par Groupon sont générées par son système d’e-mailing marketing, qui représente l’un des outils les plus stratégiques de l’entreprise. L’objectif est d’aligner les activités marketing plus étroitement avec les préférences et les besoins de groupes spécifiques. Toutes ces données clients, issues de plus de 30 pays, sont chargées dans le datawarehouse par la plate-forme d’intégration de Talend. Groupon s’appuie sur une solution OLTP pour prendre en charge quelque 2000 transactions chaque jour. Cette solution open source tire parti d’une base de données PostgreSQL. Toutes les 5 minutes, la plate-forme Talend copie les données du système OLTP dans le datawarehouse Teradata. Les données clients sont également chargées depuis plusieurs sources dans la solution de CRM de Salesforce, puis synchronisées toutes les heures dans le datawarehouse, pour offrir en permanence à Groupon une version unique de la vérité.

Bénéfices

« Talend est une solution facile à utiliser, aisément adaptable et extrêmement polyvalente » affirme Rafael Herrera. « A l’aide de l’interface graphique, nous pouvons relier facilement et rapidement un grand nombre de sources via des connecteurs standards. Pour connecter la base de données Teradata, nous avons dû développer l’interface nous-mêmes, mais la tâche était particulièrement aisée pour nos développeurs. »

La principale mission de la plate-forme Talend est d’alimenter aussi rapidement que possible le datawarehouse de données issues de sources très variées – dont les systèmes de CRM, d’e-mailing marketing et OLTP. Les données agrégées sont ensuite accessibles par les commerciaux sur le terrain et leurs responsables les utilisent pour étayer leurs prises de décision.

 « La nature même de notre business model exige que nous analysions d’énormes volumes de données en quasi temps réel, afin d’identifier des développements ou de nouvelles tendances à mesure qu’ils émergent. Grâce à notre solution d’intégration Talend, notre datawarehouse est actualisé en permanence et nous donne une image très précise de la situation » poursuit Rafael Herrera. « Au final, la qualité des prises de décision reflète la qualité des données. Et nos données sont toujours d’excellente qualité – grâce à Talend. »