ScoreMD Valorise les Données de ses Clients à l’Aide de Talend Data Integration

Le spécialiste des services de Data Mining en mode ASP intègre d’importants volumes de données hétérogènes à l’aide de la solution d’intégration open source de Talend pour évaluer la capacité d’investissement des acheteurs en ligne.
Il était essentiel que la solution sélectionnée puisse s’intégrer dans une architecture de ce type, et le fait que Talend Data Integration soit Cloud-ready a grandement accéléré notre déploiement.
Vincent Teyssier, Responsable de l’Architecture Décisionnelle de ScoreMD

Optimiser les opérations marketing pour augmenter le retour sur investissement

ScoreMD, créée en 2009, fournit des services de Data Mining en mode ASP. La société compte parmi ses clients Mistergooddeal.com, Weekendesk, Relais & Châteaux, Florajet, Geny, Marketshot… Avec ses solutions PilotROI et Customer Insight, ScoreMD les aide à optimiser leurs opérations marketing en vue d’augmenter leur retour sur investissement. La société combine des données des annonceurs avec des données transactionnelles et comportementales – dont certaines sont issues de mesures de campagnes par e-mail, par exemple sur des promotions – pour calculer un score d’appétence, qui définit les préférences et le désir d’usage ou d’achat d’acheteurs en ligne. Les annonceurs utilisent ce score pour ajuster la pression commerciale exercée sur chaque individu (envoyer ou non des messages ? par téléphone ? par SMS ? etc.).

Intégrer d’importants volumes de données hétérogènes

ScoreMD doit donc intégrer une multitude de données hétérogènes, provenant de différentes plates-formes techniques de clients et de partenaires. Chaque jeu de données repose sur une nomenclature et des formats informatiques différents.

« Nous souhaitions industrialiser les processus de chargement et de transformation de données, tout en allégeant la charge liée à leur pilotage. L’intégration de données représente environ le tiers de notre service, il était donc essentiel de réfléchir, dès notre création, à un système permettant de préserver notre efficacité à mesure que les volumes traités augmenteraient » témoigne Vincent Teyssier, Responsable de l’Architecture Décisionnelle de ScoreMD. « Je maîtrisais bien Talend Open Studio for Data Integration et j’avais même participé au développement de plug-in. Parallèlement, l’équipe possédait une bonne culture Java et était donc à même de prendre rapidement en main l’outil. »

L’aspect budgétaire a également été pris en compte dans le choix final : « A couverture fonctionnelle équivalente, les solutions de Talend sont nettement moins chères que les autres solutions du marché. Nous avons donc réalisé des tests et pris conscience de la richesse de la bibliothèque de transformations de Talend, qui s’est beaucoup étoffée au fil du temps ; ce qui est moins le cas d’autres offres du même type » affirme Vincent Teyssier. « Nous avons finalement porté notre choix sur Talend Data Integration, pour bénéficier d’une part des services de support garantissant la réactivité de l’éditeur et d’autre part, de fonctionnalités plus riches, notamment de collaboration. »

Des traitements de données délivrés à terme via des Web Services

ScoreMD est aujourd’hui l’une des seules entreprises du marché capable de délivrer un service en production via le Cloud (Amazon Web Services) et via un service d’infogérance classique, ce dernier étant destiné aux entreprises ne souhaitant pas s’engager dans une démarche de Cloud. Le service Cloud repose sur une partition de l’infrastructure européenne d’Amazon (Virtual Private Cloud) et offre un mode de facturation « à l’utilisation », via un abonnement mensuel. Ce mode de facturation a été rendu possible par le développement d’un orchestrateur permettant de gérer les instances en fonction de la charge (scale in, scale out, marche, arrêt). Les serveurs Talend ne fonctionnent ainsi qu’à concurrence du temps strictement nécessaire aux opérations d’intégration de données ; la charge facturée correspond donc à un quart du coût d’un serveur traditionnel. Ce système permet en outre de monter en charge très rapidement, en profitant de la capacité d’extension quasi illimitée d’Amazon.

« Il était donc essentiel que la solution sélectionnée puisse s'intégrer dans une architecture de ce type, et le fait que Talend Data Integration soit Cloud-ready a grandement accéléré notre déploiement » ajoute Vincent Teyssier.

ScoreMD tire parti de Talend Data Integration pour charger les données dans une base de données PostGre SQL. Transformées en format ODS (Operational Data Store), elles sont ensuite analysées par trois experts à l’aide d’outils de Data Mining (Rapid Mining, R, SAS…). Les algorithmes de Data Mining sont déclenchés par Talend Data Integration lorsque les jobs de chargement et de transformation sont finalisés. Une fois les scores d’appétence calculés (et stockés dans la base de données), Talend Data Integration récupère les données, les transforme dans le format initial et les envoie au client (sous la forme de fichiers plats ou XML).

« A terme, nous allons développer des Web Services qui simplifieront nos échanges avec nos clients, réduiront leurs coûts et s’intègreront parfaitement dans leurs démarches SOA » précise Vincent Teyssier.

Parallèlement, le système d’alimentation de data marts dédiés au contrôle opérationnel des campagnes et au reporting repose également sur Talend Data Integration.

Flexibilité, maîtrise des coûts et time to value

Au-delà de la question du coût déjà évoquée et essentielle pour une entreprise en plein développement, ScoreMD apprécie la flexibilité de la solution de Talend, sa facilité de personnalisation et son intégration avec d’autres outils du marché, comme ceux de Jaspersoft qui sont utilisés pour la restitution.

« Dans une activité comme la nôtre, la flexibilité est capitale. Nous l’avons vu avec notre offre Cloud, mais de manière plus générale, toutes les solutions que nous utilisons doivent pouvoir être modifiées rapidement pour répondre à une demande d’un client et sans recourir à des compétences spécialisées et coûteuses, comme c’est le cas avec les éditeurs propriétaires. Les fonctions de personnalisation de Talend répondent au même type d’exigence, et la facilité de prise en main ainsi que de déploiement rendent l’outil immédiatement utilisable. Nous disposons ainsi d’un 'time to value' accéléré qui nous permet de nous concentrer pleinement sur le cœur de notre métier. La souplesse de Talend Data Integration est un avantage direct qui se traduit par des temps de développement réduits et des problématiques inédites qui se voient rapidement résolues » ajoute Vincent Teyssier.

Cette flexibilité est également renforcée par la simplicité de développement de composants complémentaires : « Nous avons créé deux composants Talend de géocodage (tirant parti de Google Maps) pour répondre rapidement à une demande d’un client. Ces développements ont permis d’enrichir notre offre, sans surcoût démesuré grâce à nos compétences Java. La réutilisation et l’industrialisation de tels composants/processus est d’une grande facilité » continue Vincent Teyssier.

Enfin, ScoreMD souligne la réactivité et la qualité du service de support de Talend, qui a su accompagner son équipe lors de la mise en œuvre ou du développement des composants.

Avec un œil sur le futur de ses activités, la société est en cours de mise en œuvre de Hadoop (map/reduce) afin de simplifier le développement d’applications capables de traiter d’importants volumes de données. « Ceci entre en cohérence avec les récentes annonces de Talend à propos du support d’Hadoop. Certains de nos jobs de Data Mining tirent parti de ce framework et nous étudions actuellement un déploiement de ces nouvelles fonctionnalités de support Hadoop, compte-tenu des volumes que nous gérons et de l’évolution de notre activité » conclut Vincent Teyssier. « Parallèlement, nous nous intéresserons l’année prochaine aux problématiques de qualité de données et réfléchissons dès maintenant à l’opportunité de proposer à nos clients un service dédié. Avec Talend, nous avons trouvé un partenaire fiable qui nous aide à apporter une valeur ajoutée à nos clients. »