Quand on parle de Big Data, les performances sont essentielles !

article in Englisharticle in German

Talend vs Informatica – Benchmark Big Data

Si vous avez déjà dialogué avec un commercial Talend ou lu certains documents marketing proposés par mon équipe, vous connaissez notre message : dans le domaine des Big Data, les performances des solutions Talend sont largement supérieures à celles des produits de la concurrence.

Voyez par exemple la diapositive suivante (extraite de notre présentation de Talend 6):

Je réalise que certaines personnes pourraient considérer cette affirmation comme une simple allégation marketing. J'ai donc pensé qu'il serait judicieux de l'étayer par quelques preuves concrètes. Nous avons fait appel aux compétences de MCG Global Services, leader en gestion stratégique de l'information, pour définir des tests de benchmark et comparer les caractéristiques des solutions Talend Big Data Integration et Informatica Big Data Edition.

MCG a fait un excellent travail, à la fois pour ce benchmark et pour définir un ensemble de cas d'usage et de questions qui seront très utiles à la plupart des entreprises.

Exemples de questions :

- Nos clients et les visiteurs de notre site Internet déclenchent un certain nombre de vues. Quel est l'impact de ces vues sur les ventes ? En moyenne, combien de pages sont vues avant une décision d'achat (en ligne ou en magasin) ? (Cas d'usage 1)

- Quel est l'impact de nos campagnes promotionnelles à base de coupons sur nos ventes de produits ou l'utilisation de nos services ? Les clients et prospects qui consultent ou reçoivent nos promotions à base de coupons sont-ils incités à visiter notre site Web et à acheter plus de produits ou/et d'autres produits ? (Cas d'usage 2)

- Notre moteur de recommandation est-il efficace pour influencer ou stimuler les ventes ? Les clients ont-ils tendance à acheter plus de produits ou/et d'autres produits grâce à ces recommandations personnalisées ? (Cas d'usage 3)

Comme vous pouvez le constater dans la figure ci-dessous, le benchmark confirme les performances des solutions Talend. Pour plus de détails sur les conditions d'exécution et les résultats de ce benchmark, vous pouvez télécharger le rapport complet en cliquant sur ce lien.

 

Les figures ci-dessous présentent un aperçu des gains réalisés avec les solutions Talend et montrent que ces gains augmentent avec le volume de données.

Dans le match Talend-Informatica, il est très facile d'expliquer pourquoi la différence est si extraordinaire. De toute évidence, le traitement en mémoire (in-memory) d'Apache Spark permet aux utilisateurs Talend d'intégrer beaucoup plus rapidement leurs données. Spark s'appuie sur un mécanisme ultra-rapide d'appels vers des systèmes distants (RPC) qui optimise la distribution et planification des tâches. En outre, le traitement Spark repose sur un pool de threads et non sur un pool de processus exécutés par des machines virtuelles Java (JVM), ce qui lui permet de planifier et exécuter les tâches en quelques millisecondes, alors que la planification Informatica MapReduce exige parfois plusieurs secondes (ou minutes !) dans les clusters très actifs.

Avec Informatica Big Data Edition (qui ne supporte pas Spark directement), le comportement et les performances de Hive sur Spark dépendent de la configuration et puissance du moteur Hadoop.

Pour plus de détails sur ces tests de benchmark, n'hésitez pas à télécharger le rapport complet en cliquant sur ce lien.

Share

Leave a comment

Ajouter un commentaire

More information?