Comparer tous les produits d'intégration Cloud

Essai Gratuit

 Cloud Data IntegrationCloud Big Data IntegrationCloud Data Management PlatformCloud Big Data PlatformCloud Real-Time Big Data Platform
Commencer mon essai gratuit Commencer mon essai gratuit Commencer mon essai gratuit Commencer mon essai gratuit Commencer mon essai gratuit 

Licence

Souscription par utilisateurSouscription par utilisateurSouscription par utilisateurSouscription par utilisateurSouscription par utilisateur
Licences par abonnement avec garantie et indemnisation

Outils de conception et de productivité

Générer du code natif Spark Streaming
Mappage visuel pour les données XML/EDI complexes sur Spark
Module de conception de jobs Spark et MapReduce
Génère le code natif (Spark et MapReduce) en batch
Module de planificateur de jobs Hadoop avec YARN
Sécurité Hadoop pour Kerberos
Data lakes : importer, charger et décharger des données
Outil de développement et de conception de jobs reposant sur Eclipse
Environnements de développement SDLC
Travail collaboratif avec référentiel partagé
Intégration en continu
Livraison en continu
Mappage visuel des données XML/EDI complexes
Audit, comparaison de jobs, analyse d'impact, tests, débogage et mise au point
Passerelle pour l'importation/exportation de métadonnées et la gestion centralisée des métadonnées
Schéma dynamique, joblets réutilisables et projets de référence
Gestionnaire de référentiel
Support des tâches ETL et ELT
Versionnage
Modification de la capture des données (CDC)
Génération automatique de la documentation
Publication dans le cloud

Éléments

Objets Hadoop : HDFS, HBase, HCatalog, Hive, Pig, Sqoop
Gestion des fichiers : ouvrir, déplacer, compresser, décompresser sans script
Contrôler et orchestrer les flux de données et les intégrations de données avec les jobs maîtres
Mapper, agréger, trier, enrichir et fusionner les données
Connectivité avec l’Internet des objets (IoT) AMQP, MQTT

Connecteurs

Cloud : Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform, etc.
Distributions supportées : Amazon EMR, Azure HDInsight, Cloudera, Google Dataproc, Hortonworks, MapR.
Spark MLlib (classification, clustering, recommandation, régression)
NoSQL : Cassandra, Couchbase, DynamoDB, MongoDB, Neo4j, etc.
Bases de données RDBMS/SGDBR : Oracle, Teradata, Microsoft SQL Server, etc.
SaaS: Marketo, Salesforce, NetSuite, etc.
Applications commerciales : SAP, Microsoft Dynamics, Sugar CRM, etc.
Technologies : Dropbox, Box, SMTP, FTP/SFTP, LDAP, etc.
Nettoyage, masquage et résolution des erreurs
En option, services de validation des adresses par des tiers
Modules de messagerie performants (Kafka, Kinesis, Flume)

Qualité et gouvernance des données

Masquage et nettoyage des données
Automatiser la résolution des erreurs de qualité des données et appliquer les règles
Découverte sémantique avec détection automatique de structures
Survivance complète
Échantillonnage des données
Enrichissement, harmonisation, correspondance floue (fuzzy matching) et déduplication.

Qualité des big data

Opérations sur les données : nettoyage, profilage, masquage, analyse et correspondance sur Spark et Hadoop.
Machine learning pour correspondance et déduplication des données
Supporte Cloudera Navigator et Apache Atlas
Profilage des fichiers HDFS

Profilage avancé des données

Détection des structures frauduleuses à l'aide de la loi de Benford
Statistiques performantes avec seuils indicateurs
Analyse des groupes de colonnes
Analyse performante des correspondances
Analyse de corrélation des colonnes temporelles

Préparation et gérance des données

Possibilité d'importer, exporter et combiner des données à partir de tout fichier de base de données, Excel ou CSV
Export vers les solutions Tableau
Accès à la demande et en libre-service aux datasets validés
Partager les préparations de données et les datasets
Déployer les préparations de données dans tout flux d'intégration de données ou de big data
Déployer les préparations de données dans tout flux d'intégration en cloud
Opérations sur les données : découverte automatique, standardisation, profilage, suggestions intelligentes et visualisation
Opérations sémantiques : découverte automatique, standardisation et profilage automatique des types sémantiques personnalisés
Échantillonnage intelligent et sélectifs et cycles d’exécution complets
Suivi et masquage des données avec sécurité en fonction des rôles
Fonctions de nettoyage et d'enrichissement
Application de gouvernance pour l’agrégation et la certification des données

Administration et supervision

Haute disponibilité, équilibrage de charge, basculement des jobs
Gestion des utilisateurs, des groupes, des rôles, des projets et des licences.
Plan d’exécution, planification en fonction du temps et des événements
Gestion du contexte (développement, assurance qualité, production)
Supervision globale des activités
Clusters de moteurs
Adresses IP statiques
Exporter les logs vers S3

Contacter le service commercial

Pour toute information sur la collecte et l’utilisation de vos données personnelles, notre politique de confidentialité et de sécurité et vos droits en matière de protection de vos données, veuillez vous référer à notre politique de confidentialité.