AWS Elastic MapReduce

La plateforme la plus fiable pour le Big Data et l'analyse évolutive
genericImageAlt
UNE NOUVELLE FAÇON DE TRAITER DE GRANDS VOLUMES DE DONNÉES

En remplaçant les clusters sur site complexes par une solution entièrement gérée, AWS Elastic MapReduce (EMR) offre évolutivité, fiabilité et rentabilité pour l'analyse à grande échelle.

Reconnu comme l'un des services Big Data les plus utilisés dans le cloud, AWS EMR permet à l'utilisateur d'exécuter facilement et efficacement des frameworks tels qu'Apache Spark, Apache Hadoop, Apache Hive, Presto et Apache HBase. Il en résulte une réduction significative du temps, des coûts et de la complexité lors du traitement de pétaoctets de données. De plus, AWS EMR s'intègre facilement à d'autres services AWS, permettant la création de solutions de données et d'analyse modernes et hautement évolutives.

Fonctionnement d'AWS EMR

AWS EMR est un service de gestion des mégadonnées entièrement géré qui simplifie le traitement des mégadonnées à l'aide d'outils open source. Il provisionne, configure et adapte automatiquement les clusters en fonction de la demande, garantissant ainsi à la fois flexibilité et performances.

Grâce à AWS EMR, votre entreprise peut exécuter des analyses interactives, des pipelines d'extraction, de transformation et de chargement (ETL), des charges de travail d'apprentissage automatique (ML) ou le traitement de journaux à grande échelle, sans avoir à se soucier de la gestion de l'infrastructure.

Avantages

  • Évolutivité à la demande : augmentez ou réduisez rapidement la capacité de votre cluster, en ne payant que ce que vous utilisez.
  • Optimisation des coûts : réduisez vos dépenses grâce aux instances à durée déterminée et à l'auto-scaling.
  • Intégration native à l'écosystème AWS : connectez-vous facilement à Amazon S3, Amazon RDS et Amazon Redshift.
  • Simplification des opérations : le service gère les correctifs, le provisionnement et la surveillance, libérant ainsi votre équipe pour qu'elle puisse se consacrer à l'innovation.
  • Charges de travail flexibles : de l'apprentissage automatique à l'analyse de données en temps réel, le tout dans un environnement agile et sécurisé.

Applications pratiques

  • Traitement du Big Data : charges de travail Apache Hadoop, Apache Spark ou Apache Hive pour analyser les journaux, les clics et les données de l'Internet des objets.
  • Lacs de données et analyse : création de lacs de données dans Amazon S3 avec des requêtes rapides et évolutives.
  • Apprentissage automatique : entraînement et traitement de modèles distribués à grande échelle.
  • ETL à grande échelle : transformations de données complexes avec des performances élevées et à faible coût.
  • Recherche et science des données : environnements temporels et flexibles pour l'exploration d'ensembles de données massifs.

AWS EMR fait partie d'un écosystème d'analyse avancée au sein d'AWS :

  • Amazon S3 : stockage sécurisé et durable pour de grands volumes de données.
  • AWS Glue : catalogues de données et orchestration des pipelines.
  • Amazon CloudWatch : surveillance et observabilité des clusters.
  • AWS IAM : sécurité robuste et contrôle d'accès.
  • Amazon SageMaker : apprentissage automatique à grande échelle intégré au traitement des données.

Contactez nos experts.

gft-contact-rafael-suguihara.png
Rafael Suguihara
Head of the AWS Global Unit
message
dataProtectionDeclaration