Migration vers AWS EMR : quelle stratégie adopter

Migrer ses clusters Hadoop vers AWS EMR (Elastic MapReduce) présente de nombreux avantages.

AWS EMR est simple à utiliser
Amazon EMR simplifie la création et l'exploitation des environnements et applications Big Data. Les fonctionnalités d'EMR incluent le provisionnement, la mise à l'échelle managée et la reconfiguration des clusters et d'ERM Studio pour le développement collaboratif.

AWS EMR est élastique
Amazon EMR vous permet de mettre facilement et rapidement en service la capacité dont vous avez besoin et d'ajouter ou de supprimer de la capacité de façon automatique ou manuelle.

AWS permet de maîtriser les coûts
Amazon EMR est conçu pour réduire le coût du traitement de quantités importantes de données. Parmi les fonctionnalités qui abaissent son coût figurent la tarification basse à la seconde, l'intégration des instances Spot Amazon EC2 et des instances réservées Amazon EC2, l'élasticité ainsi que l'intégration d'Amazon S3.

Les magasins de données d'AWS EMR sont flexibles
Avec Amazon EMR, vous pouvez utiliser plusieurs magasins de données, y compris Amazon S3, le système de fichiers distribués Hadoop (HDFS) et Amazon DynamoDB.

Avec AWS EMR, vous pouvez utiliser vos applications open source préférées
Grâce au contrôle de version sur Amazon EMR, vous pouvez facilement sélectionner et utiliser les derniers projets open source dans votre cluster EMR, notamment des applications dans les écosystèmes Apache Spark et Hadoop.

AWS EMR prend en charge les outils Big Data
Amazon EMR prend en charge de puissants outils Hadoop tels qu'Apache Spark, Apache Hive, Presto et Apache HBase.

Avec AWS EMR, l'accès aux données est contôlé
Par défaut, les processus d'application Amazon EMR utilisent le profil d'instance EC2 lorsqu'ils appellent d'autres services AWS. Pour les clusters à locataires multiples, Amazon EMR offre trois options afin de gérer l'accès des utilisateurs aux données Amazon S3.

Migrer vers EMR : quel parcours de migration ?

La plupart des entreprises qui entreprennent de migrer leurs clusters Hadoop on premise ou IaaS vers AWS, optent pour une des stratégies suivantes :

  • Lift and Shift. Stratégie la moins risquée, garantit que votre déploiement en cloud disposera de ressources égales ou supérieures à celles de votre environnement sur site actuel.
  • Worklaod fit. Il ne s'agit pas d'un mapping un-à-un avec les hôtes du cluster. Nous analysons la charge de travail sur une période considérée et fondons nos recommandations sur cette charge de travail.
    Nous déterminons l'affectation optimale des types de VM pour répondre à vos exigences tout en minimisant les coûts. Cette méthode est généralement la plus rentable. 
    La stratégie d'adaptation de la charge de travail permet également aux entreprises de choisir le bon compromis entre prix et performances dans le cloud.

Choisir le bon partenaire pour vous aider à migrer vers AWS EMR

Claranet est partenaire AWS Premier Consulting et Managed Service. Nos experts du cloud et de la Data vous accompagnent dans la migration de vos clusters Hadoop on-premise ou sur IaaS, vers AWS EMR. Nous accompagnons vos équipes dans leur montée en compétence, et elles peuvent se concentrer sur leur coeur de métier.