Ի՞նչ է AWS MapReduce-ը:
Ի՞նչ է AWS MapReduce-ը:

Video: Ի՞նչ է AWS MapReduce-ը:

Video: Ի՞նչ է AWS MapReduce-ը:
Video: Rearrange #74 Արամ Ջիվանյան - Ի՞նչ է բիթքոինը, «NFT»-ն և ի՞նչ է սպասվում մեզ ապագայում 2024, Մայիս
Anonim

Amazon Elastic MapReduce (EMR)-ը Amazon վեբ ծառայություններ է ( AWS ) մեծ տվյալների մշակման և վերլուծության գործիք: Amazon EMR-ը մեծ տվյալներ է մշակում վիրտուալ սերվերների Hadoop կլաստերի միջոցով՝ Amazon Elastic Compute Cloud (EC2) և Amazon Simple Storage Service (S3):

Այս կերպ, ինչպե՞ս է աշխատում AWS EMR-ը:

Ծառայությունը սկսում է հաճախորդի կողմից սահմանված քանակով Amazon EC2 օրինակներ, որոնք բաղկացած են մեկ վարպետից և բազմաթիվ այլ հանգույցներից: Amazon EMR գործարկում է Hadoop ծրագրակազմը այս դեպքերի վրա: Հիմնական հանգույցը մուտքային տվյալները բաժանում է բլոկների և բաշխում է բլոկների մշակումը մյուս հանգույցներին:

Բացի վերևից, ո՞րն է տարբերությունը ec2-ի և EMR-ի միջև: Ի տարբերություն EMR , EC2 չի դասակարգում ստրուկ հանգույցները հիմնական և առաջադրանքային հանգույցների: Սա մեծացնում է HDFS տվյալների կորստի ռիսկը հանգույցի հեռացման/կորստի դեպքում: EC2 օգտագործում է Apache գրադարաններ (s3a) s3-ի տվյալների մուտք գործելու համար: Մյուս կողմից, EMR օգտագործում է AWS սեփական ծածկագիրը՝ s3-ին ավելի արագ մուտք ունենալու համար:

Բացի այդ, AWS EMR-ն ամբողջությամբ կառավարվա՞ծ է:

Amazon Էլաստիկ քարտեզի կրճատում ( EMR ) է լիովին կառավարվում է Hadoop և Spark հարթակ-ից Amazon Վեբ ծառայություն ( AWS ) Հետ EMR , AWS հաճախորդները կարող են արագ պտտել բազմահանգույց Hadoop կլաստերները՝ մեծ տվյալների աշխատանքային բեռները մշակելու համար:

AWS-ն օգտագործում է Hadoop?

Amazon Վեբ ծառայություններ օգտագործում է բաց կոդով Apache-ն Hadoop բաշխված հաշվողական տեխնոլոգիան հեշտացնելու համար մեծ քանակությամբ հաշվողական հզորություն մուտք գործելը տվյալների ինտենսիվ առաջադրանքներ կատարելու համար: Hadoop Google-ի MapReduce-ի բաց կոդով տարբերակը, արդեն օգտագործվում է այնպիսի ընկերությունների կողմից, ինչպիսիք են Yahoo-ն և Facebook-ը:

Խորհուրդ ենք տալիս: