Ո՞րն է տվյալների մշակման շարժիչը Amazon Elastic MapReduce-ի հետևում:
Ո՞րն է տվյալների մշակման շարժիչը Amazon Elastic MapReduce-ի հետևում:

Video: Ո՞րն է տվյալների մշակման շարժիչը Amazon Elastic MapReduce-ի հետևում:

Video: Ո՞րն է տվյալների մշակման շարժիչը Amazon Elastic MapReduce-ի հետևում:
Video: ELK: Elasticsearch, logstash, beats (Часть 1) / Java Tech Talk 2024, Մայիս
Anonim

Amazon EMR օգտագործում է Apache Hadoop-ը որպես իր բաշխված տվյալների մշակման շարժիչ . Hadoop-ը բաց կոդով Java ծրագրային շրջանակ է, որն աջակցում է տվյալները - ինտենսիվ բաշխված հավելվածներ, որոնք աշխատում են մեծ կլաստերների վրա - ից ապրանքային տեխնիկա.

Ավելին, ի՞նչ է Amazon Elastic MapReduce-ը:

Amazon Elastic MapReduce ( EMR ) է Amazon վեբ ծառայություններ ( AWS ) մեծ տվյալների մշակման և վերլուծության գործիք: Amazon EMR մշակում է մեծ տվյալներ վիրտուալ սերվերների Hadoop կլաստերի վրա Amazon Elastic Հաշվարկային ամպ ( EC2 ) և Amazon Պարզ պահեստավորման ծառայություն ( S3 ).

Ավելին, արդյո՞ք Amazon EMR-ն ամբողջությամբ կառավարվում է: Դա ա լիովին կառավարվում է տվյալների լճի ծառայություն, որը կարող է անջատել տվյալների պահեստը հաշվողական ռեսուրսներից և փոխարենը դարձնում հաշվողական կլաստերները մասշտաբային, հասանելի՝ ըստ պահանջի օգտագործելու համար, և ներառում է մի քանի կլաստերների համար միևնույն տվյալների հավաքածուները միանգամից մուտք գործելու հնարավորություն:

Կարելի է նաև հարցնել, թե ինչպես է աշխատում AWS EMR-ը:

Ընդհանրապես, երբ դուք մշակում եք տվյալները Amazon EMR , մուտքագրված տվյալները պահվում են որպես ֆայլեր ձեր ընտրած հիմքում ընկած ֆայլային համակարգում, ինչպես օրինակ Amazon S3 կամ HDFS: Այս տվյալները մշակման հաջորդականությամբ անցնում են մի քայլից մյուսը: Վերջնական քայլը ելքային տվյալները գրում է նշված վայրում, ինչպիսին է Amazon S3 դույլ.

Ո՞րն է տարբերությունը ec2-ի և EMR-ի միջև:

Ի տարբերություն EMR , EC2 չի դասակարգում ստրուկ հանգույցները հիմնական և առաջադրանքային հանգույցների: Սա մեծացնում է HDFS տվյալների կորստի ռիսկը հանգույցի հեռացման/կորստի դեպքում: EC2 օգտագործում է Apache գրադարաններ (s3a) s3-ի տվյալների մուտք գործելու համար: Մյուս կողմից, EMR օգտագործում է AWS սեփական ծածկագիրը՝ s3-ին ավելի արագ մուտք ունենալու համար:

Խորհուրդ ենք տալիս: