Ի՞նչ է Impala-ն մեծ տվյալների մեջ:
Ի՞նչ է Impala-ն մեծ տվյալների մեջ:

Video: Ի՞նչ է Impala-ն մեծ տվյալների մեջ:

Video: Ի՞նչ է Impala-ն մեծ տվյալների մեջ:
Video: Ի՞նչ կտա էներգետիկ ոլորտի ազատականացումը․ մատչելի էլեկտրաէներգիա արտադրողները չեն միացել ծրագրին 2024, Մայիս
Anonim

Իմպալա բաց կոդով զանգվածային զուգահեռ մշակման հարցումների շարժիչ է Apache Hadoop-ի նման կլաստերային համակարգերի վերևում: Այն ստեղծվել է Google-ի Dremel թղթի հիման վրա։ Դա ինտերակտիվ SQL հարցման շարժիչ է, որն աշխատում է Hadoop բաշխված ֆայլային համակարգի (HDFS) վերևում: Իմպալա օգտագործում է HDFS-ը որպես հիմքում ընկած պահեստ:

Այս առնչությամբ ի՞նչ է Իմպալան և փեթակը:

Ապաչի Փեթակ արդյունավետ ստանդարտ է SQL-in-Hadoop-ի համար: Իմպալա բաց կոդով SQL հարցումների համակարգ է, որը մշակվել է Google Dremel-ից հետո: Կլաուդերա Իմպալա SQL շարժիչ է HBase-ում և HDFS-ում պահվող տվյալների մշակման համար: Իմպալա օգտագործում է Փեթակ megastore և կարող է հարցում կատարել Փեթակ սեղաններ ուղղակիորեն:

Ավելին, ո՞րն է ավելի լավ փեթակ կամ Իմպալա: Ապաչի Փեթակ կարող է իդեալական չլինել ինտերակտիվ հաշվարկների համար, մինչդեռ Իմպալա նախատեսված է ինտերակտիվ հաշվարկների համար: Փեթակ խմբաքանակի վրա հիմնված է Hadoop MapReduce-ը, մինչդեռ Իմպալա է ավելին MPP տվյալների բազայի նման: Փեթակ աջակցում է բարդ տեսակներ, բայց Իմպալա չի. Ապաչի Փեթակ սխալ հանդուրժող է մինչդեռ Իմպալա չի աջակցում սխալների հանդուրժողականությանը:

Նաև հարցրեց, թե ինչու ենք մենք օգտագործում Impala-ն:

Իմպալա աջակցում է հիշողության մեջ տվյալների մշակմանը, այսինքն՝ այն մուտք է գործում/վերլուծում տվյալներ, որոնք է պահվում է Hadoop տվյալների հանգույցներում՝ առանց տվյալների շարժման: Դու կարող ես մուտք գործել տվյալներ օգտագործելով Impala օգտագործելով SQL-ի նման հարցումներ. Իմպալա ապահովում է տվյալների ավելի արագ մուտք HDFS-ում, համեմատած այլ SQL շարժիչների հետ:

Ի՞նչ է փեթակը մեծ տվյալների մեջ:

Ապաչի Փեթակ է տվյալները համար պահեստային համակարգ տվյալները ամփոփում և վերլուծություն և մեծերի հարցումների համար տվյալները համակարգեր բաց կոդով Hadoop հարթակում: Այն փոխակերպում է SQL-ի նման հարցումները MapReduce աշխատանքների՝ չափազանց մեծ ծավալների հեշտ կատարման և մշակման համար: տվյալները.

Խորհուրդ ենք տալիս: