Բովանդակություն:

Ինչպե՞ս կարող եմ բարելավել իմ sqoop-ի կատարումը:
Ինչպե՞ս կարող եմ բարելավել իմ sqoop-ի կատարումը:

Video: Ինչպե՞ս կարող եմ բարելավել իմ sqoop-ի կատարումը:

Video: Ինչպե՞ս կարող եմ բարելավել իմ sqoop-ի կատարումը:
Video: Ինչպես վարվել երբ վատ մտքերը գալիս են ձեր վրա ու խանգարում ձեր առաջնթացը 2024, Մայիս
Anonim

Օպտիմիզացնելու համար կատարումը , հավաքածու որ քարտեզի առաջադրանքների թիվը ավելի ցածր արժեքով, քան որ կապերի առավելագույն քանակը, որոնք որ տվյալների բազան աջակցում է: Վերահսկողություն որ զուգահեռության չափը, որ Sqoop կօգտագործվի տվյալների փոխանցման համար որ վերահսկելու հիմնական միջոցը որ բեռնել վրա քո տվյալների բազա։

Համապատասխանաբար, ի՞նչ է տեղի ունենում, եթե sqoop-ը ձախողվի պրոցեսի միջև:

Տիպիկ Sqoop աշխատանքը, որը տվյալների աղբյուրի տվյալների բազայից ներթափանցում է HDFS-ում, տվյալները պատճենելու է թիրախային գրացուցակում: Պատճենված ֆայլը պատրաստվում է ջնջվել եթե sqoop-ը ձախողվի առանց ավարտելու:

Կարելի է նաև հարցնել՝ ինչպե՞ս եք հասնում զուգահեռության sqoop-ում։ Վերահսկողություն Զուգահեռություն . Sqoop ներմուծում է տվյալներ տվյալների բազայի աղբյուրներից շատերից զուգահեռ: Դուք կարող եք նշել քարտեզի առաջադրանքների (զուգահեռ գործընթացների) քանակը, որոնք կօգտագործվեն ներմուծումն իրականացնելու համար՝ օգտագործելով -m կամ --num-mappers արգումենտը: Այս արգումենտներից յուրաքանչյուրն ընդունում է մի ամբողջ արժեք, որը համապատասխանում է աստիճանին զուգահեռականություն է վարձել

Հետևաբար, ինչպե՞ս կարող եմ բարելավել իմ Hive հարցումների կատարումը:

Ստորև բերված են պրակտիկաների ցանկը, որոնց մենք կարող ենք հետևել Hive Queries-ի օպտիմալացման համար:

  1. Միացնել սեղմումը Hive-ում:
  2. Օպտիմալացնել միացումները:
  3. Խուսափեք գլոբալ տեսակավորումից Փեթակում:
  4. Միացնել Tez Execution Engine-ը:
  5. Օպտիմալացնել LIMIT օպերատորը:
  6. Միացնել զուգահեռ կատարումը:
  7. Միացնել Mapreduce խիստ ռեժիմը:
  8. Single Reduce for Multi Group BY-ի համար:

Ինչպե՞ս է աշխատում sqoop split-ը:

Այն կարող է օգտագործվել ներմուծման կատարողականը բարձրացնելու համար՝ հասնելով ավելի մեծ զուգահեռության: Sqoop ստեղծում է պառակտումներ հիմնված աղյուսակի որոշակի սյունակի արժեքների վրա, որը նշված է. պառակտել - օգտագործողի կողմից ներմուծման հրամանի միջոցով: Եթե այն հասանելի չէ, մուտքագրման աղյուսակի հիմնական բանալին օգտագործվում է ստեղծելու համար պառակտումներ.

Խորհուրդ ենք տալիս: