Բովանդակություն:

Որո՞նք են տարբեր ֆայլերի ձևաչափերը Hadoop-ում:
Որո՞նք են տարբեր ֆայլերի ձևաչափերը Hadoop-ում:

Video: Որո՞նք են տարբեր ֆայլերի ձևաչափերը Hadoop-ում:

Video: Որո՞նք են տարբեր ֆայլերի ձևաչափերը Hadoop-ում:
Video: Սև ծովի թուրքական հատվածում ի՞նչ պաշարներ են հայտնաբերվել 2024, Մայիս
Anonim

Բարեբախտաբար ձեզ համար, մեծ տվյալների համայնքը հիմնականում կարգավորվել է երեք օպտիմիզացվածի վրա ֆայլի ձևաչափեր մեջ օգտագործման համար Hadoop կլաստերներ՝ օպտիմիզացված տողերի սյունակ (ORC), Avro և Մանրահատակ:

Հետագայում, կարելի է նաև հարցնել, թե որո՞նք են տվյալների ձևաչափերի տարբեր տեսակները:

Կան երեք տվյալների տեսակները քարտեզագրում և GIS տվյալների ձևաչափեր . Յուրաքանչյուրը տիպ այլ կերպ է վարվում:

Տվյալների ձևաչափի տեսակները

  • Ֆայլերի վրա հիմնված- Shapefiles, Microstation Design Files (DGN), GeoTIFF պատկերներ:
  • Գրացուցակի վրա հիմնված - ESRI ArcInfo Coverages, ԱՄՆ մարդահամարի TIGER:
  • Տվյալների բազայի միացումներ - PostGIS, ESRI ArcSDE, MySQL:

Բացի այդ, ո՞ր ֆայլի ձևաչափն է լավագույնը hive-ում: RCFile-ը տողերի սյունակ է ֆայլի ձևաչափ . Սա մեկ այլ ձև է Hive ֆայլի ձևաչափ որն առաջարկում է տողերի սեղմման բարձր մակարդակ: Եթե դուք միաժամանակ մի քանի տողեր կատարելու պահանջ ունեք, ապա կարող եք օգտագործել RCFile-ը ձևաչափը.

Հաշվի առնելով սա՝ որո՞նք են Hadoop-ում մուտքագրման ընդհանուր ձևաչափերը:

InputFormat-ը ստեղծում է Inputsplit:

  • Առավել տարածված InputFormat են.
  • FileInputFormat- Սա հիմնական դասն է բոլոր ֆայլերի վրա հիմնվածInputFormat-ի համար:
  • TextInputFormat- Սա MapReduce-ի լռելյայն InputFormat-ն է:
  • KeyValueTextInputFormat- Այն նման է TextInputFormat-ին:
  • Հետևեք հղմանը Hadoop-ում InputFormat-ի մասին ավելին իմանալու համար:

Ի՞նչ է orc ֆայլի ձևաչափը Hadoop-ում:

ORC ֆայլի ձևաչափ Օպտիմիզացված տողերի սյունակ ( ORC ) ֆայլի ձևաչափ ապահովում է Hive-ի տվյալները պահելու բարձր արդյունավետ միջոց: Այն նախագծված էր մյուս Փեթակի սահմանափակումները հաղթահարելու համար ֆայլի ձևաչափեր . Օգտագործելով ORC ֆայլեր բարելավում է կատարումը, երբ Hiveis-ը կարդում է, գրում և մշակում տվյալները:

Խորհուրդ ենք տալիս: