Ի՞նչ է մանրահատակի տվյալների ձևաչափը:
Ի՞նչ է մանրահատակի տվյալների ձևաչափը:

Video: Ի՞նչ է մանրահատակի տվյալների ձևաչափը:

Video: Ի՞նչ է մանրահատակի տվյալների ձևաչափը:
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Մայիս
Anonim

Ապաչի Մանրահատակ ազատ և բաց կոդով սյունակային է տվյալները պահեստավորում ձևաչափը Apache Hadoop էկոհամակարգից: Այն համատեղելի է մեծ մասի հետ տվյալները մշակման շրջանակներ Hadoop միջավայրում: Այն ապահովում է արդյունավետ տվյալները կոմպրեսիոն և կոդավորման սխեմաներ՝ բարելավված կատարողականությամբ՝ բարդությունները կարգավորելու համար տվյալները մեծաքանակ:

Պարզապես, ո՞րն է մանրահատակի ֆայլի ձևաչափը:

Մանրահատակ , բաց կոդով ֆայլի ձևաչափ Hadoop-ի համար։ Մանրահատակ պահում է ներդիր տվյալների կառուցվածքները հարթ սյունակով ձևաչափը . Համեմատած ավանդական մոտեցման հետ, որտեղ տվյալները պահվում են շարքի վրա հիմնված մոտեցմամբ, մանրահատակ ավելի արդյունավետ է պահպանման և կատարողականի առումով:

Ավելին, ինչի՞ համար է օգտագործվում մանրահատակը: Մանրահատակ բաց կոդով ֆայլի ձևաչափ է, որը հասանելի է Hadoop էկոհամակարգի ցանկացած նախագծի համար: Ապաչի Մանրահատակ նախատեսված է տվյալների արդյունավետ, ինչպես նաև կատարողական հարթ սյունակային պահպանման ձևաչափի համար՝ համեմատած տողերի վրա հիմնված ֆայլերի հետ, ինչպիսիք են CSV կամ TSV ֆայլերը:

Բացի այդ, ինչպես է մանրահատակի ձևաչափը պահում տվյալները:

ՏՎՅԱԼՆԵՐ BLOCK Յուրաքանչյուր բլոկ է մանրահատակ ֆայլն է պահված տողերի խմբերի տեսքով։ Այսպիսով, տվյալները մեջ մանրահատակ ֆայլը բաժանված է մի քանի տող խմբերի: Այս տողերի խմբերն իրենց հերթին բաղկացած են մեկ կամ մի քանի սյունակի կտորներից, որոնք համապատասխանում են սյունակում տվյալները հավաքածու. Այն տվյալները յուրաքանչյուր սյունակի կտորի համար, որը գրված է էջերի տեսքով:

Արդյո՞ք մանրահատակը ընթեռնելի է մարդու համար:

ORC, Մանրահատակ , և Avro-ն նույնպես մեքենայական են ընթեռնելի երկուական ձևաչափեր, ինչը նշանակում է, որ ֆայլերը նման են անհեթեթության մարդկանց . Եթե պետք է մարդ - ընթեռնելի JSON-ի կամ XML-ի նման ձևաչափով, ապա հավանաբար պետք է նորից մտածեք, թե ինչու եք առաջին հերթին օգտագործում Hadoop-ը:

Խորհուրդ ենք տալիս: