Ինչպե՞ս է կատարվում տվյալների տեղայնացումը Hadoop-ում:
Ինչպե՞ս է կատարվում տվյալների տեղայնացումը Hadoop-ում:

Video: Ինչպե՞ս է կատարվում տվյալների տեղայնացումը Hadoop-ում:

Video: Ինչպե՞ս է կատարվում տվյալների տեղայնացումը Hadoop-ում:
Video: Ինչպե՞ս է Globbing ը խաբում իր հաճախորդներին 2024, Մայիս
Anonim

Տվյալների տեղայնացում մեջ Hadoop . Վերցրեք Wordcount-ի օրինակը, որտեղ բառերի մեծ մասը կրկնվել է 5 լակ կամ ավելի անգամ: Այդ դեպքում Mapper փուլից հետո յուրաքանչյուր քարտեզագրող ելք կունենա 5 Lacs միջակայքի բառեր: Mapper ելքը LFS-ում պահելու այս ամբողջական գործընթացը կոչվում է Տվյալների տեղայնացում.

Հաշվի առնելով սա՝ ի՞նչ է տվյալների տեղայնացումը Hadoop-ում:

Հայեցակարգը Տվյալներ տեղանքում Hadoop Data տեղանքը MapReduce վերաբերում է հաշվարկը իրականին մոտ տեղափոխելու ունակությանը տվյալները բնակվում է հանգույցի վրա՝ մեծ տեղաշարժվելու փոխարեն տվյալները հաշվարկին։ Սա նվազագույնի է հասցնում ցանցի գերբեռնվածությունը և մեծացնում համակարգի ընդհանուր թողունակությունը:

Նաև ինչպե՞ս են պահվում մեծ տվյալները: Մարդկանց մեծամասնությունը HDFS-ը կամ Hadoop բաշխված ֆայլային համակարգը ավտոմատ կերպով կապում է Hadoop-ի հետ տվյալները պահեստներ. HDFS-ը տեղեկատվություն է պահում կլաստերներում, որոնք կազմված են ավելի փոքր բլոկներից: Այս բլոկներն են պահված տեղում ֆիզիկական պահեստավորում միավորներ, ինչպիսիք են ներքին սկավառակի կրիչները:

Այսպիսով, ինչպե՞ս են տվյալները պահվում Hadoop-ում:

Վրա Hadoop կլաստեր, որ տվյալները HDFS-ում և MapReduce համակարգը տեղակայված են կլաստերի յուրաքանչյուր մեքենայի վրա: Տվյալներ է պահված մեջ տվյալները արգելափակում է DataNodes-ում: HDFS-ը կրկնում է դրանք տվյալները բլոկներ, սովորաբար 128 ՄԲ չափով, և դրանք բաշխում է այնպես, որ դրանք կրկնօրինակվեն կլաստերի մի քանի հանգույցներում:

Ինչպե՞ս են ֆայլերը պահվում HDFS-ում:

HDFS մերկացնում է ա ֆայլ համակարգի անվանատարածք և թույլ է տալիս օգտագործողի տվյալները լինել պահված մեջ ֆայլեր . Ներքին, ա ֆայլ բաժանված է մեկ կամ մի քանի բլոկների, և այդ բլոկները պահված DataNodes-ի մի շարքում: NameNode-ն աշխատում է ֆայլ համակարգի անվանատարածքի գործողություններ, ինչպիսիք են բացումը, փակումը և վերանվանումը ֆայլեր և գրացուցակներ:

Խորհուրդ ենք տալիս: