Կարո՞ղ է Spark-ը կարդալ տեղական ֆայլերը:
Կարո՞ղ է Spark-ը կարդալ տեղական ֆայլերը:

Video: Կարո՞ղ է Spark-ը կարդալ տեղական ֆայլերը:

Video: Կարո՞ղ է Spark-ը կարդալ տեղական ֆայլերը:
Video: Подруги_Рассказ_Слушать 2024, Մայիս
Anonim

Մինչդեռ Կայծ աջակցում է բեռնումը ֆայլեր ից տեղական ֆայլային համակարգ, այն պահանջում է, որ ֆայլեր հասանելի են նույն ճանապարհով ձեր կլաստերի բոլոր հանգույցներում: Որոշ ցանցային ֆայլային համակարգեր, ինչպիսիք են NFS-ը, AFS-ը և MapR-ի NFS շերտը, ենթարկվում են օգտագործողին որպես սովորական ֆայլային համակարգ:

Հետագայում, կարելի է նաև հարցնել, թե ինչպես կարող եմ գործարկել կայծը տեղական ռեժիմում:

Մեջ տեղական ռեժիմ , կայծ աշխատատեղեր վազել մեկ մեքենայի վրա և կատարվում են զուգահեռ՝ օգտագործելով բազմաշերտություն. սա սահմանափակում է զուգահեռությունը (առավելագույնը) ձեր մեքենայի միջուկների քանակով: Դեպի վազել աշխատատեղեր տեղական ռեժիմ , նախ անհրաժեշտ է մեքենա վերապահել SLURM-ի միջոցով ինտերակտիվ եղանակով ռեժիմ և մուտք գործեք դրան:

Բացի վերևից, ի՞նչ է SC textFile-ը: textFile օրգ–ի մեթոդ է։ apache. SparkContext դասարան, որը կարդում է ա տեքստային ֆայլ HDFS-ից, տեղական ֆայլային համակարգից (հասանելի է բոլոր հանգույցներում) կամ ցանկացած Hadoop-ով աջակցվող ֆայլային համակարգի URI, և վերադարձրեք այն որպես տողերի RDD:

Այս առումով ի՞նչ է կայծային ֆայլը։

Այն Spark ֆայլ փաստաթուղթ է, որտեղ պահում ես քո ողջ ստեղծագործական բարությունը։ Այն սահմանել է հեղինակ Սթիվեն Ջոնսոնը: Այսպիսով, գիշերվա կեսին Post-it®-ի վրա գրառումներ անելու կամ գաղափարների համար տարբեր ամսագրեր նվիրելու փոխարեն, դուք ձեր բոլոր գաղափարները դնում եք մեկում: ֆայլ.

Ի՞նչ է զուգահեռ հավաքման կայծը:

Մենք նկարագրում ենք գործողությունները բաշխված տվյալների հավաքածուների վրա ավելի ուշ: Զուգահեռացված հավաքածուներ ստեղծվում են JavaSparkContext-ը զանգահարելով զուգահեռացնել մեթոդ գոյություն ունեցողի վրա Հավաքածու ձեր վարորդի ծրագրում: -ի տարրերը հավաքածու պատճենվում են՝ ձևավորելու բաշխված տվյալների բազա, որը կարող է զուգահեռաբար գործել:

Խորհուրդ ենք տալիս: