Video: Ի՞նչ է DataFrame Loc-ը:
2024 Հեղինակ: Lynn Donovan | [email protected]. Վերջին փոփոխված: 2023-12-15 23:48
Pandas DataFrame : տեղ () ֆունկցիա
Այն տեղ () ֆունկցիան օգտագործվում է տողերի և սյունակների խումբ մուտք գործելու համար պիտակ(ներ)ով կամ բուլյան զանգվածով:. տեղ -ը հիմնականում հիմնված է պիտակների վրա, բայց կարող է օգտագործվել նաև բուլյան զանգվածով: Բուլյան զանգված, որն ունի նույն երկարությունը, ինչ առանցքը կտրատվում է, օրինակ. [Ճիշտ, Սխալ, Ճշմարիտ]:
Պարզապես, ո՞րն է LOC-ի օգտագործումը Python-ում:
տեղ մեթոդը մեթոդ է, որը վերցնում է միայն ինդեքսի պիտակները և վերադարձնում տող կամ տվյալների շրջանակ, եթե ինդեքսի պիտակը գոյություն ունի զանգահարողի տվյալների շրջանակում: CSV-ն ներբեռնելու համար օգտագործված կոդը, սեղմեք այստեղ:
Նաև գիտեք, թե որն է տարբերությունը ILOC-ի և Loc-ի միջև: տեղ ինդեքսից ստանում է տողեր (կամ սյունակներ) հատուկ պիտակներով: iloc ստանում է տողեր (կամ սյունակներ) որոշակի դիրքերում մեջ ինդեքս (այնպես որ այն վերցնում է միայն ամբողջ թվեր):
Բացի այդ, ի՞նչ է նշանակում լոկ պանդաների մեջ:
1. Կարծում եմ տեղ տեղանքն է, իսկ iloc-ը ամբողջ թիվ է: Ենթադրությունն այն է, որ գտնվելու վայրը նշանակում է, թե ինչ են իրական ցուցանիշները: Նախկինում այն ինձ տապալում էր, քանի որ ինդեքսը և ամբողջ թիվը երկուսն էլ սկսվում են «i»-ով:
Ի՞նչ է Loc-ը և ILOC-ը պանդաների մեջ:
տեղ հիմնված է պիտակների վրա, ինչը նշանակում է, որ դուք պետք է նշեք տողեր և սյունակներ՝ հիմնվելով դրանց տողերի և սյունակների պիտակների վրա: iloc հիմնված է ամբողջ թվի ինդեքսի վրա, այնպես որ դուք պետք է նշեք տողերն ու սյունակները իրենց ամբողջ թվով ինդեքսով, ինչպես նախորդ վարժությունում:
Խորհուրդ ենք տալիս:
Ինչպե՞ս կարող եմ կրկնել Pandas DataFrame-ի միջոցով:
Pandas-ն ունի iterrows() ֆունկցիա, որը կօգնի ձեզ շրջանցել տվյալների շրջանակի յուրաքանչյուր տող: Pandas-ի iterrows()-ը վերադարձնում է կրկնող, որը պարունակում է յուրաքանչյուր տողի ինդեքսը և յուրաքանչյուր տողի տվյալները՝ որպես շարք: Քանի որ iterrows()-ը վերադարձնում է iterator, մենք կարող ենք օգտագործել հաջորդ ֆունկցիան՝ տեսնելու iterator-ի բովանդակությունը
Ինչպե՞ս թողնել պանդաների DataFrame-ը:
DataFrames-ից տողերն ու սյունակները ջնջելու համար Pandas-ն օգտագործում է «թողնել» ֆունկցիան: Սյունակ կամ մի քանի սյունակ ջնջելու համար օգտագործեք սյունակ(ներ)ի անունը և նշեք «առանցքը» որպես 1: Այլապես, ինչպես ստորև բերված օրինակում, «սյուներ» պարամետրը ավելացվել է Pandas-ում, որը կտրում է «առանցքի» անհրաժեշտություն
Ի՞նչ է DataFrame-ը spark Scala-ում:
Spark DataFrame-ը տվյալների բաշխված հավաքածու է, որը կազմակերպված է անվանված սյունակներում, որն ապահովում է ագրեգատների զտման, խմբավորման կամ հաշվարկման գործողություններ և կարող է օգտագործվել Spark SQL-ի հետ: DataFrames-ը կարող է կառուցվել կառուցվածքային տվյալների ֆայլերից, առկա RDD-ներից, Hive-ի աղյուսակներից կամ արտաքին տվյալների բազաներից:
Ի՞նչ են անում Loc Do պանդաները:
Pandas DataFrame-ը երկչափ չափերով փոփոխվող, պոտենցիալ տարասեռ աղյուսակային տվյալների կառուցվածք է՝ պիտակավորված առանցքներով (տողեր և սյունակներ): Թվաբանական գործողությունները հավասարեցվում են ինչպես տողերի, այնպես էլ սյունակների պիտակների վրա: Pandas DataFrame. loc հատկանիշը հասանելի է տողերի և սյունակների խմբին ըստ պիտակ(ների) կամ բուլյան զանգվածի տվյալ DataFrame-ում
Ինչպե՞ս կարող եմ ցուցակից պատրաստել PySpark DataFrame:
Ես հետևում եմ այս քայլերին՝ բազմակի ցուցակից DataFrame ստեղծելու համար. Յուրաքանչյուր tuple պարունակում է տարիքով մարդու անուն: Ստեղծեք RDD վերը նշված ցանկից: Փոխակերպեք յուրաքանչյուր բազմակի մի շարք: Ստեղծեք DataFrame՝ կիրառելով createDataFrame-ը RDD-ում sqlContext-ի օգնությամբ