Բովանդակություն:

Ի՞նչ է Dplyr փաթեթը R-ում:
Ի՞նչ է Dplyr փաթեթը R-ում:
Anonim

dplyr նոր է փաթեթ որն ապահովում է մի շարք գործիքներ տվյալների հավաքածուների արդյունավետ մանիպուլյացիայի համար Ռ . dplyr Plyr-ի հաջորդ կրկնությունն է՝ կենտրոնանալով միայն տվյալների շրջանակների վրա: dplyr ավելի արագ է, ունի ավելի հետևողական API և պետք է ավելի հեշտ լինի օգտագործել:

Բացի սրանից, ո՞րն է Dplyr փաթեթի օգտագործումը R-ում:

dplyr է R փաթեթ կառուցվածքային տվյալների հետ աշխատելու համար ինչպես ներսում, այնպես էլ դրսում Ռ . dplyr կատարում է տվյալների մանիպուլյացիա Ռ օգտվողները հեշտ, հետևողական և արդյունավետ: Հետ dplyr Որպես Spark DataFrames-ի մանիպուլյացիայի ինտերֆեյս, դուք կարող եք՝ ընտրել, զտել և համախմբել տվյալները:

Հետագայում հարցն այն է, թե ինչ է անում %>%-ը R-ում: Այնտեղ է շատ ձեռնարկներ խողովակների օպերատորի համար Ռ , պարզապես Google-ի համար: %>% օպերատորը է «խողովակ» օպերատոր, որը տվյալներ է փոխանցում ֆունկցիայի ելքից դեպի ձախ և դնում այն, ըստ նախնականի, աջ կողմում գտնվող ֆունկցիայի առաջին պարամետրի մեջ:

ինչպես կարող եմ ստանալ Dplyr R-ում:

Դուք կարող եք տեղադրել

  1. CRAN-ի վերջին թողարկված տարբերակը install.packages-ով («dplyr»)
  2. զարգացման վերջին տարբերակը github-ից if (packageVersion("devtools") < 1.6) { install.packages("devtools") } devtools::install_github("hadley/lazyeval") devtools::install_github("hadley/dplyr")

Ի՞նչ է անում Group_by-ը R-ում:

Groupby Գործառույթը մեջ Ռ – group_by սովոր է խումբ տվյալների շրջանակը Ռ . Dplyr փաթեթը ներսում Ռ ապահովված է group_by () ֆունկցիա, որը խմբավորում է տվյալների շրջանակը մի քանի սյունակներով՝ միջին, գումարով կամ ցանկացած այլ ֆունկցիաներով: Սեպալի միջին. Երկարությունը խմբավորված է ըստ Species փոփոխականի:

Խորհուրդ ենք տալիս: