본문 바로가기

dplyr2

filter( ) 함수: 케이스(행) 추출 실제 데이터를 분석할 때 일반적으로 데이터 전체를 사용하여 분석하기도 하지만 분석 목적에 따라 데이터의 일부를 추출해 분석하기도 한다. filter( ) 함수는 주어진 조건에 따라 데이터의 일부 케이스(행)를 추출할 때 많이 사용한다. 아래 그림의 예시와 같이 여러 케이스(행)에서 특정 조건(오렌지색)에 케이스(행)를 추출할 때 유용하게 적용할 수 있다. 아래 구체적인 예시를 통해 특정 조건을 설정하는 여러 방법에 대해 설명하고자 한다. Source: https://llearn.r-journalism.com/en/wrangling/dplyr/dplyr/ 본 포스팅에서는 분석할 때 편리를 위해 R에서 기본적으로 제공하는 airquality 데이터 세트를 사용한다. > airquality head(airqu.. 2021. 2. 25.
dplyr 패키지 개요 및 설치 1. dplyr 패키지 개요 R에서 기본적으로 제공하는 함수 외에 외부에서 제공하는 다양한 패키지를 사용한다면 데이터 처리와 가공 과정을 조금 더 편리하게 할 수 진행할 수 있다. 대표적으로 dplyr, tidyr, ggplot2 등 패키지들이 많이 사용되고 있다. 아래는 데이터 처리 단계에서 대표적으로 사용하는 dplyr 패키지에 대하여 설명한다. 출처: dplyr (https://dplyr.tidyverse.org/) 2. dplyr 패키지 함수 dplyr 패지키는 reshape2, tidyr, ggplot2 등 패키지와 함께 Hadley Wickham이 개발하여 배포하고 있으며, 현재 데이터 가공 및 처리 단계에서 많이 사용되고 있다. 이 패키지의 강점은 데이터 가공 및 처리에 유용한 여러 함수를 .. 2021. 2. 23.