[R] 사용되지 않는 level 제거하기 (feat. drop.levels함수)

#1번) 원데이터의 credit변수
head(data$credit)
##[1] 1 1 2 0 2 1
##Levels: 0 1 2

#2번) filter를 적용한 데이터의 credit변수
data2<-data%>%filter(data$credit%in%c(0, 1))
head(data2$credit)
##[1] 1 1 0 1 0 0
##Levels: 0 1 2

0, 1, 2의 값을 가질 수 있는 범주형 변수가 있다고 할 때, filter를 적용해 0, 1의 값만 가지는 관측치만 새로 생성했다.

하지만 levels은 0, 1, 2를 그대로 가지는 것을 확인할 수 있다.

이러한 경우 예전에 어떻게 처리했는지 기억이 나지 않아 검색을 해보니,

gdata 패키지의 drop.levels 함수를 사용하면 된다고 한다. 이렇게 !

data2$credit<-drop.levels(data2$credit)
head(data2$credit)
##[1] 1 1 0 1 0 0
##Levels: 0 1

'머신러닝, 딥러닝' 카테고리의 다른 글

[머신러닝] 8. 서포트 벡터 머신(feat. R Code) (0)	2021.09.12
[머신러닝] 7. 트리 기반의 방법- 배깅, 랜덤포레스트, 부스팅 (0)	2021.09.11
[머신러닝] 6. 선형성을 넘어서(비선형모델)- 다항식회귀, 계단함수, 스플라인, GAMs (feat. R Code) (0)	2021.04.26
[머신러닝] 5. 선형모델 선택 및 Regularization- Ridge, Lasso regression, PCR, PLS (feat. R Code) (0)	2021.04.25
[머신러닝] 3. 분류- 로지스틱 회귀, LDA, QDA (feat. R Code) (0)	2021.04.12

공부하고 기록하는 블로그

[R] 사용되지 않는 level 제거하기 (feat. drop.levels함수)

'머신러닝, 딥러닝' 카테고리의 다른 글

티스토리툴바

[R] 사용되지 않는 level 제거하기 (feat. drop.levels함수)

'머신러닝, 딥러닝' 카테고리의 다른 글

'머신러닝, 딥러닝' Related Articles

티스토리툴바