728x90
반응형
cut 함수는 R 프로그래밍 언어에서 연속형 변수를 구간(빈)으로 나누는 데 사용되는 함수입니다. 주로 데이터의 구간별 분석이나 그룹화에 유용하게 활용됩니다.
cut(x, breaks, labels = NULL, right = TRUE, include.lowest = FALSE, ...)
- x: 나눌 연속형 변수(벡터)입니다.
- breaks: 나눌 구간(빈)의 경계값을 나타내는 벡터입니다. 구간은 연속적이어야 합니다.
- labels: 나눠진 구간에 할당할 레이블입니다. 이 매개변수를 지정하지 않으면 구간의 경계값이 레이블로 사용됩니다.
- right: 기본값은 TRUE이며, 이는 오른쪽 경계값을 포함하는 것을 의미합니다. FALSE로 설정하면 왼쪽 경계값을 포함합니다.
- include.lowest: TRUE로 설정하면 가장 낮은(최소) 구간에 속하는 값을 포함합니다. 기본값은 FALSE입니다.
사용 예시(나이를 범주화)
f_survey$나이2 = cut(f_survey$나이, c(2:9)*10, right=F, lables = paste0(c(2:8)*10, "대"))
f_survey[1:10, c("나이","나이2")]

728x90
반응형