카테고리 없음

cut 함수 (연속형 변수를 구간으로 나누는데 사용하는 함수)

chris3471 2024. 10. 5. 13:34
728x90
반응형

cut 함수는 R 프로그래밍 언어에서 연속형 변수를 구간(빈)으로 나누는 데 사용되는 함수입니다. 주로 데이터의 구간별 분석이나 그룹화에 유용하게 활용됩니다.

cut(x, breaks, labels = NULL, right = TRUE, include.lowest = FALSE, ...)

 

  • x: 나눌 연속형 변수(벡터)입니다.
  • breaks: 나눌 구간(빈)의 경계값을 나타내는 벡터입니다. 구간은 연속적이어야 합니다.
  • labels: 나눠진 구간에 할당할 레이블입니다. 이 매개변수를 지정하지 않으면 구간의 경계값이 레이블로 사용됩니다.
  • right: 기본값은 TRUE이며, 이는 오른쪽 경계값을 포함하는 것을 의미합니다. FALSE로 설정하면 왼쪽 경계값을 포함합니다.
  • include.lowest: TRUE로 설정하면 가장 낮은(최소) 구간에 속하는 값을 포함합니다. 기본값은 FALSE입니다.

 

사용 예시(나이를 범주화)

f_survey$나이2 = cut(f_survey$나이, c(2:9)*10, right=F, lables = paste0(c(2:8)*10, "대"))
f_survey[1:10, c("나이","나이2")]

cut 사용 예시

728x90
반응형