ML
객체이름 정의(벡터,행렬)
selfstarter
2019. 8. 19. 22:51
객체이름 정의(벡터,행렬)
- gender라는 0, 1의 값을 가진 vector를 생성한 후 vector에 femail, mail이라는 값을 준다
- 그러면 0은 female, 1은 male이 된다
gender<-c(0,1)
names(gender)<-c("female", "male")
gender
length(gender)
범주형변수 생성(fector)
- factor()함수로 vector를 범주형변수로 생성할 수 있다.
- 분산분석에서 factor로 정의된 변수가 있어야 평균비교 가능.
- is.factor()함수로 범주형변수인지 확인할 수 있다.
- 순서가 없음
factor_func<-c("B","A","C","D")
this_factor<-factor(factor_func)
this_factor
범주형변수 생성(순서)
aaa<-c(0,1)
is.factor(this_factor)
is.factor(aaa)
test_factor<-factor(factor_func, ordered=TRUE, levels = c("A","B","C","D"))
test_factor
행렬에 이름주기
- dimnames : colnames와 같은 결과
- colnames : 각 열에 이름을 준다
- rownames : 각 행에 이름을 준다
- matrix(rnorm(12), nrow=4)는 12개의 값을 4x3행렬로 생성
- rnorm(random sampling from normal distribution)
- dim은 행렬의 차원 확인
- dimnames(x)[[1]]은 행렬의 첫번째. 행을 뜻하고, dimnames(x)[[2]]는 행렬의 두번째 값 열을 의미한다
x<-matrix(rnorm(12), nrow=4) x dim(x) dimnames(x)[[2]]<-paste("x",1:3,sep="") x y<-matrix(rnorm(12), nrow=4) colnames(y)<-c("y1","y2","y3") y dimnames(x)[[1]]<-paste("y",1:4,sep="") x
#### 행렬과 데이터 프레임
- 데이터 프레임은 행렬 뿐 아니라 변수명, 관측치 번호 등 여러정보를 저장. 그래서 행렬이 데이터 프레임이 되려면 as.data.frame을 사용
- 각 열은 변수열, 각행은 관측치
- 데이터 프레임은 평균, 편차를 구할 수 있음
- mean은 x라는 데이터 프레임의 x1의 평균 값을 구함
- sd는 표준편차를 구함
- summary는 전체에 대한 요약통계량
- 표로 보고 싶다면 Environment 창에서 Data의 x옆에 아이콘을 클릭한 후 표를 클릭하면 된다
x<-as.data.frame(x)
is.data.frame(x)
mean(x$x1)
sd(x$x1)
summary(x)
```