selfstarter

객체이름 정의(벡터,행렬) 본문

ML

객체이름 정의(벡터,행렬)

selfstarter 2019. 8. 19. 22:51

객체이름 정의(벡터,행렬)

  • gender라는 0, 1의 값을 가진 vector를 생성한 후 vector에 femail, mail이라는 값을 준다
  • 그러면 0은 female, 1은 male이 된다
gender<-c(0,1)
names(gender)<-c("female", "male")
gender

length(gender)

범주형변수 생성(fector)

  • factor()함수로 vector를 범주형변수로 생성할 수 있다.
  • 분산분석에서 factor로 정의된 변수가 있어야 평균비교 가능.
  • is.factor()함수로 범주형변수인지 확인할 수 있다.
  • 순서가 없음
factor_func<-c("B","A","C","D")
this_factor<-factor(factor_func)
this_factor

범주형변수 생성(순서)

aaa<-c(0,1)
is.factor(this_factor)
is.factor(aaa)

test_factor<-factor(factor_func, ordered=TRUE, levels = c("A","B","C","D"))
test_factor

행렬에 이름주기

  • dimnames : colnames와 같은 결과
  • colnames : 각 열에 이름을 준다
  • rownames : 각 행에 이름을 준다
  • matrix(rnorm(12), nrow=4)는 12개의 값을 4x3행렬로 생성
  • rnorm(random sampling from normal distribution)
  • dim은 행렬의 차원 확인
  • dimnames(x)[[1]]은 행렬의 첫번째. 행을 뜻하고, dimnames(x)[[2]]는 행렬의 두번째 값 열을 의미한다
    x<-matrix(rnorm(12), nrow=4)
    x
    dim(x)
    dimnames(x)[[2]]<-paste("x",1:3,sep="")
    x
    y<-matrix(rnorm(12), nrow=4)
    colnames(y)<-c("y1","y2","y3")
    y
    dimnames(x)[[1]]<-paste("y",1:4,sep="")
    x
    

#### 행렬과 데이터 프레임

-   데이터 프레임은 행렬 뿐 아니라 변수명, 관측치 번호 등 여러정보를 저장. 그래서 행렬이 데이터 프레임이 되려면 as.data.frame을 사용
-   각 열은 변수열, 각행은 관측치
-   데이터 프레임은 평균, 편차를 구할 수 있음
-   mean은 x라는 데이터 프레임의 x1의 평균 값을 구함
-   sd는 표준편차를 구함
-   summary는 전체에 대한 요약통계량
-   표로 보고 싶다면 Environment 창에서 Data의 x옆에 아이콘을 클릭한 후 표를 클릭하면 된다

x<-as.data.frame(x)
is.data.frame(x)
mean(x$x1)
sd(x$x1)
summary(x)
```

'ML' 카테고리의 다른 글

python Numpy 정리  (0) 2019.10.08
Python List,Tuple,Dictionary,String  (0) 2019.09.17
R 벡터, 행렬 생성 함수  (0) 2019.08.17
R 추가 패키지 설치  (0) 2019.08.16
R프로그램 기본 함수  (0) 2019.08.15
Comments