프로그래밍언어 R

R 변수와 자료형

초보개발자뀨 2021. 3. 14. 22:12

1. 변수와 객체

  -변수 이름 작성 규칙

  • 첫 자는 영문자로 시작합니다
  • 두 번쨰 단어는 숫자와 밑줄 문자_ 점 사용이 가능합니다.
  • 대문자와 소문자를 구별합니다.
  • 두 단어를 포함하여 변수 이름을 지정할 경우 두 번째 단어의 첫 자는 대문자로 표기합니다.
  • 한 번 정의된 변수는 재사용이가능하고, 가장 최근에 할당된 값으로 수정됩니다.

- 스칼라 변수

  • 밑 예시와  같이 한개의 값만 갖는 변수를 의미합니다.

 

- 벡터 객체  

  • R에서 가장 기본이 되는 자료구조입니다.
  • 생성 함수로는 c(), seq() , rep() 입니다
  • 자료 처리 함수로는 unino(), setdiff() , intersect() 가 있습니다

 

  • 만일 숫자형, 문자형이 혼합 될 경우에는 문자형으로 처리됩니다.

  •  벡터 자료 참조는  벡터변수이름[10:45] 면 인덱스 10~45까지의 값 , [c(10,45)]면 10번과 45번을 의미합니다. 주의할점은 단순하게 [10,45] 하게되면 10번 45번값이아닌 R에선 2차원 배열의 값으로 인식하기 떄문에 앞에 c를 붙여주셔야합니다.

  • 벡터 자료 참조에서 -를 사용하게되면 해당 인덱스를 제외하고라는 뜻이 됩니다.
  •  

 

- 벡터 객체 데이터 셋 이용하기

  • R의 패키지에는 예제를 목적으로 다양한 형태의 데이터셋을 이용할 수 있습니다. 우선 RSADBE 패키지를 다운받은 후 libary(RSADBE)로 메모리 상으로 불러온 뒤 data() 를 이용해 데이터 셋을 불러올 수 있습니다.

 

- Matrix 자료 구조 

  •  Matrix 구조는 행렬 구조라고도 하며 2차원의 배열 구조를 가집니다.
  •  생성 함수로는 matrix() ,rbind() ,cbind() 가 있습니다.
  •  처리 함수로는 apply()가 있습니다.

  • Matrix 함수는 matrix(data,nrow,ncol,byrow,dimnames) 으로 인자가 이어졋으며                                              각각 data, 행의 수 , 열의 수 , 행우선 T,F , 차원지저으로 쓰입니다.

  • apply()는 행렬 구조의 자료를 처리하는데 유용한 함수입니다.

 

- DataFrame 자료 구조

  •  R에서 가장 많이 사용되는 자료구조 중의 하나 입니다.
  • 데이터베이스의 테이블 구조와 흡사합니다.
  • 생성 함수로는 data.frame(), read.table() , read.csv()가 있습니다

data.frame(칼럼명1 = 값,칼럼명2 =값 ....칼럼명 n=값)
벡터객체를 이용도 됩니다!

  • 데이터 프레임 안에 칼럼 조회하기

data프레임 $ 변수이름 으로 하면 됩니다!

 

  • 자료 처리 함수로는 str() , ncol() , nrow(), apply() ,summary() , subset()등이 있습니다.
  •  

str은 데이터프레임 정보 , ncol은 열의 갯수 , nrow은 행의 갯수 ,summary는 프레임의 요약정보입니다!
subset은 조건에 따른 칼럼 조회입니다.