본문 바로가기

빅데이터/R5

[R] R을 이용하여 CSV 파일을 읽을 때 첫번째 문자가 깨지는 오류 해결 방법 R을 이용하여 파일을 읽을 때 첫 번째 칼럼의 이름이나 첫번재 데이터의 문자가 깨지는 경우가 있습니다. 이는 UTF-8 형식 문서의 BOM으로 인하여 문자가 깨진것으로 인식하기 때문입니다. 이를 해결하기 위하여 read.csv(fileEncoding="UTF-8-BOM") 처럼 fileEncoding을 BOM형식을 확인하도록 선언하여 주면 됩니다. # UTF-8의 BOM으로 인하여 파일이 깨짐 > mlbstat = read.csv(file = "mlb-player-stats-Batters.csv", header = T) > summary(mlbstat) 癤풮layer Team Pos G AB R H X2B Adeiny Hechavarria: 3 BAL : 28 1B: 76 Min. : 1.00 Min. .. 2019. 9. 16.
[R] 기본 함수: 연산,절대값,반올림,올림,버림,수열 R의 기본함수를 이용하는 방법입니다. 대입, 기본연산 절대값 반올림, 올림, 버림 수열 데이터 확인, 객체 구조 확인, 모드 확인 데이터 프레임 접근, 변경 데이터 병합 2019. 9. 10.
[R] 파일 읽기/쓰기 R에서 파일을 읽고 쓰는 방법은 다음과 같습니다. 에러 주의 사항 read.delim() 명령은 txt파일은 마지막 행에 공백이 있어야 합니다. 공백이 없으면 다음과 같은 오류가 발생합니다. > source = read.delim("source.txt", header=FALSE, sep=" ") Warning message: In read.table(file = file, header = header, sep = sep, quote = quote, : 'source.txt'에서 readTableHeader에 의하여 발견된 완성되지 않은 마지막 라인입니다 읽기/쓰기 함수 선택 R에서 문자를 읽고 쓰는 패키지는 다양하게 존재합니다. fread(), fwrite()가 기본라이브러리보다 빠른 속도를 보여주는 것.. 2019. 9. 9.
[R] 평균, 분산, 표준편차 R을 이용하여 평균, 분산, 표준편차를 구하는 방법을 알아보기 전에 먼저 평균, 분산, 표준편차에 대해서 알아보겠습니다. https://learnx.tistory.com/entry/%ED%86%B5%EA%B3%84%EC%9D%98-%EA%B8%B0%EC%B4%88%EC%9D%B8-%ED%8F%89%EA%B7%A0-%EB%B6%84%EC%82%B0-%ED%91%9C%EC%A4%80%ED%8E%B8%EC%B0%A8 통계의 기초인 평균, 분산, 표준편차 통계분석을 하면서 자주 접하는 기본단위인, 평균, 분산, 표준편차에 대해 알아봅니다. 1. 평균(mean, average): 주어진 수의 합을 측정개수로 나눈 값으로, 대표값 중 하나 2. 분산(Variance): 변량들이 퍼져있는.. learnx.tistor.. 2019. 5. 15.
[R] R 시작하기 R은 통계 연산과 그래프 생성을 위한 프로그래밍 언어입니다. R은 뉴질랜드의 오클랜드 대학에서 개발되어 전세계적으로 사용되고 있습니다. 사용자들이 생성한 여러가지 패키지가 있어서 통계자료 생성을 편리하게 할 수 있습니다. R을 시작하기 위해서는 먼저 R언어를 설치하고, 개발의 편리성을 위해 IDE인 R Studio를 설치합니다. https://www.r-project.org/ R: The R Project for Statistical Computing The R Project for Statistical Computing Getting Started R is a free software environment for statistical computing and graphics. It compiles an.. 2019. 4. 17.