빅데이터에서 사용하는 포멧 종류 및 설명
2019. 12. 19.
빅데이터를 다루다보면 다양한 file format을 만나게 됩니다. 오늘 포스팅에서는 file format들에 대해 알아보도록 하겠습니다. Delimiter separated file 가장 많이 쓰이는 raw text기반의 구분문자로 이루어진 배열입니다. 아래와 같이 평문으로도 저장, 조회할 수 있습니다. 아래는 콤마(,)로 구분자를 지정한 CSV(comma-separated values)의 예제를 보여줍니다. 직업,이름,날짜,성별,지역 학생,David,20190204,M,USA 사업가,James,20180305,M,Canada 비슷한 포멧은 아래와 같은 방식들이 있습니다. - TSV : tab separated value - SSV : space separated value 위와 같은 방식들을 모두 합..