DataBase/ADsP

[ADsP][데이터의 이해] 데이터의 유형

bay07 2024. 4. 15. 11:31

 

정형데이터  고정된 필드가 있으며 연산이 가능하다
주로 관계형 데이터베이스(RDBMS)에 저장된다
형식이 정해져 있어서 처리가 쉽다

관계형 DB, 스프레드 시트, CSV( comma-separated values)

난이도 : ★

 

CSV 파일

 


반정형데이터 스키마, 메타데이터와 같은 형태가 있다.
연산 불가능 
주로 파일로 저장이 된다. 

API 형태로 제공되기 때문에, 데이터 처리기술 (parsing)이 필요하다 

XML, HTML, JSON, log형태 (웹로그, 센서 데이터)

난이도 : ★


비정형데이터 형태가 없다. 
연산 불가능 
주로 NoSQL에 저장된다 

텍스트 마이닝 혹은 파일 데이터 형태로 파싱을 해야한다

소셜데이터(트위터, 페이스북), 영상, 이미지, 음성, 텍스트(word, PDF)


난이도 : ★