DataBase/ADsP
[ADsP][데이터의 이해] 데이터의 유형
bay07
2024. 4. 15. 11:31
정형데이터 | 고정된 필드가 있으며 연산이 가능하다 주로 관계형 데이터베이스(RDBMS)에 저장된다 형식이 정해져 있어서 처리가 쉽다 관계형 DB, 스프레드 시트, CSV( comma-separated values) 난이도 : ★ |
반정형데이터 | 스키마, 메타데이터와 같은 형태가 있다. 연산 불가능 주로 파일로 저장이 된다. API 형태로 제공되기 때문에, 데이터 처리기술 (parsing)이 필요하다 XML, HTML, JSON, log형태 (웹로그, 센서 데이터) 난이도 : ★ ★ |
비정형데이터 | 형태가 없다. 연산 불가능 주로 NoSQL에 저장된다 텍스트 마이닝 혹은 파일 데이터 형태로 파싱을 해야한다 소셜데이터(트위터, 페이스북), 영상, 이미지, 음성, 텍스트(word, PDF) 난이도 : ★ ★ ★ |