CS/데이터베이스

[데이터베이스] (1) 데이터베이스 기본 개념

dltjdn 2022. 2. 15. 03:17

데이터와 정보

  • 데이터( data ) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값
  • 정보( information ) : 의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물

 

데이터베이스 정의

데이터베이스란(DB)?

특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장운영 데이터의 집합

  • 공유 데이터 ( shared data ) : 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 데이터
  • 통합 데이터 ( integrated data ) : 최소의 중복과 통제 가능한 중복만 호용하는 데이터
  • 저장 데이터 ( stored data ) : 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
  • 운영 데이터 ( operational data ) : 조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터

 

데이터베이스 특징

  • 실시간 접근 : 사용자의 데이터 요구에 실시간으로 응답
  • 계속 변화 : 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
  • 동시 공유 : 서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원
  • 내용 기반 참조 : 데이터가 저장된 주소나 위치가 아닌 내용으로 참조  ex. 재고량이 100개 이상인 제품 이름을 검색하시오

 

데이터의 분류

정형 데이터 ( structured data )

구조화된 데이터 = 미리 정해진 구조에 따라 저장된 테이블

Ex) 엑셀 스프레드 시트, 관계 데이터베이스의 테이블

 

반정형 데이터 ( semi-structured data )

구조에 따라 저장된 데이터지만 데이터 내용 안에 구조에 대한 설명이 함께 존재

구조를 파악하는 파싱(parsing) 과정이 필요

Ex) HTML, JSON, XML 문서나 웹로그, 센서 데이터 등 보통 파일 형태로 저장 

아래는 JSON 예시이다

{

         "이름" :  "김땡땡",

         "나이" :  23,

         "성별" : "남"

}

비정형 데이터 ( unstructured data )

정해진 구조가 없이 저장된 데이터

Ex) 소셜 데이터(인스타, 페이스북 등) 의 텍스트, 영상, 이미지  / 워드나 Pdf 같은 멀티미디어 데이터