728x90
반응형
01. 기본 개념
🔸데이터
- 관찰이나 측정을 통해 현실 세계에서 단순히 수집된 사실/값
- 적절한 처리를 거쳐야만 정보로서 가치를 가짐
🔸정보처리 시스템
- 데이터를 수집, 조직, 저장하고 정보를 생성, 분배하는 시스템
- 실세계의 방대한 데이터를 효과적으로 저장/운영하기 위한 기술이 필요 → "데이터베이스"
✅ 파일 처리 시스템 (데이터베이스 등장 전 사용)

- 정보 표현에서 1차원적인 저장 시스템
- 각 응용 프로그램이 특정한 응용을 위해 필요한 파일을 독립적으로 소유하고 관리
🔸파일 처리 시스템의 문제점
- 데이터 종속성(data dependency)
- 응용 프로그램과 데이터 사이의 1:1 상호 의존 관계
- 파일 구성 요소, 접근 방식 등이 변경되면 해당 응용 프로그램도 함께 변경
- 데이터 중복성(data redundancy)
- 한 시스템에 동일 데이터가 여러 개 존재
- 일관성, 보안성, 경제성, 무결성 확보 및 유지 곤란
→ 데이터 공용 불가➡️ "데이터베이스" 기술 등장
✅ 데이터베이스

- 한 조식의 여러 응용 시스템이 공유해서 사용하기 위한 통합, 저장, 운영 데이터의 집합
shared, 여러 응용 프로그램이 공동으로 소유하고 사용
integrated, 중복된 데이터를 배제하여 각 데이터의 일관성 유지
- 중복의 완전 배제가 아닌 "최소한의 제한적으로 통제한 범위 내에서의 중복"은 허용
stored, 컴퓨터가 접근 가능한 저장매체에 저장
operational, 어떤 조직의 목적과 유용성 측면에서 반드시 유지해야 할 데이터
- 단순한 입출력 데이터 및 처리 과정에서의 일시적인 데이터는 제외
🔸데이터베이스 특징
- 실시간 접근성
- DB에 수시로 접근하는 사용자의 요구를 즉시 처리하여 응답을 제공
- 계속적인 변화
- 삽입/삭제/갱신 등의 연산을 통해 새로운 데이터로 내용을 지속적으로 변화시킴 → 현실 세계의 상태를 정확히 반영한 데이터를 유지
- 동시 공유
- 서로 다른 목적을 가진 여러 사용자가 동시에 원하는 데이터에 접근
- 내용에 의한 참조
- 데이터가 저장된 위치/주소가 아닌 내용/값에 따라 데이터를 참조
🔸파일 처리 방식에 대해 향상된 특징
- 데이터베이스 시스템의 자기 기술성
- DB 시스템은 DB 자체뿐만 아니라 DB에 대한 정의/설명까지 포함(DB에 속하는 각 파일의 구조, 각 항목의 타입과 저장 형식, 데이터의 제약 조건 등이 시스템 카탈로그에 저장)
- 프로그램-데이터 독립성
- 데이터 파일의 구조에 대한 정보가 응용 프로그램으로부터 분리되어 관리
- 데이터 추상화
- 사용자에게 상세 정보보다 데이터에 대한 개념적 표현을 제공 → 보다 용이한 데이터 접근이 가능
- 다중 뷰 제공
- 한 DB에 대한 여러 사용자의 서로 다른 관점의 데이터 요구에 따라 필요한 부분만을 선별적으로 추출해서 볼 수 있는 기능 제공
- 데이터 공유
- 여러 사용자가 동시에 DB에 접근할 수 있는 기능 제공
- 다수 사용자의 트랜잭션 처리
- 동시성 제어 기능을 통해 다수 사용자가 동일 데이터를 동시에 변경하는 경우에도 데이터의 일관성을 보장
🔸데이터베이스의 장점
- 데이터의 *일관성
- 데이터의 *무결성
- 데이터의 보안
- 백업과 회복
- 표준화
- 응용 프로그램 개발 시간 단축
- 융통성
- 최신 정보의 가용성
- 규모의 경제성
*일관성: 현실 세계의 어느 한 사실을 나타내는 두 개 이상의 데이터 간의 일치 여부
*무결성: DB에 들어있는 데이터 값과 그것이 표현하는 현실 세계의 실제 값이 일치하는 정확성
🔸데이터베이스의 단점
- 운영비의 증대
- 백업과 회복의 오버헤드
- 복잡한 자료 처리
- 시스템의 취약성
02. 데이터베이스 시스템
✅ 데이터베이스 시스템
- 데이터를 데이터베이스에 저장하고 관리해서 필요한 정보를 생성하는 컴퓨터 중심 시스템
- 구성요소
- 데이터베이스
- 데이터베이스 관리 시스템
- 데이터 언어
- 데이터베이스 사용자
- 데이터베이스 관리자
- 데이터베이스 기계
✅ 데이터베이스 시스템 구조

- 외부 단계(뷰 단계)
- 각 사용자가 바라보는 개인적인 수준의 DB에 관한 것
- 개념 단계(논리적 단계)
- 범기관적(조직) 입장에서 DB의 전체 구조를 추상화하는 단계
- 물리적 저장구조의 세부 사항을 은폐하고, 어떤 데이터가 저장되었는지와 데이터 간에 존재하는 관계를 기술
- 내부 단계(물리적 단계)
- 저장장치 입장에서 데이터가 실제로 어떻게 저장되는가를 기술
🔸스키마(schema)
- DB 구조에 대한 정의와 제약 조건의 명세를 기술한 것
- 3가지 관점 → 외부 스키마, 개념 스키마, 내부 스키마

- 외부 스키마
- =서브스키마: 전체 DB의 한 논리적 부분만을 표현
- 개별 사용자(응용 프로그래머)가 관심을 두는 DB의 일부분만 기술
- 개별 사용자마다 이에 대응하는 여러 개의 외부 스키마가 존재
- 하나의 DB 시스템에는 여러 개의 외부 스키마가 존재
- 개념 스키마
- 모든 사용자/응용 프로그램이 필요로 하는 전체적이고 통합된 데이터베이스의 구조를 기술( )
- 모든 데이터 개체들에 대한 정의, DB 접근 권한, 보안 정책, 무결성 규칙 등에 대한 명세를 포함
- 모든 외부 스키마는 개념 스키마로부터 생성되고 지원됨
- 내부 스키마
- =저장 스키마: 개념 스키마에 대한 저장 구조를 정의
- 물리적인 데이터 구조를 정의
- 저장장치의 입장에서 데이터가 실제로 저장되는 방법을 기술
- 저장 레코드 형식, 인덱스 유무, 저장 필드의 표현 방법, 저장 레코드의 물리적 순서 등을 기술
- 물리적 레코드(페이지, 블록)와 저장장치의 특성(실린더, 트랙)은 고려하지 않음
🔸각 단계의 사상
- 각 스키마들을 매핑해주는
- 외부/개념 사상 → 논리적 데이터 독립성
- 특정 외부 스키마와 개념 스키마 사이의 대응 관계를 정의
- 응용 프로그램에 영향을 주지 않고 DB의 논리적 구조의 변경이 가능
- 하나의 논리적 구조로 많은 응용 프로그램이 요구하는 다양한 형태의 논리적 구조를 제공
- 개념/내부 사상 → 물리적 데이터 독립성
- 개념 스키마와 내부 스키마 사이의 대응 관계를 정의
- 논리적 구조에 영향을 주지 않고 실제 데이터에 대한 저장 양식의 변경이 가능
- 하나의 논리적 구조로 여러 가지 상이한 물리적 구조의 지원 가능
✅ 데이터베이스 관리 시스템(DBMS)
- 응용 프로그램이 데이터베이스를 공용할 수 있도록 관리해주는 소프트웨어 시스템
- 사용자와 데이터베이스 사이에 위치하며 DB의 구성, 접근 방법, 관리 유지 등에 관한 모든 책임과 권한을 갖고 모든 기능을 통합적으로 수행하여 사용자의 요구에 맞는 정보를 생성해 주는 소프트웨어
- 목적
- 응용 프로그램이 데이터에 종속되지 않는 데이터의 독립성 제공
🔸개념적인 수준의 작업 과정(in 관계형 데이터베이스 관리 시스템)
- 사용자는 SQL과 같은 언어를 이용하여 데이터 접근을 요구
- DBMS가 요구를 받아 분석
- 외부스키마, 대응하는 외부와 개념 스키마 접속, 개념 스키마, 개념과 내부 스키마 접속 그리고 기억장소 구조 정의순으로 차례대로 검토
- 저장된 데이터베이스에 필수적인 연산을 수행
필수 기능
- 정의(definition)
- 물리적으로 구현된 하나의 DB 구조로부터 여러 사용자들의 다양한 요구에 부응할 수 있도록 가장 적합한 DB 구조를 정의하는 기능
- 조작(manipulation)
- 사용자와 DB 사이의 상호작용을 위한 수단 → 사용자가 연산 도구를 통해 DB에 체계적으로 접근하고 조작할 수 있는 기능
- 제어(control)
- 공용 목적으로 관리되는 DB의 내용을 정확하고 안전하게 유지시키는 기능 → 데이터 무결성 유지, 보안 유지 및 권한 검사, 동시성 처리 등
✅ 데이터 언어
- DBMS와의 통신 수단
- 기능/목적에 따라 → 데이터 정의어, 데이터 제어어, 데이터 조작어
▪️ 데이터 정의어(DDL, Data Definition Language)
- DB의 구조, 데이터 형식, 처리 방식 등을 정의하는 언어
- 개념 스키마를 정의하기 위해서 주로 사용
- 데이터베이스 설계자 또는 관리자가 주로 사용
- 3단계의 데이테베이스 시스템 구조가 명확하게 구분되는 경우
- 뷰 정의어: 외부 스키마를 정의하기 위한 언어
- 기억장소 정의어: 내부 스키마를 정의하기 위한 언어
▪️ 데이터 제어어(DCL, Data Control Language)
- 데이터 공유와 정확하고 안전한 사용을 위해 데이터 제어를 정의하고 기술하는 언어
- 데이터베이스 관리자가 사용해서 데이터 보안, 무결성, 데이터 회복, 동시성 제어 등과 관련된 명령어들을 통해서 데이터를 관리
▪️ 데이터 조작어(DML, Data Manipulation Language)
- DB에 대한 검색, 수정, 삽입, 삭제 등의 조작을 위한 언어
- 절차적 데이터 조작어
- 필요한 데이터를 어떻게(how)구하는 지를 명시해야 하는 조작어
- 응용 프로그램 속에 삽입되어 사용 → 한 번에 하나의 레코드를 검색하여 처리
- "one-record-at-a-time 데이터 조작어", "저수준 데이터 조작어"
- 비절차적 데이터 조작어
- 어떻게 구하는지는 명시하지 않고, 어떤(what) 데이터가 필요한지만을 명시
- "선언적 언어", "고수준 데이터 조작어"
- 질의어(SQL), 데이터 부속어
✅ 데이터베이스 사용자
- 데이터베이스에 접근하는 사람의 총칭
- 일반 사용자: 터미널에서 SQL과 같은 질의어로 DB의 정보에 단순히 접근하는 사람
- 응용 프로그래머: 일반 호스트 언어와 데이터 부속어를 통해 DB에 접근하는 사람
- 데이터베이스 관리자: 데이터베이스 시스템 별도의 한 구성요소로 취급
✅데이터베이스 관리자(DBA, DataBase Administrator)
- DDL과 DCL를 통해 DB를 정의하고 제어할 목적으로 접근하여 관리하는 사람
- 데이터를 여러 사람이 공용할 수 있도록 관리하고 제어하는 사람
- DB에 대한 접근 권한 설정, 제작과 갱신, 보전과 관리, 성능 변경 요구에 대한 응답 등의 의무를 가짐
- 조직의 모든 전산 업무, DBMS, 관련 H/W와 S/W 등에 대한 상당한 지식이 필요
✅ 데이터베이스 기계
- "데이터베이스 컴퓨터"
- DB 관리 기능을 효율적으로 수행할 수 있도록 특화되어 설계된 하드웨어/소프트웨어
- 후위 처리기, 지능형 저장장치, 내용에 의한 참조 메모리, 병렬 처리, 데이터베이스 연산기 등을 포함
03. 데이터 모델링 & 개체-관계 모델
✅ 데이터 모델링
- 현실 세계의 데이터를 데이터 모델 상의 데이터베이스 구조로 변환하는 과정
- 실세계의 일부분을 DB 시스템이 지원하는 데이터 모델의 형태로 DB를 표현하는 과정
▪️ 데이터 모델
- 데이터 타입, 데이터의 연산, 데이터의 의미 및 일관성 제약 조건 등의 DB 구조를 명시하기 위한 개념의 집합
- 지원하는 개념의 타입에 따라 → 개념적 모델, 논리적 모델, 물리적 모델
🔸개념적 모델
- 현실 세계에서 주요 데이터를 추출하여 개념 세계의 데이터로 변환하는 과정에서의 모델
- 사용자가 데이터를 인식하는 방법과 밀접한 개념 제공
- 대표적 모델: 개체-관계 모델(E-R 모델)
🔸E-R(Entity-Relationship)모델

- 개체 타입과 이들 간의 관계 타입을 이용해서 실세계를 사람이 이해할 수 있도록 개념적으로 표현하는 방법
- 그래프에 기반을 둔 모델 → "개체-관계 다이어그램(ERD)"
✅ 개체

- 데이터로 표현하려는 실세계의 유무형의 모든 것
- 컴퓨터 파일구조에서 하나의 레코드에 대응
- 하나 이상의 속성으로 구성
- 속성
- 데이터의 가장 작은 논리적 단위
- 각 개체의 특성이나 상태를 설명
- 컴퓨터 파일 구조에서 필드에 대응
- 종류: 단일값 속성, 다중값 속성, 단순 속성, 복합 속성, 유도 속성 등
- 속성
✅ 관계

- 개체 집합 사이의 대응성(사상)을 의미
- 개체 집합 간의 관계 정보를 표현하는 수단
- 미리 어떤 관계를 정의해 놓고 주어진 값을 정의된 관계에 따라 해석하면 유용한 의미 표현이 가능
🔸개체 간의 관계

▪️ 두 개체 집합 X와 Y 관계에서
- "개체 Y가 개체 X에 종속되어 있다"
- 개체 X가 존재하는 경우에만 개체 Y가 존재할 수 있고, 개체 X가 삭제되면 Y도 함께 삭제되는 경우
- 개체 X = 오너 개체, 개체 Y = 약한 개체
- "전체 참여한다/필수적으로 참여한다"
- 개체 X의 모든 인스턴스가 관계에 반드시 참여하는 경우
- ↔ "부분 참여한다, 선책적으로 참여한다"
✅E-R다이어그램


🔸논리적 모델(구현 모델)
- 개념 세계의 데이터를 데이터베이스에 저장할 구조로 표현하는 과정에서의 모델
- 개념적 모델과 물리적 모델의 중간에 위치한 모델
- 데이터 구성에 대한 세부적인 사항은 숨기고 사용자가 이해할 수 있는 정도의 데이터 저장에 대한 개념 제공
- 종류: 계층형 모델, 네트워크형 모델, 관계형 모델, 객체지향형 모델, 객체 관계형 모델
계층형 모델 | 네트워크형 모델(망형 모델) | 관계형 모델 |
![]() ▪️ 트리 형태로 표현 ▪️ 두 개체 사이의 관계 → 1:n 관계 = 부모-자식 관계 |
![]() ▪️ 그래프 형태로 표현 ▪️ 링크로 표현된 데이커 간의 관계 → 오너-멤버 관계 |
14강 참고 |
객체지향형 모델 | 객체 관계형 모델 | |
▪️ 데이터와 절차를 일체화된 단위로 다루는 객체 지향의 개념을 잘 모아서 정의해 높은 집합 - 실세계에서 존재하는 개념적 객체를 중심으로 모델링 하는 방식 |
▪️ 관계형 모델과 객체지향형 모델의 장점을 결합한 가장 진보된 형태 - 관계형 시스템에서 새로운 객체 저장 능력을 추가한 형태 |
🔸물리적 모델
- 저장장치 입장에서 데이터가 어떻게 저장되어 있는지에 대한 세부적인 사항을 기술하는 개념 제공
- 레코드 형식, 레코드 순서, 접근 경로 등의 정보 제공
728x90
반응형
'KNOU > 컴퓨터과학개론' 카테고리의 다른 글
[컴퓨터과학개론] 6. 알고리즘(2) (0) | 2022.12.10 |
---|---|
[컴퓨터과학개론] 5. 알고리즘 (1) | 2022.11.18 |
[컴퓨터과학개론] 4. 자료구조(2) (0) | 2022.10.10 |
[컴퓨터과학개론] 3. 자료구조(1) (1) | 2022.09.26 |
[컴퓨터과학개론] 2. 컴퓨터와 자료(2) (1) | 2022.09.22 |