1장 - 논리 데이터베이스 설계 | 섹션7. 정규화(Normalization), 섹션8. 반정규화(Denormalization), 섹션9. 시스템 카탈로그

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

개발공부기록

1장 - 논리 데이터베이스 설계 | 섹션7. 정규화(Normalization), 섹션8. 반정규화(Denormalization), 섹션9. 시스템 카탈로그 본문

2024 정보처리기사 2차 합격/필기 3강 - 데이터베이스 구축

1장 - 논리 데이터베이스 설계 | 섹션7. 정규화(Normalization), 섹션8. 반정규화(Denormalization), 섹션9. 시스템 카탈로그

소소한나구리 2024. 5. 4. 23:04

728x90

2024년도 시나공 필기 책 내용 정리

섹션7. 정규화(Normalization)

1. 정규화의 개요

함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어가는 과정
하나의 종속성이 하나의 릴레이션에 표현될 수 있도록 분해해가는 과정
제1정규형, 제2정규형, 제3정규형, BCNF형, 제4정규형, 제5정규형이 있으며 차수가 높아질수록 만족시켜야 할 제약조건이 늘어남
데이터베이스의 논리적 설계 단계에서 수행하며 논리적 처리 및 품질에 큰 영향을 미침
정규화된 데이터 모델은 일관성, 정확성, 단순성, 비중복성, 안정성 등을 보장함
정규화 수준이 높을수록 유연한 데이터구축이 가능하고 데이터의 정확성이 높아지는 반면 물리적 접근이 복잡하고 너무 많은 조인으로 인해 조회 성능이 저하됨

2. 정규화의 목적

데이터 구조의 안정성 및 무결성을 유지
어떠한 릴레이션이라도 데이터베이스 내에서 표현가능하게 만듦
효과적인 검색 알고리즘을 생성할 수 있음
데이터 중복을 배제하여 이상(Anomaly)의 발생 방지 및 자료 저장 공간의 최소화가 가능
데이터 삽입 시 릴레이션을 재구성할 필요성을 줄임
데이터 모형의 단순화가 가능
속성의 배열 상태 검증이 가능
개체와 속성의 누락 여부 확인이 가능
자료 검색과 추출의 효율성을 추구함

3. 이상(Anomaly)의 개념 및 종류

정규화를 거치지 않으면 데이터베이스 내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상이 발생하는데 이를 이상(Anomaly)이라 하며 삽입이상, 삭제이상, 갱신이상이 있음
삽입 이상(Insertion Anomaly) : 릴레이션에 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들도 삽입되는 현상
삭제 이상(Deletion Anomaly) : 릴레이션에서 한 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는 연쇄가 일어나는 현상
갱신 이상(Update Anomaly) : 릴레이션에서 튜플에 있는 속성값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 모순이 생기는 현상

4. 정규화의 원칙

정보의 무손실 표현, 즉 하나의 스키마를 다른 스키마로 변환할 때 정보의 손실이 있어서는 안됨
분리의 원칙, 즉 하나의 독립된 관계성은 하나의 독립된 릴레이션으로 분리시켜 표현해야 함
데이터의 중복성이 감소되어야 함

5. 정규화 과정

1NF(제 1정규형)
- 릴레이션에 속한 모든 도메인(Domain)이 원자값(Atomic Value)만으로 되어 있는 정규형
- 릴레이션의 모든 속성 값이 원자 값으로만 되어있는 정규형(위와 같은 말)
- 릴레이션의 모든 속성이 단순 영역에서 정의 됨
2NF(제 2정규형)
- 릴레이션 R이 1NF이고 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속을 만족하는 정규형

함수적 종속(Funcional Dependency)

데이터들이 어떤 기준값에 의해 종속되는 것을 의미
ex) 수강 릴레이션이 학번, 이름, 과목명으로 되어 있을 때 학번이 결정되면 과목명에 상관없이 학번에는 항상 같은 이름이 대응됨, 학번에 따라 이름이 결정될 때 이름을 학번에 함수 종속적이라고 하며 학번 -> 이름과 같이 씀

완전 함수적 종속

어떤 테이블 R에서 속성 A가 다른 속성 집합 B 전체에 대해 함수적 종속이지만 속성 집합 B의 어떠한 진부분집합 C에는 함수적 종속이 아닐 때 속성 A는 속성 집합 B에 완전 함수적 종속이라 함

부분 함수적 종속

어떤 테이블 R에서 속성 A가 다른 속성 집합 B 전체에 대해 함수적 종속이면서 속성 집합 B의 어떠한 진부분집합에도 함수적 종속일 때 속성 A는 속성 집합 B에 부분 함수적 종속이라 함

완전/부분 함수적 종속의 이해

완전 함수적 종속은 어떤 속성이 기본키에 대해 완전히 종속적일 때를 말함
ex) 수강 릴레이션이 학번,과목명,성적,학년으로 되어있고 학번,과목명이 기본키 일 때 성적은 학번과 과목명이 같을경우에는 항상 같은 성적이 옴(성적은 학번과 과목명에 의해서만 결정됨), 성적은 기본키(학번,과목명)에 완전 함수적 종속이 됨
ex) 학년은 과목명에 관계없이 학번이 같으면 항상 같은 학년이 옴(기본키의 일부인 학번인 의해서 학년이 결정됨) 학년은 부분 함수적 종속이라 함

3NF(제 3정규형)
- 릴레이션 R이 2NF이고 기본키가 아닌 모든 속성이 기본키에 대해 이행적 종속을 만족하지 않는 정규형
- 이행적 종속: A -> B 이고 B -> C일 때 A -> C를 만족하는 관계
- 무손실 조인 or 종속성 보존을 저해하지 않고도 항상 3NF 설계를 얻을 수 있음
BCNF(Boyce-Codd 정규형)
- 릴레이션 R에서 결정자가 모두 후보키(Candidate Key)인 정규형(학번 -> 이름일 때 학번은 결정자, 이름은 종속자라고 함)
- 3NF에서 후보키가 여러 개 존재하고 서로 중첩되는 경우에 적용하는 강한 제3정규형이라고도 함
- 모든 BCNF가 종속성을 보존하는 것은 아님
- BCNF의 제약조건
  - 키가 아닌 모든 속성은 각 키에 대하여 완전 종속해야 함
  - 키가 아닌 모든 속성은 그 자신이 부분적으로 들어가 있지 않은 모든 키에 대하여 완전종속 해야함
  - 어떤 속성도 키가 아닌 속성에 대해서는 완전 종속일 수 없음
4NF(제 4정규형)
- 릴레이션 R에 다치 종속 A ->> B가 성립하는 경우 R의 모든 속성이 A에 함수적 종속 관계를 만족하는 정규형
- 다치종속(Multi Valued Depundency, 다가 종속) : A,B,C 3개의 속성을 가진 릴레이션 R에서 어떤 복합 속성(A, C)에 대응하는 B 값의 집합이 A 값에만 종속되고 C 값에는 무관하면 B는 A에 다치종속이라함
5NF(제 5정규형, PJ/NF)
- 릴레이션 R의 모든 조인 종속이 R의 후보키를 통해서만 성립되는 정규형
- 조인종속(Join Dependency) : 릴레이션 R의 속성에 대한 부분집합 A, B, ..., C가 있을 때 R이 자신의 프로젝션 A, B, ..., C를 모두 조인한 결과가 자신과 동일한 경우 릴레이션 R은 조인 종속을 만족한다고 함

정규화 과정 정리

비정규 릴레이션 -> 도메인이 원자값 / 1NF -> 부분적 함수 종속 제거 / 2NF -> 이행적 함수 종속 제거 / 3NF -> 결정자이면서 후보키가 아닌 것 제거 / BCNF -> 다치 종속 제거 / 4NF -> 조인 종속성 이용 / 5NF

섹션8. 반정규화(Denormalization)

1. 반정규화의 개요

시스템의 성능 향상, 개발 및 운영의 편의성 등을 위해 정규화된 데이터 모델을 통합, 중복, 분리하는 과정으로 의도적으로 정규화 원칙을 위배하는 행위
시스템의 성능이 향상되고 관리 효율성은 증가하지만 데이터의 일관성 및 정합성이 저하될 수 있으며 과도한 반정규화는 오히려 성능을 저하시킬 수 있음
사전에 데이터의 일관성과 무결성을 우선으로 할지, 데이터베이스의 성능과 단순화를 우선으로 할지를 결정해야함
테이블 통합, 테이블 분할, 중복 테이블 추가, 중복 속성 추가등이 있음

2. 테이블 통합

두 개의 테이블이 조인(Join)되는 경우가 많아 하나의 테이블로 합쳐 사용하는 것이 성능 향상에 도움이 될 경우 수행
두 개의 테이블에서 발생하는 프로세스가 동일하게 자주 처리되는 경우, 두 개의 테이블을 이용하여 항상 조회를 수행하는 경우 테이블 통합을 고려
1:1 관계 테이블 통합, 1:N 관계 테이블 통합, 슈퍼타입/서브타입 테이블 통합이 있음
테이블 통합 고려사항
- 데이터 검색은 간편하지만 레코드 증가로 인해 처리량이 증가함
- 입력, 수정, 삭제 규칙이 복잡해질 수 있음
- Not Null, Default, Check 등의 제약조건(Constraint)을 설계하기 어려움

3. 테이블 분할

테이블을 수직 또는 수평으로 분할하는 것
수평 분할(Horizontal Partitioning)
- 레코드를 기준으로 테이블을 분할
- 레코드별로 사용 빈도의 차이가 큰 경우 사용 빈도에 따라 테이블을 분할
수직 분할(Vertical Partitioning)
- 하나의 테이블에 속성이 너무 많을 경우 속성을 기준으로 테이블을 분할
- 갱신 위주의 속성 분할: 데이터 갱신 시 레코드 잠금으로 인해 다른 작업을 수행할 수 없으므로 갱신이 자주 일어나는 속성들을 수직 분할하여 사용
- 자주 조회되는 속성 분할: 테이블에서 자주 조회되는 속성이 극히 일부일 경우 자주 사용되는 속성들을 수직 분할하여 사용
- 크기가 큰 속성 분할: 이미지나 2GB 이상 저장될 수 있는 텍스트 형식등으로 된 속성들을 수직 분할하여 사용
- 보안을 적용해야 하는 속성 분할: 테이블 내의 특정 속성에 대해 보안을 적용할 수 없으므로 보안을 적용해야 하는 속성들을 수직 분할하여 사용
고려 사항
- 기본키의 유일성 관리가 어려워짐
- 데이터 양이 적거나 사용 빈도가 낮은 경우 테이블 분할이 필요한지를 고려해야 함
- 분할된 테이블로 인해 수행 속도가 느려질 수 있음
- 데이터 검색에 중점을 두어 테이블 분할 여부를 결정해야 함

4. 중복 테이블 추가

여러 테이블에서 데이터를 추출해서 사용해야 하거나 다른 서버에 저장된 테이블을 이용해야 하는 경우 중복 테이블을 추가하여 작업의 효율성을 향상시킴
중복 테이블을 추가하는 경우
- 정규화로 인해 수행 속도가 느려지는 경우
- 많은 범위의 데이터를 자주 처리해야 하는 경우
- 특정 범위의 데이터만 자주 처리해야 하는 경우
- 처리 범위를 줄이지 않고는 수행 속도를 개선할 수 없는 경우
중복 테이블을 추가하는 방법
- 집계 테이블의 추가: 집계 데이터를 위한 테이블을 생성하고 각 원본 테이블에 트리거를 설정하여 사용하는 것, 트리거의 오버헤드에 유의해야 함
- 진행 테이블의 추가: 이력 관리 등의 목적으로 추가하는 테이블, 적절한 데이터 양의 유지와 활용도를 높이기 위해 기본키를 적절히 설정
- 특정 부분만을 포함하는 테이블의 추가: 데이터가 많은 테이블의 특정 부분만을 사용하는 경우 해당 부분만으로 새로운 테이블을 생성

5. 중복 속성 추가

조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것
데이터의 무결성 확보가 어렵고 디스크 공간이 추가로 필요함
중복 속성을 추가하는 경우
- 조인이 자주 발생하는 속성인 경우
- 접근 경로가 복잡한 속성인 경우
- 액세스 조건으로 자주 사용되는 속성인 경우
- 기본키의 형태가 적절하지 않거나 여러 개의 속성으로 구성된 경우
고려사항
- 테이블 중복과 속성의 중복을 고려
- 데이터 일관성 및 무결성에 유의
- SQL그룹 함수를 이용하여 처리할 수 있어야 함
- 저장 공간의 지나친 낭비를 고려

섹션9. 시스템 카탈로그

1.시스템 카탈로그(System Catalog)의 의미

시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스
시스템 카탈로그 내의 각 테이블은 사용자를 포함하여 DBMS에서 지원하는 모든 데이터 객에체 대한 정의나 명세에 관한 정보를 유지 관리하는 시스템 테이블임
카탈로그들이 생성되면 데이터 사전(Data Dictionary)에 저장되기 때문에 좁은 의미로는 카탈로그를 데이터 사전이라고도 함

2. 시스템 카탈로그 저장 정보

메타 데이터(Meta-Data)라고 함
메타 데이터의 유형
- 데이터베이스 객체 정보: 테이블(Table), 인덱스(Index), 뷰(View) 등의 구조 및 통계 정보
- 사용자 정보: 아이디, 패스워드, 접근 권한 등
- 함수, 프로시저, 트리거 등에 대한 정보

3. 카탈로그의 특징

카탈로그 자체도 시스템 테이블로 구성되어 있어 일반 이용자도 SQL을 이용하여 내용을 검색해 볼 수 있음
INSERT, DELETE, UPDATE 문으로 카탈로그를 갱신 하는 것은 허용되지 않음
데이터베이스 시스템에 따라 상이한 구조를 갖으며 DBMS가 스스로 생성하고 유지함
카탈로그의 갱신: 사용자가 SQL문을 실행시켜 기본 테이블, 뷰, 인덱스 등에 변화를 주면 시스템이 자동으로 갱신함
분산 시스템에서의 카탈로그: 보통의 릴레이션, 인덱스, 사용자 등의 정보를 포함할뿐 아니라 위치투명성 및 중복 투명성을 제공하기 위해 필요한 모든 제어 정보를 가져야 함

4. 카탈로그/데이터 사전을 참조하기 위한 DBMS내의 모듈 시스템

데이터 정의어 번역기(DDL Compiler): DDL을 메타 데이터를 갖은 테이블로 변환하여 데이터 사전에 정의시킴
데이터 조작어 번역기(DML Compiler): 응용 프로그램에 삽입된 DML문을 주 언어로 표현한 프로시저 호출로 변환하여 질의 처리기와 상호 통신
Data Directory
- 데이터 사전에 수록된 데이터를 실제로 접근하는 데 필요한 정보를 관리 유지하는 시스템
- 시스템 카탈로그는 사용자와 시스템 모두 접근할 수 있지만 데이터 딕셔너리는 시스템만 접근이 가능
질의 최적화기: 사용자의 요구를 효율적인 형태로 변환하고 질의를 처리하는 좋은 전략을 모색
트랜잭션 처리기: 복수 사용자 환경에서 평행으로 동시에 일어나는 트랜잭션 문제를 해결하여 각각의 사용자가 데이터베이스 자원을 배타적으로 이용할 수 있도록 함

728x90

'2024 정보처리기사 2차 합격 > 필기 3강 - 데이터베이스 구축' 카테고리의 다른 글

2장 - 물리 데이터베이스 설계 \| 섹션12. 뷰(View) 설계, 섹션13. 파티션 설계, 섹션14. 분산 데이터베이스 설계 (0)	2024.05.05
2장 - 물리 데이터베이스 설계 \| 섹션10. 트랜잭션 분석/CRUD 분석, 섹션11. 인덱스 설계 (0)	2024.05.05
1장 - 논리 데이터베이스 설계 핵심 요약 (0)	2024.05.05
1장 - 논리 데이터베이스 설계 \| 섹션4. 관계형 데이터베이스의 구조, 섹션5. 관계형 데이터베이스의 제약 조건 - 키(key), 섹션5. 관계형 데이터베이스의 제약 조건 - 무결성, 섹션6. 관계대수 및 관계해석 (0)	2024.05.04
1장 - 논리 데이터베이스 설계 \| 섹션1. 데이터베이스 설계, 섹션2. 데이터 모델의 개념, 섹션3. E-R(개체-관계)모델 (0)	2024.05.03

'2024 정보처리기사 2차 합격/필기 3강 - 데이터베이스 구축' Related Articles

개발공부기록

1장 - 논리 데이터베이스 설계 | 섹션7. 정규화(Normalization), 섹션8. 반정규화(Denormalization), 섹션9. 시스템 카탈로그 본문

1장 - 논리 데이터베이스 설계 | 섹션7. 정규화(Normalization), 섹션8. 반정규화(Denormalization), 섹션9. 시스템 카탈로그

'2024 정보처리기사 2차 합격 > 필기 3강 - 데이터베이스 구축' 카테고리의 다른 글

티스토리툴바