본문 바로가기

Certificate/정보처리기사

[정보처리산업기사 실기] Section 21. DB 관련 신기술 요약

DB 관련 신기술

1) 빅데이터(Big Data)

  • 막대한 향의 정형 또는 비정형 데이터 집합
  • 빅데이터를 효과적으로 분석함으로써 미래를 예측해 최적의 대응 방안을 찾고, 이를 수익으로 연결하여 새로운 가치 창출할 수 있음

 

2) 브로드 데이터(Broad Data)

  • 다양한 채널에서 소비자와 상호 작용을 통해 생성된 데이터
  • 마케팅에 있어 효율적이고 다양한 데이터
  • 이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터

 

3) 메타 데이터(Meta Data)

  • 일련의 데이터를 정의하고 설명해 주는 데이터
  • 컴퓨터에서는 데이터 사전의 내용, 스키마 등을 의미
  • HTML 문서에서는 메타 태그 내의 내용이 메타 데이터

 

4) 디지털 아카이빙(Digital Archiving)

  • 디지털 정보 자원을 장기적으로 보존하기 위한 작업
  • 아날로그 콘텐츠는 디지털로 변환 후 압축해서 저장
  • 디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화 하는 작업

 

5) 하둡(Hadoop)

  • 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼, 맵리듀스 기반
  • 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크

 

6) 맵리듀스(MapReduce)

  • 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
  • 연관성 있는 데이터 분류로 묶는 Map 작업 수행 후 중복 데이터 제고하고, 원하는 데이터를 추출하는 Reduce 작업 수행
  • Google 에 의해 고안

 

7) 타조(Tajo)

  • 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트

 

8) 데이터 다이어트(Data Diet)

  • 데이터 삭제가 아니라 압축하고 중복된 정보는 중복 배제함
  • 새로운 기존에 따라 나누어 저장

 

9) 데이터 마이닝(Data Mining)

  • 대량의 데이터를 분석하고, 데이터에 내재된 변수 사이의 상호 관계를 규명하여 일정한 패턴을 찾아냄

 

10) OLAP(Online Analytical Processing)

  • 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 기술
  • OLAP 연산
    • Roll-up
    • Roll-down
    • Drill-through
    • Drill-across
    • Pivoting
    • Slicing
    • Dicing

 

DB 관련 용어

1) 스택(Stack)

  • 리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료 구조
  • 후입선출(LIFO; Last In First Out)

 

2) 큐(Queue)

  • 리스트의 한쪽에서는 삽입 작업, 다른 한쪽에서는 삭제 작업이 이루어지는 자료구조
  • 선입선출(FIFO; First In First Out)

 

3) 정규화(Normalization)

  • 함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만드는 기술

 

4) 반정규화(Denormalization)

  • 정규화된 데이터 모델을 통합, 중복, 분리하는 과정을 말함
  • 효율적인 데이터 접근을 위해 의도적으로 정규화 원칙을 위배하는 행위

 

5) 이상(Anomaly)

  • 정규화를 거치지 않으면 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상 발생하는 것을 말함
  • 종류 : 삽입 이상, 삭제 이상, 갱신 이상

 

6) 인덱스(Index)

  • <키 값, 포인터> 쌍으로 구성되는 데이터 구조
  • 데이터 레코드를 빠르게 접근할 수 있게 해줌

 

7) 뷰(View)

  • 하나 이상의 기본 테이블로부터 유도된, 이름을 가지는 가상 테이블
  • 접근이 허용된 자료만 제한적으로 보여줄 수 있음

 

8) 파티션(Partition)

  • 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것

 

9) 관계대수

  • 관계형 DB에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적 언어

 

10) 관계해석

  • 관계 데이터의 연산 표현 방법
  • 비절차적 언어

 

11) 후보키(Candidate Key)

  • 릴레이션을 구성하는 속성들 중 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분 집합
  • 기본키로 사용할 수 있는 속성
  • 모든 튜플에 대해서 유일성과 최소성을 만족시켜야 함

 

12) 기본키(Primary Key)

  • 후보키 중에서 특별히 선정된 키
  • 중복된 값을 가질 수 없음

 

13) 대체키(Alternate Key)

  • 기본키를 제외한 나머지 후보키를 의미
  • 보조키 라고도 함

 

14) 슈퍼키(Super Key)

  • 릴레이션 내에 있는 속성들의 집합으로 구성된 키
  • 모든 튜플에 대해 유일성은 만족시키지만, 최소성은 만족시키지 못함

 

15) 외래키(Foreign Key)

  • 다른 릴레이션의 기본키를 참조하는 속성

 

16) 개체 무결성(Entity Integrity)

  • 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없음

 

17) 참조 무결성(Referential Integrity)

  • 외래키 값은 Null 이거나 참조 릴레이션의 기본키 값과 동일해야 함
  • 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없음