검수요청.png검수요청.png

"데이터 통합"의 두 판 사이의 차이

해시넷
이동: 둘러보기, 검색
잔글
1번째 줄: 1번째 줄:
'''데이터 통합'''(data integration)이란 유사항 성격의 데이터, 동질성을 가진 데이터를 더 큰 주제로 합치는 것을 의미한다. 확상성이 좋은 유연한 모델 작성으로 요구사항을 추가/변경에 따른 모델 변경을 최소화하는 것을 목적으로 가지고 있다.
+
'''데이터 통합'''(DI; data integration)이란 유사항 성격의 데이터, 동질성을 가진 데이터를 더 큰 주제로 합치는 것을 의미한다. 확상성이 좋은 유연한 모델 작성으로 요구사항을 추가/변경에 따른 모델 변경을 최소화하는 것을 목적으로 가지고 있다.<ref name="데이터 통합">〈[https://pronician.tistory.com/1052?category=527453 데이터 통합]〉, 《DB모델링 - 4. 데이터통합》, 2015-11-20</ref> 즉, 자료의 중복을 배제한 데이터의 모임이다.<ref>〈[https://coding-factory.tistory.com/214 데이터 통합]〉, 《[DB기초] 데이터베이스의 정의와 특징》, 2018-08-08</ref> 영어 약자로 '''DI'''(디아이)라고도 한다.
<ref name="데이터 통합">〈[https://pronician.tistory.com/1052?category=527453 데이터 통합]〉, 《DB모델링 - 4. 데이터통합》, 2015-11-20</ref>  
 
즉, 자료의 중복을 배제한 데이터의 모임이다.<ref>〈[https://coding-factory.tistory.com/214 데이터 통합]〉, 《[DB기초] 데이터베이스의 정의와 특징》, 2018-08-08</ref>
 
  
 
==개요==
 
==개요==
9번째 줄: 7번째 줄:
 
==특징==
 
==특징==
 
===데이터 통합 프로세스===
 
===데이터 통합 프로세스===
 
 
[[파일:데이터 통합.png|800픽셀|섬네일|가운데|데이터 통합 프로세스]]
 
[[파일:데이터 통합.png|800픽셀|섬네일|가운데|데이터 통합 프로세스]]
  
53번째 줄: 50번째 줄:
 
* [데이터 통합(1)] 데이터 통합의 범위와 역할〈[http://www.bikorea.net/news/articleView.html?idxno=226 데이터 통합 개요]〉, 2007-09-28《Bikorea》
 
* [데이터 통합(1)] 데이터 통합의 범위와 역할〈[http://www.bikorea.net/news/articleView.html?idxno=226 데이터 통합 개요]〉, 2007-09-28《Bikorea》
 
* [데이터 통합(1)] 데이터 통합의 범위와 역할〈[https://pronician.tistory.com/1053?category=527453 데이터 통합 장단점]〉, 2015-11-20《Tistory - 데카의 Daily Review》
 
* [데이터 통합(1)] 데이터 통합의 범위와 역할〈[https://pronician.tistory.com/1053?category=527453 데이터 통합 장단점]〉, 2015-11-20《Tistory - 데카의 Daily Review》
 
  
 
==같이 보기==
 
==같이 보기==
 
+
* [[데이터]]
 +
* [[데이터베이스]]
  
 
{{프로그래밍|검토 필요}}
 
{{프로그래밍|검토 필요}}

2020년 8월 19일 (수) 22:12 판

데이터 통합(DI; data integration)이란 유사항 성격의 데이터, 동질성을 가진 데이터를 더 큰 주제로 합치는 것을 의미한다. 확상성이 좋은 유연한 모델 작성으로 요구사항을 추가/변경에 따른 모델 변경을 최소화하는 것을 목적으로 가지고 있다.[1] 즉, 자료의 중복을 배제한 데이터의 모임이다.[2] 영어 약자로 DI(디아이)라고도 한다.

개요

데이터 통합은 한마디로 하나의 소스 시스템에서 관리하는 데이터를 목표 시스템의 데이터와 실시간이나 배치 형태로 변형의 단계를 거쳐 합산이나 여러 함수등을 통해 같은 의미를 가진 정보로 일치시키는 역할이라고 볼 수 있다. [3]

특징

데이터 통합 프로세스

데이터 통합 프로세스

통합 기준[1]

테이터를 통합하는데에는 기준이 있다. 먼저, 데이터의 성격(주제)이 유사(동질성)해야 한다. 식별자가 동일하면서 유사한 속성이 존재(유사성)해야 하며, 식별자는 다르지만 기초 속성이 유사(유사성)해야한다. 현행 데이터가 존재하면 마이그레이션하는데 문제가 없다. 별개의 요건으로 사용되지 않고 주로 같이 조회되며 통합해서 성능문제를 일으키지 않는다.

통합 대상[1]

  • 속성: 여러 엔티티에서 동일한 성질로 관리되는 속성을 도출하여 새로운 엔티티로 통합한다.
  • 관계: 엔티티간 존재하는 많은 개별 관계를 상위 개념의 관계로 통합한다.
  • 엔티티: 공통된 속성이 존재하는 엔티티를 통합해 슈퍼타입을 도출한다. 조인의 불편함, 성능에 영향을 미치는 배타적 관계의 엔티티를 통합한다.

고려사항[1]

데이터를 통합하는 과정에서는 고려해야할 몇가지 사항들이 있다. 첫째, 동질성이 빈약한 엔티티간 통합. 둘째, 지나친 유연성, 확장성만을 고려한 통합. 셋째, 엔티티 통합에 따른 인스턴스 증가로 인한 성능 문제. 넷째, 실체 엔티티는 최대한 통합하고, 행위 엔티티는 가능한 통합을 고려해야 한다.

장점[4]

  • 확장성: 비슷한 유형의 업무가 발생했을 때 스키마 변경을 최소화하면서 코드 값 등의 인스턴스를 추가로 업무를 수용한다.
  • 유지보수 효율성: 엔티티 개수가 감소해 데이터베이스 유지보수가 쉬워졌다.
  • 분석, 설계에 대한 시간이 단축되고, 비용이 절감되었다.
  • 개발의 용이성: 엔티티 통합에 따른 배타 곤계의 해소로 엑세스 경로의 효율성이 향상되었으며, 단순한 SQL 작성이 가능해졌다.
  • 모델의 단순성
  • 모델의 가독성: 슈퍼타입, 서브타입에서 발생하는 비즈니스 요건(관계)를 명확히 표현할 수 있다.

단점[4]

  • 데이터 집합의 변질(희석): 무분별한 엔티티 통합은 데이터 집합을 모호하게 만들어 집합을 변질시킬 수 있다.
  • 데이터베이스 성능과 관리 측면
  • 가독성이 떨어진다.
  • Null값의 사용이 증가되었다.
  • 마이그레이션의 어려움이 있다.

분류

ETL

RTDI

데이터 동기화

데이터 이주

메타 데이터 관리

데이타 정보 허브/데이터 통합 허브

각주

  1. 1.0 1.1 1.2 1.3 데이터 통합〉, 《DB모델링 - 4. 데이터통합》, 2015-11-20
  2. 데이터 통합〉, 《[DB기초] 데이터베이스의 정의와 특징》, 2018-08-08
  3. 데이터 통합 개요〉, 《[데이터 통합(1)] 데이터 통합의 범위와 역할》, 2007-09-28
  4. 4.0 4.1 데이터 통합 장단점〉, 《[DB모델링 - 4. 데이터통합:4.2 데이터 통합의 장단점》, 2015-11-20

참고자료

  • DB모델링 - 4. 데이터통합〈데이터 통합〉, 2015-11-20《Tistory - 데카의 Daily Review》
  • [DB기초] 데이터베이스의 정의와 특징〈데이터 통합〉, 2018-08-08《Tistory - 코딩팩토리》
  • [데이터 통합(1)] 데이터 통합의 범위와 역할〈데이터 통합 개요〉, 2007-09-28《Bikorea》
  • [데이터 통합(1)] 데이터 통합의 범위와 역할〈데이터 통합 장단점〉, 2015-11-20《Tistory - 데카의 Daily Review》

같이 보기


  검수요청.png검수요청.png 이 데이터 통합 문서는 프로그래밍에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.