"모든 것을 더 이상 간단해질 수 없을만큼 가능한 간단하게 만들어라"
1. 비즈니스 프로세스 선택
비즈니스 프로세스란,
주문 받기, 송장 발행, 결제 받기, 서비스 요청 처리, 학생 등록, 의료 절차 수행 또는 청구 처리와 같이 조직에서 수행하는 낮은 수준의 활동이다.
DW/BI 사용자가 분석하고자 하는 성과 측정값은 비즈니스 프로세스의 이벤트에 주로 포함된다.
2. 그레인 정의
개별 팩트 테이블의 행이 나타내는 내용을 정확히 지정한다.
비즈니스 프로세스가 포함하는 최대한 자세한 속성의 집합을 그레인이라 한다.
고객 판매 거래에서 개별 제품을 스캔할 때마다 한 행, 의사로부터 받은 청구서의 한 항목당 한 행, 창고에 있는 각 품목의 재고 수준에 대한 일일 스냅샷당 한 행 등
비즈니스 프로세스의 이벤트를 캡처하는 운영 시스템의 물리적 현실에 따라 결정한다.
최대한 자세한 정보를 포함하여 사용자의 예측 불가능한 질문에 가능한 모두 답변할 수 있도록 정의한다.
3. 차원 식별
누가, 무엇을, 어디서, 언제, 어떻게, 왜 의 육하원칙에 기초하여 차원을 식별하는것이 통상적이다.
각 차원을 식별한 후에 이산적 혹은 문자열 값의 속성을 나열하고 알맞은 차원에 분류한다.
차원 식별의 단계에서 그레인 정의가 잘못되었다 판단되었을때는 다시 2단계로 돌아가 그레인을 올바르게 설정한다.
4. 팩트 식별
측정되는 값을 포함하며, 주문 수량이나 단위를 가진 가격(원, 달러 등) 등의 수치적으로 더할 수 있는 값이 일반적이다.
'데이터 엔지니어링 > 빅데이터' 카테고리의 다른 글
[2. ETL 구축] 2-1. ETL의 서브시스템 (0) | 2024.04.22 |
---|---|
[1. 차원 모델링] 1-2. 차원 모델 설계 시 몇가지 팁 (0) | 2024.04.22 |
Hadoop YARN (0) | 2022.11.30 |
Apache Kafka (0) | 2022.06.07 |
Apache Airflow (0) | 2022.06.01 |