티스토리 뷰

IT 자격증

[ADsP] CRISP-DM 분석 방법론

happii 2021. 10. 13. 02:50

CRISP-DM 데이터 마이닝 방법론

CRISP-DM(Cross Industry Standard Process for Data Mining)은 데이터 마이닝 전문가가 사용하는 일반적인 접근 방식을 설명한 가장 널리 사용되는 공개 표준 분석 모델입니다. 2015년 IBM은 CRISP-DM을 개선하고 확장하는 데이터 마이닝 / 예측 분석을 위한 분석 솔루션 통합 방법(ASUM-DM)이라는 새로운 방법론을 발표하기도 했습니다.

 

이 방법론은 1996년에 유럽연합의 ESPRIT에서 있던 프로젝트로 시작했으면 Integral Solutions Ltd (ISL) , Teradata , Daimler AG , NCR Corporation 및 보험 회사 인 OHRA의 5 개 회사가 주도(ISL은 나중에 SPSS에 병합)하였습니다. 



CRISP-DM의 4 Level 구조

CRISP-DM의 레벨은 4단계로 구성이 되어있다.

CRISP-DM 4 Level구조

  • Phases(단계): 우리가 생각하는 일반적인 단계 (ex: 기획, 수집, 분석)
  • Generic Tasks(일반화 태스크): 데이터마이닝의 단일 프로세스를 완벽하게 수행하는 단위 (ex: 데이터 정제)
  • Specialized Tasks(세분화 태스크): 일반화 태스크를 구체적으로 나눈 태스크로 데이터 정제라는 일반화 과제를 범주형/연속형 데이터 정제와 같은 태스크로 구성가능
  • Process Instances(프로세스 실행): 데이터마이닝을 위한 구체적인 실행

 

CRISP-DM의 프로세스 6단계

CRISP-DM 프로세스는 6단계로 구성되어 있으며, 폭포수 모형처럼 단반향으로 구성되어 있지 않고 단계간 피드백을 통해 완성도를 높이는 방식이다.

  • Business Understanding(업무 이해)
    - 각종 참고 자료와 현업 책임자와의 커뮤니케이션을 통해 비즈니스를 이해하는 단계                                                          - 수행업무: 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립

 

최근에 올라온 글
Total
Today
Yesterday