티스토리 뷰
CRISP-DM 데이터 마이닝 방법론
CRISP-DM(Cross Industry Standard Process for Data Mining)은 데이터 마이닝 전문가가 사용하는 일반적인 접근 방식을 설명한 가장 널리 사용되는 공개 표준 분석 모델입니다. 2015년 IBM은 CRISP-DM을 개선하고 확장하는 데이터 마이닝 / 예측 분석을 위한 분석 솔루션 통합 방법(ASUM-DM)이라는 새로운 방법론을 발표하기도 했습니다.
이 방법론은 1996년에 유럽연합의 ESPRIT에서 있던 프로젝트로 시작했으면 Integral Solutions Ltd (ISL) , Teradata , Daimler AG , NCR Corporation 및 보험 회사 인 OHRA의 5 개 회사가 주도(ISL은 나중에 SPSS에 병합)하였습니다.
CRISP-DM의 4 Level 구조
CRISP-DM의 레벨은 4단계로 구성이 되어있다.
- Phases(단계): 우리가 생각하는 일반적인 단계 (ex: 기획, 수집, 분석)
- Generic Tasks(일반화 태스크): 데이터마이닝의 단일 프로세스를 완벽하게 수행하는 단위 (ex: 데이터 정제)
- Specialized Tasks(세분화 태스크): 일반화 태스크를 구체적으로 나눈 태스크로 데이터 정제라는 일반화 과제를 범주형/연속형 데이터 정제와 같은 태스크로 구성가능
- Process Instances(프로세스 실행): 데이터마이닝을 위한 구체적인 실행
CRISP-DM의 프로세스 6단계
CRISP-DM 프로세스는 6단계로 구성되어 있으며, 폭포수 모형처럼 단반향으로 구성되어 있지 않고 단계간 피드백을 통해 완성도를 높이는 방식이다.
- Business Understanding(업무 이해)
- 각종 참고 자료와 현업 책임자와의 커뮤니케이션을 통해 비즈니스를 이해하는 단계 - 수행업무: 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
최근에 올라온 글
- Total
- Today
- Yesterday