Study for Data Science

데이터 분석 프로젝트 관리 방법론

|

프로젝트 관리 방법론의 필요성

제한된 자원을 활용하여 기획부터 프로젝트 종료까지 원할한 진행을 바탕으로 최종적인 결과를 도출하기 위해 고한한 방법론이다.

데이터 분석에서 프로젝트 관리


| 데이터 분석 프로젝트 관리한다는 것은 과학과 공학을 모두 적용해야 한다는 점에서 소프트웨어 공학과 다르다.

소프트 웨어 개발 방법론과 달리 데이터 분석 프로젝트는 과학적 측면과 공학적 측면 모두 고려 해야한다는 점에 리스크 관리에 더욱 어려움이 많다.

예를 들어, 데이터 분석가가 (앞 과정을 생략하고) 가설을 설정하고 특정 데이터 셋을 전처리하여 분석을 진행 했다고 하자. 검증되어야 할 가설이 기각되었다면 다음은 어떻게 해야 하는가? 대부분의 데이터 분석가라면 가설을 다시 수립하거나 데이터 셋을 재가공 할수 있을 것이다. 그리고 이 과정을 반복하며 실험 할 것이다. 또한, 이 작업의 반복은 특정 시간 안에 끝난다고 확신 할 수 없을 것이다.

애자일 데이터 사이언스


아래 내용은 구체적인 방법론에 대한 서술로써 하나의 정답이 아니며, 상황에 따라 지속적으로 수정되어 질 수 있다.

계층적 프로세스 모델

  • 작업 진행 과정이 단계(Phase) -> 업무(Task) -> 스탭(Step)의 계층으로 구성됨
  1. 단계(Phase)
    • 프로세스 그룹을 통하여 완성된 단계별 산출물 생성
    • 기준선(Baseline)으로 설정되어 관리되어야 하며, 버전관리(Configuration Management)등을 통해 통제
  2. 업무(Task)
    • 단계를 구성하는 단위 활동, 품질 검토의 항목
  3. 스탭(Step)
    • WBS(Work Breakdown Structure)의 워크패키지(Work Package)에 해당
    • 입력자료(Input), 처리 및 도구(Process & Tool), 출력자료(Output)으로 구성된 단위 프로세스(Unit Process)

– 업데이트 예정 ## 전체 흐름도