Data/Data Analysis Bootcamp

[북스터디] 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 _ 2주차 후기

SE_TORY 2024. 5. 5. 20:57
728x90

이번주에는 북스터디 1주차때에 이어서 '빅데이터 시대, 성과를 이끌어 내는 데이터 문해력' 책의 Part 3 ~ 4 부분을 읽었다.

1주차때도 상당히 와닿는게 많았는데, SQL프로젝트가 끝나고 난 뒤 읽은 Part 3~4 부분 역시 깊게 공감되는 구절이 정말 많았다. 

생각해보면 SQL프로젝트의 경우에는 이커머스 데이터가 제공되었기에 문제나 주제 선정에서는 비교적 수월하게 정할 수 있었지만, 그 이후 데이터 분석을 하는 과정에서 조금 더 어려웠던 것 같다.

Part 3~4 부분은 직전 프로젝트에서 메인으로 진행되었던 데이터 분석 및 결론 도출하는 과정에 대해 자세히 설명하고있어 유독 깊게 와닿는 부분이 많았던 것 같다.


Part 3. '이것이 문제다' 데이터로 말하는 방법

 

3장에서 전하는 주요 메세지는  다음과 같다.

1. 데이터를 활용해 결과물을 만들 때, 자기 생각과 주관을 전하면 안되고 더욱 엄밀하고 객관적으로 논리적인 주장을 전달해서 상대방이 이해할 수 있도록 해야 한다

2. 데이터 문해력의 본질 중 하나는 '목적 중심 사고' 이다.

3. 문제상황이나 배경에 대해 아예 모르는 제 3자도 한번에 납득할 수 있도록 데이터를 보여줘야한다

 

제일 처음 진행됐던 파이썬 프로젝트는 데이터셋이 제공되어있지 않다보니, 데이터가 있는 것들을 먼저 찾고 그 안에서 주제와 문제상황을 정해야했다. 그러다보니 책에서 강조하는 '목적 중심 사고'가 아니라 결론을 심정적으로 정해놓고 데이터로 평가하려고 하는 행동들이 실제로 있었고, 그 결과 프로젝트 과정 전체가 힘들어졌던 것 같다.

 

하지만 직전 SQL프로젝트에서는 데이터셋이 사전에 제공된 만큼 분석에 있어서 객관적이고 논리적인 주장을 전달하기 위해 계속 이 데이터가 올바른 데이터인지, '왜 이 데이터를 활용해야할까?', '이 데이터를 통해 어떤걸 말할 수 있지?' 라는 질문을 스스로 정말 많이 생각했던 것 같다.

그 결과 문제를 정의하고, 어떻게 이 문제를 보여주며, 어떤 해결책을 제시할지 로드맵을 생각하는건 비교적 수월하게 잘 되었던 것 같지만 그 결과를 PPT에 효과적으로 담는 과정이 개인적으로는 제일 어렵고 미숙했던 부분이었다.

강사님에게 받았던 피드백 역시 PPT 구성의 전달력이 약하다는 것이었다.

 

문제상황이나 배경에 대해 아예 모르는 제 3자도 한번에 납득할 수 있도록 데이터를 보여줘야한다는 구절을 읽으면서 분석한 내용을 효과적으로 전달하는 것에 있어서 스스로 부족했던 부분이 많았다는 것을 다시금 느끼게 되었다.

그리고 앞으로 이 부분은 스스로 SQL프로젝트를 조금 더 정교하게 다듬으면서 채워나가야겠다는 생각을 했다.

다른 부분도 마찬가지이겠지만 전달력이 높은 PPT구성은 정말,, 좋은 레퍼런스를 많이 보고 직접 적용해볼수록 실력이 확 늘어나는 부분인 것 같다.

 

 

 

 

Part 4. 결과가 나왔다고 끝난 것은 아니다

 

4장에서는 3장에서 나온 데이터 간의 관계성을 통해 어떤 결론을 내릴 수 있을지 사고하는 방법에 대해 얘기한다.

  • 실적과 결과만 표시하고 끝난 것은 아닌지
  • 이 결과를 통해 구체적인 판단이나 행동으로 연결될 것인지
  • 문제와 결과에 대한 원인을 충분히 고려했는지

위와 같은 사고 과정이 데이터 활용에서는 방법론이나 통계이론보다 훨씬 중요하다고 강조한다.

 

사실 이전 프로젝트에서의 가장 큰 문제점(= 프로젝트 중반부에 주제를 아예 바꾼 이유)이 위와 같은 사고 과정 중 하나를 제대로 하지 못했기에 발생했었다.

바로 문제와 결과에 대한 원인을 충분히 고려하지 않았다는 점이다.

 

SQL 프로젝트는 정말 방대한 양의 데이터를 가지고 진행되었는데, 한가지 분석(SQL쿼리를 한번 돌리는 것)에도 생각보다 많은 시간이 소요되었다. 

그래서 주제를 정하는 과정에서 약간의 시간적인 압박감이 들었고, '매출을 향상시켜야하는데 어떻게?' 라는 생각에 휩쓸려 '프로모션을 제대로 하자' 라는 결과로 이어졌다.

그 결과 '이커머스 사이트의 매출을 향상시키기 위한 브랜드별 적절한 프로모션 전략 도출' 이라는 주제를 정했지만, 막상 가지고 있는 데이터셋은 사이트 내에서의 고객 행동 로그데이터와 행동으로 이어진 상품들에 대한 금액정보 뿐이었다.

 

강사님 중간 피드백에서도 지적되었듯이 프로모션 효율은 어떤 할인폭에 고객이 가장 많이 구매를 했는지 뿐만 아니라 사이트 내에서 적절히 노출되었는지, 노출된 기간은 어느 정도인지 등에 따라 크게 좌지우지될 수 있다.

패션브랜드 온라인MD로 2년 반동안 일하며 누구보다 그 사실을 가장 잘 알고있지만, 막상 프로젝트를 시작하고 시간에 쫓기다보니 그 부분을 놓쳤다는게 정말 아찔한 부분이었다.

그리고 데이터 분석에서 필요한 사고를 완벽히 확립하지 못했다는 것을 느끼게 된 계기이기도 했다.

 

 

 

책을 읽으면서 어떻게 모든 챕터마다 하지 말라고 하는 것들을 내가 똑같이 프로젝트를 진행하며 반복했을까? 하는 생각이 들었고, 북스터디를 시작하길 잘했다는 생각이 더 커졌다.

이 책을 읽지 않았다면 아직도 왜 그랬는지 명확히 알지 못하거나, 앞으로 진행될 프로젝트에서도 같은 문제를 반복할 수 있다는 생각에 좀 아찔하지기도 했다.

 

책을 읽을 때는 당연히 그렇게 해야지 생각되는 것들이 실전에서는 정말 어려운 부분인 것 같다.

물론 부트캠프에서는 시행착오를 통해 더 성장하기 위해 배우는 과정이기에 완벽할 수 없다는 것을 알고있지만, 그럼에도 완벽하지 않았기에 조금은 스스로 실망했던 부분도 있는 것 같다.

 

앞으로 진행될 프로젝트에서는 점점 나아지길 바라며 이 책은 완독하더라도 두번 세번은 반복해서 읽어야겠다.

부트캠프가 끝나기 전까진 이 책에서 강조하는 사고들을 확실히 내것으로 만들고 싶다.🙏

728x90