Data/Data Analysis Bootcamp

[북스터디] 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력 _ 1주차 후기

SE_TORY 2024. 4. 17. 12:59
728x90

북스터디 참가자를 모집하기 직전에 첫번째 데이터 분석 프로젝트가 진행되었고, 그 과정에서 여러 어려움에 부딪혔었다.

이 어려움들의 원인을 파악하고 해결하고자 북스터디에 참여하게 되었다.

책을 통해 데이터 분석과 관련된 지식을 넓히고, 내가 미처 생각하지 못했던 부분을 깨달으며 성장할 수 있었으면 하는 바람이다.


이번에 읽게 된 책은 '빅데이터 시대, 성과를 이끌어 내는 데이터 문해력' 이라는 책이고, 1주차에는 Part 1~2 부분을 읽었다.

 

 

Part 1. 앞으로 필요한 건 데이터 문해력 : 분석보다 활용

 

 

"데이터와 데이터 분석은 목적을 달성하기 위한 도구이다."

"데이터 분석 자체가 목적이 되면 안된다"는 말은 데이터 분석을 배우며 많이 들었던 말이다.

하지만 막상 프로젝트가 시작되고 여러 데이터를 만지다보니, 어느샌가 나도 모르게 데이터 안에 해답이 존재할 것이라고 생각하면서 데이터를 다루고 있었다

 

책에서는 기존 그래프와 데이터를 통해 알 수 있는 것이 무엇인지가 아니라, 자신이 알고 싶은 것(목적)에 따라 데이터를 수집하고 분석해서 결과를 검증하고 연결하라고 강조한다.

 

사실 목적과 문제를 정의하는 것이 제일 첫번째로 선행되어야하지만, 제일 어려운 부분이 아닐까 싶다.

이 책을 더 읽어나가면서 목적과 문제를 잘 정의할 수 있는 사람이 되었으면 좋겠다.

 

 

 

Part 2. 올바른 데이터로 올바른 문제를 풀고 있는가?

 

 

두번째 단원에서 제시하는 질문 2가지가 사실 모든 분석 프로젝트의 핵심인 것 같다.

 

책에서는 문제를 명확하게 정의하고 올바른 데이터를 활용하는 방식에 대해 아래와 같이 말한다.

"무엇이 문제이며 구체적으로 어디 사는 누가 어떤 식으로 곤란에 처해 '문제'가 발생한 것인지, 이 점을 명확히 해야 한다."

"문제와 목적이 명확하다는 것을 전제로 어떤 데이터를 활용할지, 선택한 데이터가 적합지 생각하면 된다."

그저 문구로만 개념을 제시하는 것이 아니라 여러 사례들을 책에서 소개했기에 문제를 명확히 정의하는 방법에 대해 이해 할 수 있었던 것 같다. 

 

이전 프로젝트를 돌이켜봤을 때 책에서 강조하는대로 '명확히' 문제를 정의하보다 데이터가 있느냐 없느냐에 초점이 맞춰져 약간은 방향성이 모호해졌던 부분이 있던 것 같다. 그리고 목적과 문제에 대한 정의가 불명확해서 선택한 데이터에서 원하는 결과가 나오지 않았을 때 다른 데이터를 어떤 것을 더 수집해야할지 막막했던 것 같다.

 

여기에 개인적인 생각을 덧붙이자면 '명확히' 문제를 정의할 때 구두로만 하는 것이 아니라 분명하게 글로 표현하는 것이 중요한 것 같다.

실제로 첫번째 프로젝트를 진행하며 문제와 목적을 정의내릴 때 초반에는 서로의 의견을 종합해 말로만 정의내렸었다.

처음에는 당연히 모두가 문제와 목적의 정의를 명확하게 알고 있었지만 수많은 데이터를 처리하다보며 점차 각자의 생각이 덧붙여서 정의가 정확히 어떤 것인지 헷갈리기 시작했다.

결국 프로젝트 중간중간 문제와 목적의 정의를 상기시키기 위해 불필요한 시간과 체력이 소모되었다.

 

이번에 읽고 있는 책을 프로젝트 하기 전에 미리 읽었었더라면 어느 정도는 프로젝트가 수월하게 진행될 수 있었을 것 같다는 생각이 들어 조금은 아쉬웠다. 하지만 책을 통해 이해했다고 생각해도 적용하는 것은 또다른 문제이기 때문에 앞으로 진행될 프로젝트에서는 이번주에 느낀 점들을 항상 생각하며 진행하도록 노력해봐야겠다.

 

728x90