[린 분석 스터디] - 1주차: 왜 데이터인가
Chapter 1 - 우리는 모두 거짓말쟁이
Prologue.
책 린 분석을 읽고 한 챕터 당 한 질문을 발제하여 매주 글을 써나가기로 했다. Chapter 1-우리는 모두 거짓말쟁이의 발제 질문은 "왜 데이터인가", 조금 풀어서 얘기하면 "왜 데이터를 보아야 하는가", "왜 지금 우리는 데이터를 이리도 중요시하고 필요로 하는가", "왜 지금 데이터 공부를 하거나, 회사에서 데이터를 확인하는 업무를 하고 있는가" 하는 근본적인 질문이다. 본 저서에서는 그로스 해킹과 사업 시작의 관점에서 데이터를 바라보고 있다. 창업은 반쯤은 망상이고, 필연적으로 현실왜곡의 관점을 가져야 함이 분명하다. 동시에 그 거짓말과 망상에 너무 깊이 빠져 현실을 보지 못해서는 안 된다. 그러한 이유로 사업에서 중심을 잡기 위해서는 데이터가 필요하다. 그렇다면 (지금은) 창업가가 아닌 나에게는 어떨까. 회사의 비즈니스 분석가로, 데이터 관련 직무로 일하고 있는 내 관점에서는 데이터가 왜 필요한 걸까?
데이터는 왜 필요할까?
데이터가 왜 필요한가에 대해 이야기하기 위해서는 주로 우리가 보는 데이터가 무엇인지에 대해서 먼저 생각해 보아야 할 것 같다. 주로 회사에서 중요시하는 데이터는 (AIML 설루션 개발자가 아니라면) 비즈니스에 관련된 데이터일 것이다. 그 데이터는 사용자 로그일 수도, 매출 데이터일 수도, 특정 서비스 사용량 데이터일 수도, 주문 건 데이터일 수도 있다. 그리고 이 데이터들의 공통점은 유저의 패턴을 나타내는 데이터라는 점이다. 물론 기존에 나타난 유저의 발자취가 미래에도 완전히 동일하게 반복되는 것은 아니다. 그럼에도 불구하고 우리는 데이터 분석을 통해 현 상황이 어떤지, 이를 기반으로 어떤 의사결정을 내려야 하는지 힌트를 얻을 수 있다.
비즈니스 분석가인 나는 데이터 안에서 어떤 외부/내부 요인들이 유저의 행동에 영향을 끼쳤는지 분석하고, 그 행동 패턴이 어떻게 매출 데이터에 나타났는지 확인한다. 또, 이러한 상황에서 우리가 어떤 액션을 취해야 매출 증대 또는 더 많은 사용자의 선택을 얻을 수 있을지를 고민한다. 결국 데이터는 현 상황을 시사하는 표지이다. 추측이나 직감에만 의존한 선택을 내리지 않도록 고객이 어떤 선택을 하고 있는지 현 상황을 점검할 수 있도록 데이터를 활용해야 하는 것이다.
그렇다면 데이터는 늘 옳은걸까?
데이터 분석을 위해서는 가설을 세우는 첫 과정이 가장 중요하다고 한다. 가설은 방향성을 설정하기 때문인데, 그 가설을 세우기 위해서는 데이터 안에 숨겨진 컨텍스트를 파악해야 한다. 이와 같이 데이터를 읽고 해석하는 과정에서, 그리고 어떤 경우는 데이터를 읽어내기 위해서 조차 컨텍스트 파악이 필요하다. 그리고 그러한 맥락 파악은 경험과 직감에서 나온다. 그래서 우리는 훌륭한 분석가를 찾는다. 명확한 지표를 바탕으로 메트릭을 만들어 현 상황을 가장 잘 반영할 수 있는 데이터 해석을 할 수 있는 분석가. 그 분석가가 데이터를 "옳게" 만들어주는 것이 아닐까. 사람이 어떻게 해석하느냐에 따라 데이터에서 도출되는 인사이트도 다르기에 결국 가설을 세우고 정의하는 사람의 역할이 이 "데이터"의 60%는 차지하고 있는 것이다.
데이터를 분석하는 일을 하면서도, 개인적으로 데이터에 대한 개인적인 의구심도 가지고 있다. 교육학 관점에서 쓰인 <평균의 종말/ 토드 로즈 저>에서 등장하듯, 데이터를 통해 도출한 '평균치'는 조사 대상이 되는 개인을 대변할 수 없다고 한다. 이상적인, 표준적인 대상을 도출하기 위해 '평균치'를 분석하는데, 결국 개개인의 허리둘레나 IQ 등, 숫자로 나타낼 수 있는 지표뿐 아니라 삶의 궤적도 마찬가지이다. 우리가 특정한 메트릭을 통해 도출한 결과치가 과연 사용자의 현 상황을 정확하게 대변할 수 있느냐도 알 수 없고, 우리가 사용자 패턴을 데이터를 통해 정확하게 예측하기는 어려운 것이다. (적어도 비즈니스에 한해서는)
그럼에도 불구하고 동일한 문화권에서 유사한 기본 교육을 받은 사람들 간에는 비슷한 사고를 한다는, 어쩌면 조금은 심리학과 유사한 관점에서 데이터를 이용하고 있는 게 아닐까 싶다. 동일할 수는 없어도 비슷한 패턴을 파악해 내고 적은 비용으로 최대의 효과를 만들어내기 위해 데이터를 분석하는 것이다.
그럼에도 불구하고 데이터
결국 데이터는 우리가 잘 나아가고 있는지, 현 상황은 어떠한지를 점검하고 추후 액션을 고민하게 하는 직접적인 힌트이다. 정확할 수는 없더라도 조금 더 정확하게, 과녁 10점을 맞추지는 못하더라도 8-9점에 맞추기 위해, 조금이나마 더 10점에 다다를 수 있도록-. 우리는 가설을 세우고 데이터를 분석하는 과정을 계속 반복한다.
신선 식품을 미리 구비해두는 물류센터에서 품절이 되지 않으면서도 재고를 많이 남기지 않기 위해 소비자의 구매량을 매일 예측하는 것처럼. 사용자의 구미가 당길 만한 비행기 티켓 가격을 업데이트하기 위해 날씨와 요일 데이터에 기반하여 과거 데이터를 살펴보는 항공사처럼. 꼭 정답일 필요는 없지만 정답에 조금이나마 더 가까워지기 위한 힌트가 데이터라는 결론에 이르렀다. 그리고 그 데이터라는 것을 정답-더 좋은 매출, 사업의 성장, 더 많은 사용자의 선택-에 가까워지는 과정에 효과적으로 활용할 수 있도록, 앞으로 린 분석과 함께 데이터를 공부해 보려 한다. :)
좋은 문장들
- 직감은 중요하다. 단, 직감을 테스트할 필요는 있다. 직감이 실험이라면 데이터는 증거다. (p.36)
- "측정할 수 없는 것은 관리할 수 없다" - 피터 드러커 (p.37)
- '린'과 분석 체계는 둘 다 단순한 프로세스가 아니라 사고방식이다. '린'하면서도 분석적인 사고란 올바른 질문을 품고 자신이 목표로 하는 변화를 가져다줄 한 가지 핵심 지표에 집중하는 것이다. (p.40)
숙지할 개념들
- MVP: 시장에 약속한 가치를 제공하는 최소한의 제품으로, 실제로 존재해야할 필요는 없다. 가치를 제공할 수만 있으면!