SQL & Python Study

[D+8] 의미있는 데이터 분석을 위한 능력, 데이터 리터러시(Data Literacy) 본문

✏️ STUDY etc./Article Study

[D+8] 의미있는 데이터 분석을 위한 능력, 데이터 리터러시(Data Literacy)

김숮엉 2024. 4. 24. 22:19

 

✏️ STUDY INDEX 

1. 데이터 리터러시란? 
2. 데이터의 함정! 데이터와 관련된 4가지 오류
3. 의미 있는 데이터 분석 첫걸음 문제 정의 
4. 의미있는 데이터 분석 두 번째 걸음 지표 설정
- Active user, Retention, Funnel, LTV, 북극성 지표 

 

* <데이터 리터러시> 1주차 강의를 듣고 작성한 포스팅입니다. 

1. 데이터 리터러시란?

데이터 리터러시(Data Literacy)는 말 그대로 '데이터 문해력'입니다.  

데이터를 읽고, 이해하고, 분석할 수 있는 능력입니다.

더 나아가, 분석한 결과를 의사소통에 활용하는 것까지가 데이터 리터러시라고 할 수 있어요! 

 

데이터 분석을 하다보면 "데이터 결과"만을 맹신하는 경향이 있습니다.

중요한 것은 눈 앞에 데이터에만 의존하지 않고

  • 스스로 목적과 문제를 정의하고
  • ② 목적 달성에 필요한 데이터 지표를 설정하고 수집
  • ③ 의미있는 결론을 도출할 수 있어야 합니다.

결국, 주체적인 데이터 분석과 의미 있는 의사결정을 위한 필수 능력이라고 할 수 있어요😊

 

2. 데이터의 함정! 데이터와 관련된 4가지 오류

눈 앞에 있는 데이터를 맹목적으로 의존하면 안 되는 이유가 있습니다. 

데이터와 관련된 다양한 오류를 설명해 드릴게요. 

종류 설명
①  심슨의 역설 (Simpson's Paradox)
전체와 부분의 관계가 상반되는 현상.
전체에 대한 결론이 언제나 개별 집단에 그대로 적용되지 않음.
  
(ex) 전체 지원 그룹에서는 A학교가 B학교보다 대학 합격률이 높지만,
성별이나 경제 수준에 따라 B 학교 합격률이 더 높을 수 있음. 

시각화를 활용한 왜곡
데이터를 잘못 이해하거나 부적절하게 표현하여 
특정 결과를 부풀리거나 왜곡하는 것 
특히, 그래프를 그릴 때 기준 값을 어떤 것에 두는지에 따라 왜곡이 심해짐. 

샘플링 편향 (Sampling bias)
무작위로 선택된 샘플이 전체 집단을 대표하지 못하는 것 
샘플이 대표성을 띄지 못하고, 특정 집단의 특성이 무시되거나 과장됨. 

(ex) 선거 후보에 대한 여론조사를 발표할 때, 특정 성향의 신문을 구독한 사람들만 의 의견만을 반영하여 편향된 결과가 나오는 것 

④ 상관관계와 인과관계  상관관계만으로 섣불리 의사결정, 문제의 원한을 파악하는 것. 
상관 관계 ≠ 인과관계 

*상관 관계 : 두 변수가 상호의존적인지 파악하는 것. 
*인과 관계 : 하나의 요인으로 인해 다른 요인 수치가 변하는 것. 인과가 분명함.

 

3. 의미있는 데이터 분석 첫걸음 문제 정의 

풀고자 하는 문제를 명확하게 정의하지 않았을 때, 데이터 분석의 효과나 결과가 저조할 수 있어요.

그래서 데이터 분석을 시작할 때 '문제 정의'부터 명확하게 설정해야 합니다.

 

의미있는 문제 정의는 "분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술"입니다. 

이를 통해 프로젝트의 목표를 설정하고, 분석 방향을 결정할 수 있어요! 

문제 정의가 제대로 되어 있어야 방대한 데이터와 해석 속에서도 길을 잃지 않을 수 있다는 뜻이에요 :) 

참고로. 문제는 둘 이상의 해석이 나오지 않도록 구체적으로 표현하고, 정의해야 합니다. 

 

문제를 정의할 때 *MECE 기반 로직 트리 방법을 많이 사용합니다. 

* MECE(Mutually Exclusive, Collectively Exhaustive) 문제 해결에 널리 사용되는 접근 방식.

 

로직트리에서 많이 사용하는 분류 기준을 아래 간단하게 정리드립니다. 

  • 시장 / 점유율에 따른 분류 
  • 고객, 경쟁사, 자사 등 개념적인 분류 (ex) 제품/가격 경쟁력 하락, 유통망의 노후화 
  • 반대되는 말로 분류 (ex) 내부요인/외부요인, 공급문제/수급문제 
  • 세그먼트로 분류 (ex) 구매 전 고객, 재구매 고객 
 💡강사님이 공유해주신 문제 정의 tips 

① 결과를 공유하고자 하는 사람이 누군인가? 
② 결과를 통해 원하는 변화는? 
③ 회사 소속이라면 경영자의 관점에서 바라보려고 노력할 것. 
④  많은 사람들과 의견을 나누고, 반드시 혼자서 오래 고민해 보는 시간을 가질 것. 

 

4. 의미있는 데이터 분석 두 번째 걸음 지표 설정

정의한 문제를 해결하기 위해서 봐야하는 적합한 지표를 설정하고 구성해야겠죠? 

지표특정 목표, 성과를 측정하기 위한 구체적이고 측정 가능한 기준입니다. 

비즈니스에서 유의미하게 자주 사용하는 지표와 해당 지표가 어떤 상황에서 적합한지 간단하게 소개해드릴게요!

대표적인 지표 의미 
① Active user (활성 유저) - 서비스 사용자 중 실제로 활동한 사용자
- 제공하고자 하는 서비스에 따라 액티브 유저의 활동 기준을 세워야 함.
- 액티브 유저를 설정하면 '이탈 유저'도 설정할 수 있음. 
② Retention Ratio (재방문율) 특정 기간 동안 이전에 방문한 사용자가 다시 방문한 비율 
충성도와 관련 있으며, 서비스 유형에 따라 측정 주기를 나누어 측정. 
사후 분석에 용이한 지표.

(1)  N-DAY Retention 
-  최초 사용일로부터 N일 후 재방문한 유저 비율 
- 게임, 소셜 등 습관적인 행동 유도 제품에 적합. 사용주기가 짧은 편

(2) Unbounded Retention
- 특정 날짜를 포함하여 그 이후 재방문한 유저 비율 
- 정기적인 반복 서비스가 아닌 경우 적합. 활동 기간을 제한하지 않음. 
- 얼마나 오래 서비스를 이용하고 있는지 패턴을 파악하는 데 용이 
- ex)  채용 사이트, 부동산 매물 서비스 등 

(3) Bracket Retention 
- 특정 기간(브라켓)으로 나누어 재방문율을 측정 
- 서비스 사용주기가 길거나 주기적인 경우 사용하기 적합 
- ex) 식료품 배달, 세차 서비스 
③ Funnel (퍼널) 
- 잠재 고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
- 각 단계의 전환율(또는 첫 유입 대비 전환율)을 측정
- 유저들이 어디서 이탈하는지 확인 가능! 
- *AARRR 프레임 워크 함께 잘 사용함. 
*Acquisition 유입, Activation 활성화, Retention 재방문(재구매),
Revenue 수익, Referral 추천
④ LTV (Life Time Value, 고객평생가치) - 한명의 유저가 생애주기 동안 얼만큼의 이익을 주는지 정량적으로 지표화
- LTV가 높으면 충성 고객이 많다고 할 수 있음. 
- LTV 증가 방안 : 객단가 상승, 구매 빈도 높이기, 이탈율/이용시간 증가 등 
⑤ 북극성 지표  - 기업이나 서비스의 핵심 목표(코어 밸류)를 나타내는 지표
- 기업의 주요 목표를 반영한 직관적인 행동 지표
- 성장과 관련 있기 때문에 지속적인 모니터링 필요. 
 - ex) Facebook 월간 활성 사용자 수, Uber 주당 평균 이용 횟수 등 

 


 

2024. 4. 24 

 

오늘의 공부는 여기까지입니다. 

 

저는 대학교 때 마케팅 학회에서 활동했는데, 그때 배웠던 개념들이 많이 나와서 재미있게 강의를 들었습니다.  

그리고 데이터 리터러시를 배우면서 대학교 시절 마케팅 교수님께서 해주신 말씀이 기억났어요.

마케터에게 필요한 건 '문제의 현상이 아닌, 원인을 발견하는 것'이라고 하셨거든요. 문제로 인해 나타나는 현상이 너무나 많은데, 현상이 아닌 본질적인 원인을 해결해야 목표를 달성할 수 있다는 뜻이에요! 그 말씀이 데이터 문해력을 높이는 데에도 똑같이 적용되는 것 같습니다. 역시 교수님!! 

 

tmi를 말하자면, 이번주는 학습에 집중이 잘 안되는 것 같아요. 면역력이 떨어졌는지 귀 밑에 멍울이 생겼어요 ㅠㅠ 지난주에는 살짝 만져지는 정도였는데, 아예 육안으로 확인할 수 있게 동그랗게 올라왔더라고요... 체력관리의 필요성을 여실히 느끼고 있는 요즘입니다. 내일 오랜만에 공복 운동을 해볼까 봐요..ㅠㅠ  몸도 마음도 건강히 공부에 집중할 수 있게 잘 관리해보겠습니다! 다들 건강 조심하세요🍀