데이터 분석

2. 지표 생성(근속년수)

돌돌55 2025. 4. 7. 20:51

1. 문제 정의

회사 인사 데이터를 보다보니, 근속년수가 평균값 중심으로 정리되어 있는 걸 확인하게 됐다. 처음엔 단순한 수치처럼 보였지만, 자세히 들여다보니 최근 입사자가 많을수록 평균값이 낮아지고, 조직 전체가 마치 불안정해 보일 수도 있겠다는 생각이 들었다.

실제로는 오랜 기간 근속 중인 구성원도 많고, 부서별로 분위기나 특성이 다른데 이런 맥락 없이 단일 수치만 보게 되면 조직에 대해 오해할 여지가 생긴다. 숫자는 정확하지만, 때로는 전체를 설명해주지 못하기 때문이다. 그래서 '어떻게 하면 조금 더 공정하고, 조직의 상태를 잘 보여줄 수 있을까?' 하는 고민이 생겼고, 단순 평균이 아닌 다양한 방식으로 근속년수를 바라볼 수 있는 지표를 설계해보고자 한다.

2. 목표

이번 보고서의 목표는 근속년수 지표를 좀 더 공정하고 균형 있게 보여주는 방법을 찾는 데 있다. 특정 시점의 인력 구성이나 외부 요인(예: 대규모 채용, 조직 개편 등)에 따라 지표가 필요 이상으로 변동되거나 오해를 살 수 있기 때문에, 조직의 실제 모습을 더 잘 담아낼 수 있는 보완 지표들을 함께 제안하고자 한다.

평균값 하나로 모든 걸 설명하기보다는, 다양한 관점을 더해 구성원과 조직의 특성을 근속년수를 확인하려는 목적에 맞고 정확하게 전달할 수 있는 기준을 만들어보려 한다.

3. 지표 설계 방향

근속년수를 완벽하게 설명해주는 단 하나의 지표는 없다고 생각한다. 조직은 계속 변화하고, 시기마다 인력 구조도 달라지기 때문에
어떤 하나의 수치로 모든 상황을 설명하는 건 어렵다. 그래서 이번 작업에서는 단일 지표를 고집하기보다, 여러 관점에서 근속년수를 나눠 보고, 각각의 특성과 장단점을 이해해보려 한다. 예를 들어, 평균 근속년수는 계산이 쉽고 익숙하지만, 신입이 많아질 경우 전체 수치를 왜곡할 수 있다. 반면, 중위값은 전체 구조의 중심을 더 잘 보여줄 수 있지만, 세부적인 구성 변화를 포착하긴 어렵다.

이처럼 각 지표가 보여주는 그림이 다르기 때문에,상황에 맞는 지표를 조합해 사용하는 것이 가장 현실적인 접근이라고 생각한다. 이후 분석에서는 이런 관점에서 다양한 근속 지표를 살펴보고,어떤 조합이 조직의 상태를 가장 잘 설명해줄 수 있을지를 고민해보고자 한다.

4-1. 모집단 정의: 근속년수 지표 설계의 출발점

근속년수 지표를 설계하기 위해서는 먼저 누구를 포함시켜 계산할 것인가에 대한 기준이 필요하다. 같은 계산 방식이라도, 대상에 따라 수치가 달라지고 해석도 완전히 달라질 수 있기 때문이다. 이번 분석에서는 다양한 시나리오를 고려해 아래와 같은 모집단 구성을 정의해보았다.

1. 현재 재직자만 포함

기준일 현재, 퇴사하지 않고 재직 중인 직원만 포함
장점: 현재 조직의 상태를 가장 잘 보여줌
단점: 과거 구성원들의 이탈률이나 장기 추세는 반영되지 않음

2. 퇴사자 포함 전체 직원 기준

과거부터 현재까지 입사했던 모든 직원을 포함 (퇴사자 포함)
퇴사자의 근속기간은 퇴사일까지로 계산
장점: 전반적인 조직 유지력, 인력의 유입-이탈까지 반영 가능
단점: 현재의 조직 안정성과는 조금 거리감이 있음

3. 최근 1년 이내 입사자 제외

아직 충분한 근속기간을 쌓지 못한 집단을 제외, 보통 6개월 또는 1년 이내 입사자를 임시 필터링
장점: 지표 왜곡을 줄이고, 실질적인 구성원 중심의 분석 가능
단점: 인위적으로 특정 그룹을 제외한다는 점에서 정책적으로 조심해야 할 수도 있음, 제외하는 기준 선정의 어려움

4. 정리

근속 지표를 설계할 때는 “지표의 목적”에 따라 모집단을 유연하게 선택하는 것이 중요하다. 예를 들어, 현재 조직의 안정성 파악이 목적이라면 재직자 기준이 적절하고, 인력 유지 및 이탈 분석이 목적이라면 퇴사자 포함 방식이 더 유리하다.

4.2 대표값 정의

근속년수를 요약할 때 가장 많이 사용하는 방식은 ‘대표값’이다. 대표값은 조직 전체의 경향을 한눈에 보여주는 데 효과적이지만, 데이터의 분포나 특성에 따라 해석이 달라질 수 있기 때문에 여러 지표를 함께 보고 보완적으로 해석할 필요가 있다.

1. 평균 근속년수 (Mean)

계산: 모든 근속년수의 합 ÷ 인원 수
예: 3.1년, 3.8년 등

장점

  • 계산이 간단하고 가장 익숙한 지표
  • 대시보드, 보고서 등 실무에 자주 사용

단점

  • 극단값에 민감 (신입 대거 입사, 장기 근속자 소수 등)
  • 시기나 인력 구성 변화에 따라 왜곡될 수 있음

2. 중앙값 근속년수 (Median)

계산: 근속년수를 순서대로 정렬 후 중앙값
예: 3.1년, 4.0년 등

장점

  • 평균보다 극단값에 덜 영향받음
  • 현재 구성원의 전반적인 중심을 잘 반영함단점
  • 계산이나 설명이 다소 직관적이지 않을 수 있음
  • 분포가 양쪽으로 크게 치우친 경우 해석이 제한적

3. 최댓값

최장 근속자: 조직 내 오래된 핵심 인력 파악 가능

4. 근속 편차

평균은 같은데 한쪽은 다 3년, 다른 한쪽은 1년~10년까지 다양할 수 있음
조직 내 근속 연령대의 다양성 또는 불균형 진단 가능
예시 : 근속 편차(표준편차), 최대/최소 차이 등

4.3 근속 분포

대표값(평균, 중앙값 등)은 조직의 전체적인 경향을 빠르게 보여주지만, 구성원의 다양성을 반영하기엔 한계가 있다. 그래서 근속년수를 구간별로 나누어 분포를 보는 방식이 효과적인 보완 지표가 될 수 있다. 아래 예시 처럼 구간으로 나눌 수 있다.

 

이러한 분포는 조직의 성장 단계, 구성원의 경험 수준, 이직률 등을 종합적으로 해석하는 데 도움이 된다.

장점

  • 단일 수치보다 조직의 구조를 시각적으로 파악 가능
  • 신입 비중, 팀원 구성, 장기 근속자 존재 여부 등을 쉽게 파악
  • 부서/직무별로 비교하면 특성 차이 분석 가능

단점

  • 구간 정의에 따라 해석이 달라질 수 있음 (예: 3년 기준 vs 5년 기준)
  • 다소 복잡해 보일 수 있어 설명과 시각화가 함께 필요

활용 방안

  • 전체 분포와 함께 대표값을 병렬로 제공하면 설명력이 강화됨
  • 조직 리포트, 채용 전략, 이직 분석 등에 유용
  • HR 대시보드에서 스택 바 차트 또는 피라미드 차트 형태로 시각화 시 효과적

4.4 특정 목적의 지표

근속년수를 기준으로 일정 기간 이상(또는 이하) 재직한 구성원의 비율을 구하면, 조직 내에 경험 있는 인력이 얼마나 자리 잡고 있는지 파악할 수 있다. 보통 3년 이상, 5년 이하 등 기준을 설정해 활용한다. 구간으로 생성할 수도 있다.

지표 정의 예시

  1. 3년 이상 근속자 비율 = (3년 이상 근속한 인원 / 전체 재직 인원) × 100
  2. 5년 이하 근속자 비율 = (5년 이하 근속한 인원 / 전체 재직 인원) × 100

추가로 가능한 지표

최근 입사자 비중, 관리자의 근속년수 등

5. 결과

다양한 방식으로 근속년수를 나누어 살펴본 결과, 단일 지표만으로 조직의 상태를 판단하기엔 한계가 있다는 점이 분명하게 드러났다. 대표값인 평균 근속년수는 계산이 간단하고 익숙하지만, 신입사원이 대거 입사하거나 특정 시점에 인력 구조가 크게 바뀌는 경우,
조직의 실제 모습과는 다르게 보일 수 있었다.

반면, 중위값이나 근속 구간별 분포, 일정 기준 이상의 장기 근속자 비율을 함께 살펴보면 조직 내의 경험 수준, 안정성, 그리고 인력 구조의 다양성을 좀 더 명확하게 파악할 수 있었다. 특히 근속 구간별로 인원을 나누어 보는 방식은, 신입 인력의 유입 흐름과 조직의 중간·장기 인력 유지 상황을 함께 해석할 수 있게 해주었다.

또한, 최근 입사자 비중이나 퇴사자 포함 여부, 분석 시점에 따라 지표의 의미가 달라질 수 있기 때문에, 지표를 사용할 때는 그 목적과 맥락에 맞는 모집단과 계산 방식을 명확히 정의하는 것이 중요하다는 점도 확인할 수 있었다.

종합하면, 근속년수는 단순 수치 이상의 해석이 필요한 지표이며, 복수의 지표를 함께 보고 상황에 맞게 조합하는 것이 조직을 보다 공정하고 정확하게 이해하는 데 도움이 될 수 있다.

6. 결론

근속년수는 조직의 안정성과 인력 구조를 이해하는 데 중요한 지표이지만, 단순한 평균값 하나로 설명하기에는 한계가 있다. 이번 분석을 통해 근속년수를 다양한 관점에서 나누어보고 해석하는 과정이 필요하다는 점을 확인할 수 있었다.

조직의 실제 모습을 보다 정확하게 반영하려면, 중위값, 근속 구간 분포, 장기 근속자 비율, 최근 입사자 비중 등을 함께 고려한 다층적인 지표 구성이 필요하다. 또한 지표를 해석할 때는 모집단의 정의와 시점을 명확히 하고, 사용 목적에 맞는 방식으로 계산하고 활용하는 기준을 사전에 정해두는 것이 중요하다.

완벽한 지표는 없지만, 공정한 지표는 만들 수 있다. 이번 분석이 조직의 상태를 보다 정확히 이해하고, 구성원들과의 소통에서도 신뢰할 수 있는 데이터 기반 설명이 가능하도록 돕는 하나의 기준이 되기를 바란다.