장기 건강보험 손해율 컨설팅
lossratio 패키지 기반 데이터 의사결정 지원
한 줄 요약
원수사가 정말 알고 싶어하는 질문 — “한도를 X 로 바꾸면 LR 이 어떻게 될까?” — 에 현재 portfolio 의 segment-level 손해율 데이터로 ceiling/floor 를 정량 산출 한다. lossratio 는 이 counterfactual 의 historical evidence base 를 제공하고, 외부 가정 (portfolio mix · 가격 반응 · 보장 분해) 과 결합해 의사결정 가능한 추정치를 만든다.
시장 진단
원수사가 마주한 현실
장기 건강보험 손해율이 임계점을 넘었다. 흔히 인용되는 원인:
- 비급여 폭증 — 도수치료, 검사, 재활 카테고리.
- vintage 효과 — 특정 인수 시기 코호트의 LR 이 구조적으로 다름.
- 다년 보장 IBNR — 이미 누적된 책임의 무거움.
- paid-LR 의 한계 — 보고된 손해율이 실제 예측 손해율 보다 작음.
현재 분석 수준 (대부분 회사가 머물러 있는 곳)
업계 관찰로는 — 회사마다 차이가 있겠지만 — 대부분 원수사가 다음 수준에 머물러 있다:
- 삼각형 (LDT) 통계 산출. 발생사고 / 지급보험금 cohort × dev 표 + link factor 평균.
- paid-LR 추적. 누적 손해 / 누적 위험보험료 단순 비율.
- 그 다음의 정량 분석은 거의 없음:
- 예측 손해율 의 신뢰 구간이 없음.
- 한도 / 연령대 / 보장군 segment 별 LR 비교가 없음.
- 의사결정의 사후 검증 framework 가 없음.
- “한도 X → Y 변경 시 LR 변화 폭” 의 정량 답이 없음.
→ 회사는 직감 과 업계 통념 에 의존해 한도 / 가격 / 인수기준을 조정하고, 효과를 사후 점검하지 못한다. lossratio 는 삼각형 통계에서 의사결정 가능한 정량 분석으로의 한 단계 도약 을 제공한다.
의사결정을 막는 진짜 질문
“가입금액 한도를 5천에서 1억으로 늘리면 (또는 1억에서 5천으로 줄이면) LR 이 어떻게 될까?” 이 질문에 정량 답이 없으면 회사는 직감 또는 업계 통념에 의존해 한도를 조정한다.
회사가 알고 싶은 것:
- 한도 X 에서 한도 Y 로 바꿀 때 예측 손해율 의 기대 변화 폭.
- 어떤 segment (연령대 · 보장군 · 신구 코호트) 에서 효과가 큰가.
- 보유고 감소 (premium 분모 축소) 와 LR 개선의 net effect.
- 효과가 발현되는 시점 (즉각 vs. 몇 분기/년 후).
회사가 이미 알고 있는 것:
- 언제 한도를 바꿨는지 (개정 시점은 회사 자료에 남아있음).
- 그래서 “regime 변화 조기 경보” 는 retrospective 가치만 있음 — 회사 내부 변경의 알림용으론 불필요.
분석의 두 축: 직접 답과 간접 답
lossratio 가 직접 답하는 것과 외부 가정으로 간접 답하는 것을 구분.
용어 주의. 본 문서의 “예측 손해율” 은 관측 가능한 최대 dev 또는 수렴 영역 (\(k^{**}\) 이후) 의 LR projection 을 의미한다. 장기 건강보험은 계약이 수십 년 단위라 진정한 만기 ultimate 는 관측 자료로 직접 산출 불가 — 일반 P&C run-off 의 “ultimate LR” 과는 의미가 다르다.
직접 답하는 것
- 현재 portfolio 의 segment-level 예측 손해율. 한도 5천 cohort 와 1억 cohort 를 별도
build_triangle+fit_lr로 추정 → 정밀 비교. - 과거 한도 변경의 historical effect size. 변경 전후 cohort 의 예측 손해율 차이를
regime_break인자로 분리 적합 + 비교. - 추정의 신뢰도.
find_lr_convergence()로 수렴 시점 진단,fit_cl(method = "mack")로 process / parameter SE 산출. - 방법론 robustness. SA / ED / CL 세 method 비교 — 결과 일치하면 추정 견고, 갈리면 성숙점 / 기저 데이터 점검 필요.
간접 답하는 것 (similarity mapping + 외부 가정)
신상품 / 신한도가 과거 데이터와 부분적으로 겹치면 유사성 매핑 으로 간접 예측 가능:
| 예측 종류 | 매핑 방법 | 신뢰도 |
|---|---|---|
| 인터폴레이션 (기존 한도 사이) | 한도별 LR 사이 분포 비례 배분 | 높음 |
| 외삽 (기존 한도 밖) | 한도 vs LR 관계 가정 (linear / monotonic) | 중간 — 비선형성 검증 필요 |
| 보장 분해 (조합 신상품) | 기존 보장별 LR + 신규 보장은 외부 reference | 중간 — 신규 보장에 의존 |
| Mix 매핑 (demographic 유사 cohort) | 가입 mix (연령 · 성별 · 보장깊이) 매칭 | 중간 — selection bias 점검 |
| 순신규 시장 | 외부 자료 (재보험 · 산업 통계) 차용 | 낮음 |
lossratio 가 제공하는 것: 각 매핑의 building block (segment-level historical LR + uncertainty), 그리고 외삽 추정의 backtest 검증 도구.
직접 답하지 못하는 것 (정직 공개)
- 행태 반응. 한도 인상 시 어떤 고객층이 더 가입할지 (가격 반응 · 역선택) — 별도 GLM 또는 causal inference 분석 필요.
- 순신규 시장. 회사 (및 산업) 데이터에 전혀 없는 risk profile — lossratio 의 추정 base 가 없음.
- Selection bias 자동 보정. segment 의 demographic 동질성 가정이 깨지면 비교 편향. 명시적으로 demographic 통제 fit 필요.
이 한계를 정직히 공개하고 외부 가정 (portfolio mix · 행태 반응 · 가격 정책) 과 결합해 의사결정 시나리오를 구축한다.
분석 워크플로
각 시나리오는 컨설팅 산출물로 직접 매핑된다.
시나리오 A. Counterfactual — 한도 변경 시 LR 어떻게 될까 (핵심)
회사가 가장 알고 싶어하는 질문에 직접 답하는 분석.
분석 흐름
# 1. 한도 band 별 segment 분리
tri_5k <- build_triangle(exp[limit_band == "5k"], group_var = cv_nm)
tri_10k <- build_triangle(exp[limit_band == "10k"], group_var = cv_nm)
# 2. 각 band 의 예측 손해율 + CI
fit_5k <- fit_lr(tri_5k, method = "sa")
fit_10k <- fit_lr(tri_10k, method = "sa")
# 3. 비교
summary(fit_5k)$lr_ult
summary(fit_10k)$lr_ult
# 4. (외부 가정 결합) portfolio mix 가 5k → 10k 로 X% 이동 시
# → 기대 예측 손해율 = w_5k * LR_5k + w_10k * LR_10k산출물
- 한도 band 별 예측 손해율 + 95% CI 표.
- 한도 변경 시 portfolio 평균 LR 변화 폭 (mix 가정별 sensitivity 표).
- 연령대 / 보장군 cross-tab — 한도 효과가 큰 segment 식별.
- (요청 시) 인터폴레이션 / 외삽 / 보장 분해 추정치 + 신뢰 구간.
한계 명시
- segment 간 demographic 분포가 다르면 비교가 편향. → 통제 fit 추가.
- 행태 반응 (한도 인상 시 신규 mix 변화) 은 별도 모델링.
시나리오 B. 신뢰성 — 보고된 LR 을 믿을 수 있는가 (전제 조건)
시나리오 A 의 segment 비교가 의미 있으려면 각 segment 의 LR 추정이 정확 해야 한다. paid-LR 기반 의사결정은 IBNR 미반영으로 underestimate 가능 → 한도 인하 후 reserves 가 더 새는 사례.
fit_cl(method = "mack")— Mack chain ladder 예측 + 분산 (process · parameter SE).fit_lr(method = "sa")— 장기 health 패턴에 최적화된 단계 적응형. 초기엔 노출 기반 (ED), 성숙점 이후 chain ladder (CL).find_lr_convergence()— 추정이 진짜로 settled 됐는지 진단.
산출물: 종목별 예측 손해율 + 95% CI, 수렴 시점 평가 (\(k^*\), \(k^{**}\)).
시나리오 C. 과거 변경 효과 검증 — 직전 개정이 효과 있었나
회사가 과거에 한도 / 보장 / 인수기준을 바꿨던 시점이 있다면, 그 효과를 사후 검증.
regime_break인자로 변경 시점 전/후 cohort 분리 적합.- pre-break 예측 손해율 vs post-break 예측 손해율 비교.
- 변경 폭 ↔︎ LR 변화 폭 → 시나리오 A counterfactual 가정의 validation 자료 로 활용.
detect_cohort_regime() 은 데이터 자체가 알려주는 break 검출 — 회사 기억과 데이터가 일치하는지 검증, 또는 회사가 인지 못한 break 식별 (예: 외부 규제 충격 · 진료 행태 변화) 에 사용. 이미 알려진 회사 내부 변경의 조기 경보 용도로는 부적합.
산출물: 과거 변경별 pre/post LR 변화 정량화 표.
시나리오 D. 사후 검증 인프라 — 의사결정의 효과를 추적
원수사가 한도 변경을 실행한 뒤, 그 효과가 시간 경과에 따라 발현되는지 모니터링하는 framework.
- 분기별
backtest()+ 신규 cohort 의 LR development 추적. - 시나리오 A 의 예측치 ↔︎ 실제 관측치 gap 추적.
- 예측이 실제와 어긋나면 가정 (portfolio mix · 행태 반응) 재조정.
산출물: 분기별 prediction vs actual dashboard, 가정 재조정 alert.
컨설팅 옵션
| Tier | 산출물 | 기간 | 적합한 회사 |
|---|---|---|---|
| A. POC | 1개 종목·1개 회사 대상 진단 보고서 (시나리오 A 일부 + B) | 2-3주 | 도구 검토 단계 |
| B. 종합 진단 | 전 종목 + 한도/연령대 segment 별 fit, counterfactual 정량화 (시나리오 A·B·C) | 4-6주 | 의사결정 임박 |
| C. 내부 도구화 | 클라이언트 R 환경 setup + actuary 교육 + 분기 monitoring framework (시나리오 D 셋업) | 2-3개월 | 자체 운영 의지 |
| D. 지속 모니터링 | 분기/월 monitoring + prediction vs actual 추적 + reserves 재산출 | 연 단위 retainer | 의존 관계 형성 |
권장 진입 경로: A (POC) → B (종합) → C (도구화). POC 결과로 회사 내부 합의를 만들고, 종합 진단으로 의사결정 근거를 확보한 뒤, 도구화로 지속 가능한 운영체계를 만든다.
차별화 포인트
원수사 내부 actuarial 팀이나 컨설팅 펌이 이미 삼각형 통계 수준 의 분석을 하고 있다. 그러나 예측 손해율 정량 추정 / 한도 segment 비교 / counterfactual / 신뢰도 진단까지 가는 회사는 드물다. lossratio 의 차이:
- 장기 건강보험 특화. 단순 chain ladder 가 아닌 단계 적응형 (SA) 은 “초기 ED + 성숙 후 CL” 로 long-duration 의 inertia 함정을 회피.
- 수렴점 진단 (\(k^{**}\)). 예측 손해율 추정이 언제부터 신뢰 가능 한지를 정량 답함. 다른 도구는 “추정값” 만 내고 신뢰도 평가는 생략.
- Counterfactual 명시 분리. lossratio 는 “직접 추정 가능한 것” 과 “외부 가정 필요한 것” 을 명확히 분리 — 회사 내부 가정의 책임 소재가 명확.
- 재현 가능한 R 패키지. 컨설팅 산출물이 일회성 보고서가 아니라 내부에서 반복 실행 가능한 코드.
- 두 언어 지원. 영문 / 한글 vignette + 한글 reference 로 회사 내부 교육 비용 절감.
다음 단계
원수사 미팅 시 제안할 첫 단계:
- 데이터 형식 확인 (1주). 클라이언트가 long-format experience 데이터를 추출 가능한지 확인.
as_experience()가 받을 수 있는 스키마는 단순 (cohort, dev, loss, rp + group columns 포함 한도 band). - POC 범위 합의 (1주). 1개 종목 · 1개 segment · 1개 counterfactual 질문 선정.
- POC 실행 (2-3주). 시나리오 A (counterfactual) + B (신뢰성).
- 결과 발표 + 후속 제안 (1주). B/C/D 중 의사결정.
총 4-6주 안에 첫 산출물 + 후속 컨설팅 의사결정 가능.
부록: lossratio 주요 함수
| 함수 | 역할 |
|---|---|
as_experience() |
입력 long-format 데이터 검증 / 코어션 |
build_triangle() |
코호트 × dev 누적 / 증분 산출 |
build_calendar() |
calendar 기간 시계열 산출 |
build_total() |
그룹별 총계 산출 |
build_ata() / fit_ata() |
ATA 인자 적합 |
build_ed() / fit_ed() |
노출 기반 강도 적합 |
fit_cl() |
Mack chain ladder 예측 추정 |
fit_lr() |
SA / ED / CL 통합 손해율 예측 |
find_ata_maturity() |
성숙점 \(k^*\) 검출 |
find_lr_convergence() |
수렴점 \(k^{**}\) 검출 |
detect_cohort_regime() |
코호트 regime break 자동 검출 (사후 검증용) |
backtest() |
hold-out 대각선 기반 사후 검증 |