장기 건강보험 손해율 컨설팅

lossratio 패키지 기반 데이터 의사결정 지원

Author

주석훈

한 줄 요약

원수사가 정말 알고 싶어하는 질문 — “한도를 X 로 바꾸면 LR 이 어떻게 될까?” — 에 현재 portfolio 의 segment-level 손해율 데이터로 ceiling/floor 를 정량 산출 한다. lossratio 는 이 counterfactual 의 historical evidence base 를 제공하고, 외부 가정 (portfolio mix · 가격 반응 · 보장 분해) 과 결합해 의사결정 가능한 추정치를 만든다.

시장 진단

원수사가 마주한 현실

장기 건강보험 손해율이 임계점을 넘었다. 흔히 인용되는 원인:

비급여 폭증 — 도수치료, 검사, 재활 카테고리.
vintage 효과 — 특정 인수 시기 코호트의 LR 이 구조적으로 다름.
다년 보장 IBNR — 이미 누적된 책임의 무거움.
paid-LR 의 한계 — 보고된 손해율이 실제 예측 손해율 보다 작음.

현재 분석 수준 (대부분 회사가 머물러 있는 곳)

업계 관찰로는 — 회사마다 차이가 있겠지만 — 대부분 원수사가 다음 수준에 머물러 있다:

삼각형 (LDT) 통계 산출. 발생사고 / 지급보험금 cohort × dev 표 + link factor 평균.
paid-LR 추적. 누적 손해 / 누적 위험보험료 단순 비율.
그 다음의 정량 분석은 거의 없음:
- 예측 손해율 의 신뢰 구간이 없음.
- 한도 / 연령대 / 보장군 segment 별 LR 비교가 없음.
- 의사결정의 사후 검증 framework 가 없음.
- “한도 X → Y 변경 시 LR 변화 폭” 의 정량 답이 없음.

→ 회사는 직감 과 업계 통념 에 의존해 한도 / 가격 / 인수기준을 조정하고, 효과를 사후 점검하지 못한다. lossratio 는 삼각형 통계에서 의사결정 가능한 정량 분석으로의 한 단계 도약 을 제공한다.

의사결정을 막는 진짜 질문

“가입금액 한도를 5천에서 1억으로 늘리면 (또는 1억에서 5천으로 줄이면) LR 이 어떻게 될까?” 이 질문에 정량 답이 없으면 회사는 직감 또는 업계 통념에 의존해 한도를 조정한다.

회사가 알고 싶은 것:

한도 X 에서 한도 Y 로 바꿀 때 예측 손해율 의 기대 변화 폭.
어떤 segment (연령대 · 보장군 · 신구 코호트) 에서 효과가 큰가.
보유고 감소 (premium 분모 축소) 와 LR 개선의 net effect.
효과가 발현되는 시점 (즉각 vs. 몇 분기/년 후).

회사가 이미 알고 있는 것:

언제 한도를 바꿨는지 (개정 시점은 회사 자료에 남아있음).
그래서 “regime 변화 조기 경보” 는 retrospective 가치만 있음 — 회사 내부 변경의 알림용으론 불필요.

분석의 두 축: 직접 답과 간접 답

lossratio 가 직접 답하는 것과 외부 가정으로 간접 답하는 것을 구분.

용어 주의. 본 문서의 “예측 손해율” 은 관측 가능한 최대 dev 또는 수렴 영역 (\(k^{**}\) 이후) 의 LR projection 을 의미한다. 장기 건강보험은 계약이 수십 년 단위라 진정한 만기 ultimate 는 관측 자료로 직접 산출 불가 — 일반 P&C run-off 의 “ultimate LR” 과는 의미가 다르다.

직접 답하는 것

현재 portfolio 의 segment-level 예측 손해율. 한도 5천 cohort 와 1억 cohort 를 별도 build_triangle + fit_lr 로 추정 → 정밀 비교.
과거 한도 변경의 historical effect size. 변경 전후 cohort 의 예측 손해율 차이를 regime_break 인자로 분리 적합 + 비교.
추정의 신뢰도. find_lr_convergence() 로 수렴 시점 진단, fit_cl(method = "mack") 로 process / parameter SE 산출.
방법론 robustness. SA / ED / CL 세 method 비교 — 결과 일치하면 추정 견고, 갈리면 성숙점 / 기저 데이터 점검 필요.

간접 답하는 것 (similarity mapping + 외부 가정)

신상품 / 신한도가 과거 데이터와 부분적으로 겹치면 유사성 매핑 으로 간접 예측 가능:

예측 종류	매핑 방법	신뢰도
인터폴레이션 (기존 한도 사이)	한도별 LR 사이 분포 비례 배분	높음
외삽 (기존 한도 밖)	한도 vs LR 관계 가정 (linear / monotonic)	중간 — 비선형성 검증 필요
보장 분해 (조합 신상품)	기존 보장별 LR + 신규 보장은 외부 reference	중간 — 신규 보장에 의존
Mix 매핑 (demographic 유사 cohort)	가입 mix (연령 · 성별 · 보장깊이) 매칭	중간 — selection bias 점검
순신규 시장	외부 자료 (재보험 · 산업 통계) 차용	낮음

lossratio 가 제공하는 것: 각 매핑의 building block (segment-level historical LR + uncertainty), 그리고 외삽 추정의 backtest 검증 도구.

직접 답하지 못하는 것 (정직 공개)

행태 반응. 한도 인상 시 어떤 고객층이 더 가입할지 (가격 반응 · 역선택) — 별도 GLM 또는 causal inference 분석 필요.
순신규 시장. 회사 (및 산업) 데이터에 전혀 없는 risk profile — lossratio 의 추정 base 가 없음.
Selection bias 자동 보정. segment 의 demographic 동질성 가정이 깨지면 비교 편향. 명시적으로 demographic 통제 fit 필요.

이 한계를 정직히 공개하고 외부 가정 (portfolio mix · 행태 반응 · 가격 정책) 과 결합해 의사결정 시나리오를 구축한다.

분석 워크플로

각 시나리오는 컨설팅 산출물로 직접 매핑된다.

시나리오 A. Counterfactual — 한도 변경 시 LR 어떻게 될까 (핵심)

회사가 가장 알고 싶어하는 질문에 직접 답하는 분석.

분석 흐름

# 1. 한도 band 별 segment 분리
tri_5k  <- build_triangle(exp[limit_band == "5k"], group_var = cv_nm)
tri_10k <- build_triangle(exp[limit_band == "10k"], group_var = cv_nm)

# 2. 각 band 의 예측 손해율 + CI
fit_5k  <- fit_lr(tri_5k,  method = "sa")
fit_10k <- fit_lr(tri_10k, method = "sa")

# 3. 비교
summary(fit_5k)$lr_ult
summary(fit_10k)$lr_ult

# 4. (외부 가정 결합) portfolio mix 가 5k → 10k 로 X% 이동 시
#    → 기대 예측 손해율 = w_5k * LR_5k + w_10k * LR_10k

산출물

한도 band 별 예측 손해율 + 95% CI 표.
한도 변경 시 portfolio 평균 LR 변화 폭 (mix 가정별 sensitivity 표).
연령대 / 보장군 cross-tab — 한도 효과가 큰 segment 식별.
(요청 시) 인터폴레이션 / 외삽 / 보장 분해 추정치 + 신뢰 구간.

한계 명시

segment 간 demographic 분포가 다르면 비교가 편향. → 통제 fit 추가.
행태 반응 (한도 인상 시 신규 mix 변화) 은 별도 모델링.

시나리오 B. 신뢰성 — 보고된 LR 을 믿을 수 있는가 (전제 조건)

시나리오 A 의 segment 비교가 의미 있으려면 각 segment 의 LR 추정이 정확 해야 한다. paid-LR 기반 의사결정은 IBNR 미반영으로 underestimate 가능 → 한도 인하 후 reserves 가 더 새는 사례.

fit_cl(method = "mack") — Mack chain ladder 예측 + 분산 (process · parameter SE).
fit_lr(method = "sa") — 장기 health 패턴에 최적화된 단계 적응형. 초기엔 노출 기반 (ED), 성숙점 이후 chain ladder (CL).
find_lr_convergence() — 추정이 진짜로 settled 됐는지 진단.

산출물: 종목별 예측 손해율 + 95% CI, 수렴 시점 평가 (\(k^*\), \(k^{**}\)).

시나리오 C. 과거 변경 효과 검증 — 직전 개정이 효과 있었나

회사가 과거에 한도 / 보장 / 인수기준을 바꿨던 시점이 있다면, 그 효과를 사후 검증.

regime_break 인자로 변경 시점 전/후 cohort 분리 적합.
pre-break 예측 손해율 vs post-break 예측 손해율 비교.
변경 폭 ↔︎ LR 변화 폭 → 시나리오 A counterfactual 가정의 validation 자료 로 활용.

detect_cohort_regime() 은 데이터 자체가 알려주는 break 검출 — 회사 기억과 데이터가 일치하는지 검증, 또는 회사가 인지 못한 break 식별 (예: 외부 규제 충격 · 진료 행태 변화) 에 사용. 이미 알려진 회사 내부 변경의 조기 경보 용도로는 부적합.

산출물: 과거 변경별 pre/post LR 변화 정량화 표.

시나리오 D. 사후 검증 인프라 — 의사결정의 효과를 추적

원수사가 한도 변경을 실행한 뒤, 그 효과가 시간 경과에 따라 발현되는지 모니터링하는 framework.

분기별 backtest() + 신규 cohort 의 LR development 추적.
시나리오 A 의 예측치 ↔︎ 실제 관측치 gap 추적.
예측이 실제와 어긋나면 가정 (portfolio mix · 행태 반응) 재조정.

산출물: 분기별 prediction vs actual dashboard, 가정 재조정 alert.

컨설팅 옵션

Tier	산출물	기간	적합한 회사
A. POC	1개 종목·1개 회사 대상 진단 보고서 (시나리오 A 일부 + B)	2-3주	도구 검토 단계
B. 종합 진단	전 종목 + 한도/연령대 segment 별 fit, counterfactual 정량화 (시나리오 A·B·C)	4-6주	의사결정 임박
C. 내부 도구화	클라이언트 R 환경 setup + actuary 교육 + 분기 monitoring framework (시나리오 D 셋업)	2-3개월	자체 운영 의지
D. 지속 모니터링	분기/월 monitoring + prediction vs actual 추적 + reserves 재산출	연 단위 retainer	의존 관계 형성

권장 진입 경로: A (POC) → B (종합) → C (도구화). POC 결과로 회사 내부 합의를 만들고, 종합 진단으로 의사결정 근거를 확보한 뒤, 도구화로 지속 가능한 운영체계를 만든다.

차별화 포인트

원수사 내부 actuarial 팀이나 컨설팅 펌이 이미 삼각형 통계 수준 의 분석을 하고 있다. 그러나 예측 손해율 정량 추정 / 한도 segment 비교 / counterfactual / 신뢰도 진단까지 가는 회사는 드물다. lossratio 의 차이:

장기 건강보험 특화. 단순 chain ladder 가 아닌 단계 적응형 (SA) 은 “초기 ED + 성숙 후 CL” 로 long-duration 의 inertia 함정을 회피.
수렴점 진단 (\(k^{**}\)). 예측 손해율 추정이 언제부터 신뢰 가능 한지를 정량 답함. 다른 도구는 “추정값” 만 내고 신뢰도 평가는 생략.
Counterfactual 명시 분리. lossratio 는 “직접 추정 가능한 것” 과 “외부 가정 필요한 것” 을 명확히 분리 — 회사 내부 가정의 책임 소재가 명확.
재현 가능한 R 패키지. 컨설팅 산출물이 일회성 보고서가 아니라 내부에서 반복 실행 가능한 코드.
두 언어 지원. 영문 / 한글 vignette + 한글 reference 로 회사 내부 교육 비용 절감.

다음 단계

원수사 미팅 시 제안할 첫 단계:

데이터 형식 확인 (1주). 클라이언트가 long-format experience 데이터를 추출 가능한지 확인. as_experience() 가 받을 수 있는 스키마는 단순 (cohort, dev, loss, rp + group columns 포함 한도 band).
POC 범위 합의 (1주). 1개 종목 · 1개 segment · 1개 counterfactual 질문 선정.
POC 실행 (2-3주). 시나리오 A (counterfactual) + B (신뢰성).
결과 발표 + 후속 제안 (1주). B/C/D 중 의사결정.

총 4-6주 안에 첫 산출물 + 후속 컨설팅 의사결정 가능.

부록: lossratio 주요 함수

함수	역할
`as_experience()`	입력 long-format 데이터 검증 / 코어션
`build_triangle()`	코호트 × dev 누적 / 증분 산출
`build_calendar()`	calendar 기간 시계열 산출
`build_total()`	그룹별 총계 산출
`build_ata()` / `fit_ata()`	ATA 인자 적합
`build_ed()` / `fit_ed()`	노출 기반 강도 적합
`fit_cl()`	Mack chain ladder 예측 추정
`fit_lr()`	SA / ED / CL 통합 손해율 예측
`find_ata_maturity()`	성숙점 \(k^*\) 검출
`find_lr_convergence()`	수렴점 \(k^{**}\) 검출
`detect_cohort_regime()`	코호트 regime break 자동 검출 (사후 검증용)
`backtest()`	hold-out 대각선 기반 사후 검증

상세 문서: https://seokhoonj.github.io/lossratio/ko/