Оценка резервов произошедших, но незаявленных убытков по многомерным цензурированным данным страховой компании

Анна Баскакова, актуарий, Независимый актуарный информационно-аналитический центр

Валерий Баскаков, доктор физ.-мат. наук, профессор, председатель Совета директоров Группы компаний IAAC

Как следует из названия, статья посвящена оценке резервов произошедших, но незаявленных убытков (РПНУ) - одной из наиболее сложных задач актуарной практики. Причина, по которой эту задачу относят к разряду сложных, станет ясна позже, а сейчас напомним определение РПНУ. Согласно [1] РПНУ есть «Совокупность обязательств страховщика, оценка которых произведена актуарными методами, о страховых выплатах по договорам имущественного страхования, страхования от несчастных случаев и медицинского страхования, включая расходы по урегулированию убытков, возникших в связи со страховыми случаями, произошедшими в отчетном или предшествующих ему периодах, о факте наступления которых в установленном законом или договором порядке не заявлено страховщику в отчетном или предшествующих ему периодах».

Очевидно, приведенное определение резерва произошедших, но незаявленных убытков (IBNR) эквивалентно формуле $$R = \sum\limits_{i=1}^N \textbf{M}_i (S), \quad \quad (1)$$ где    N – ожидаемое число произошедших, но незаявленных убытков;

\mathbf{M}_i (S) – ожидаемый убыток, то есть математическое ожидание страховых выплат по договорам страхования, включая расходы по урегулированию убытков, произошедших в отчетном или предшествующих ему периодах, при условии, что о факте их наступления в установленном законом или договором порядке не заявлено страховщику в отчетном или предшествующих ему периодах.

Выражение (1) подкупает своей простотой. Однако проблема в том, что на практике не известно ни число произошедших, но незаявленных убытков, ни их распределение. Поэтому задача оценки страховых резервов является далеко не тривиальной. В основе большинства известных методов расчета резервов лежат те или иные методы прогнозирования размера/числа неоплаченных убытков. В частности Минфин РФ рекомендует для этих целей использовать метод цепной лестницы, основанный на треугольниках развития [2].

В настоящей работе показано, что по статистическим данным страховых компаний можно оценить распределение убытков, число произошедших, но незаявленных убытков и, следовательно, рассчитать РПНУ по формуле (1).

Структура данных

Пусть имеется страховой портфель, содержащий n однотипных договоров. Обозначим

t'_i– дата начала i-ого договора страхования, i=1,…,m;

t''_i – дата окончания i -ого договора страхования, i=1,…,m;

\tau'_{ik} – дата происшествия или наступления k-ого страхового случая;

t – дата сбора статистической информации (отчетная дата);

\tau– время, исчисляемое от даты происшествия t''_{ik}, до даты заявления о страховом случае;

S_{ik}(t)– суммарный размер страховых выплат, произведенных по k-ому страховому случаю на отчетную дату t;

[t_1, t_2)– временной интервал, для которого производится расчет убытков.

Пусть указанные даты связаны следующими соотношениями

t'_i < t''_i;

t>t'_i; \quad \quad \quad (2)

\tau'_{ik} \le \min(t, t''_i);

t \le t_1 < t_2.

Графически это изображено на рис. 1а.

ocenka_1.png

Рис.1. Структура статистической информации

На практике типична ситуация, когда по одному договору заявляют более чем об одном страховом случае. Для того, чтобы не исключать такую возможность, воспользуемся следующим техническим приемом. Разобьем срок действия i-ого договора страхования, i=1,…,m на одинаковые временные интервалы \Delta t_k, k=1,...,n_i такие, что в течение \Delta t_k происходит один и только один страховой случай, включая страховые случаи с нулевым убытком S=0. Далее для определенности будем считать, что \Delta t_k равно одному дню.

Положим, что в случае нулевого убытка время между датой происшествия и датой заявления об убытке равно бесконечности, т.е. \tau = \infty. Понятно, что на практике это соответствует ситуации, когда происшествия не было, но такая условность упрощает последующие рассуждения. В частности в этом случае ожидаемый убыток \mathbf{M}(S) \equiv 0.

Перейдем от рассмотрения отдельных договоров страхования к анализу совокупности состоящей из n=\sum_i^m n_i полисо-дней. Учитывая, что в соответствии с предположением ежедневно по каждому страховому договору происходит один и только один страховой случай, то каждый полисо-день, предшествующий отчетной дате t, одновременно является датой происшествия (включая происшествия с нулевым убытком). Поэтому при использовании для \tau'_{ik}, k=1, ..., n сплошной нумерации (по договорам страхования), индекс i, указывающий номер договора можно опускать. Аналогичное замечание относится и величинам t, t_1 и t_2, представленным в системе координат, привязанной к дате происшествия:

t_k = t - \tau'_{ik};

t_{1,k} = t_1 - \tau'_{ik}; \quad \quad \quad (3)

t_{2,k} = t_2 - \tau'_{ik};

Таким образом, фиксированные в системе координат календарного времени границы временного интервала [t_1, t_2) в системе координат, определенной соотношениями (3),зависят от даты происшествия и равны [t_{1,k}, t_{2,k}). Графически рассмотренная ситуация изображена на рис. 1b.

 

Точечная и интервальная оценка РПНУ

Пусть дана двумерная функция распределения F(S,\tau), где S– убыток по страховому случаю, а \tau– время между датой происшествия и датой заявления о страховом случае, построенная, например, по методике [3].

Рассмотрим полисо-день, соответствующий дате происшествия \tau'_k. Если на дату t о страховом случае, произошедшем в момент \tau'_k, не заявлено, то дата заявления \tau > t_k и, в частности, \tau = \infty, если страхового случая не было.

Функция распределения убытка, произошедшего в момент \tau'_{ik} и заявленного в интервале [t_1; t_2) при условии, что о нем не было заявлено на отчетную дату t, равна

$$F_k(S) = 1 - \frac{F(\infty, t_{2,k}) - F(\infty, t_{1,k}) }{1 - F(\infty, t_k)} + \frac{ F(S, t_{2,k})-F(S,t_{1,k}) }{ 1 - F(\infty, t_k) }. \quad \quad (4)$$

Первые слагаемые, не зависящие от величины убытка, соответствуют вероятности заявления нулевого убытка в интервале [t_1,t_2) убыток не заявят (иначе S=0), а последнее слагаемое равно вероятности того, что убыток, заявленный в рассматриваемом интервале, меньше или равный S. Заметим, что для интервала [t,\infty) функции распределения убытка имеет вид

$$F_k(S) = \frac{ F(S,\infty)-F(S,t_k) }{ 1-F(\infty, t_k) }. \quad \quad (5)$$

Ожидаемый убыток, о котором заявят в интервале (t_1,t_2), равен

$$\mathbf{M}_k(S) = \int\limits_0^{\infty} S\cdot dF_k(S). \quad \quad (6)$$

Дисперсия убытка равна

$$\mathbf{D}_k(S) = \int \limits_0^{\infty} S^2 \cdot dF_k(S) - \mathbf{M}_k^2(S). \quad \quad (7)$$

Вероятность не нулевого убытка равна

$$P_k(S) = \frac{ F(\infty, t_{2,k})-F(\infty, t_{1,k}) }{ 1-F(\infty, t_k) }. \quad \quad (8)$$

Проводя аналогичные рассуждения для других полисо-дней с датой происшествия \tau'_{ik}, k=1,...,n, можно рассчитать ожидаемый убыток по отдельному договору или по портфелю в целом

$$\mathbf{M}_t(S) = \sum\limits_{k=1}^n \mathbf{M}_k(S) \quad \quad (9)$$

и его дисперсию

$$\mathbf{D}_t(S) = \sum\limits_{k=1}^n \mathbf{D}_k(S), \quad \quad (10)$$

а также ожидаемое число убытков

$$N_t = \sum\limits_{k=1}^n P_k (S). \quad \quad (11)$$

Здесь индекс t означает, что статистики (9) – (11) рассчитываются при условии, что об убытке не заявлено на отчетную дату t.

Обратимся к определению РПНУ в виде (1). Легко заметить, что оно эквивалентно выражению (9), где в качестве слагаемых \mathbf{M}_k(S), k=1,...,n используются ожидаемый убыток (математическое ожидание страховых выплат), включая расходы по урегулированию убытков, произошедших в отчетную дату t или в предшествующих ей периодах (полисо-дни), о факте наступления которых в установленном законом или договором порядке не заявлено страховщику в отчетном или предшествующих ей периодах.

Следует отметить, что в зависимости от того, как рассчитаны \mathbf{M}_k(S), k=1,...,n, по формуле (9) могут быть получены показатели, имеющие несколько различный смысл. Так, если в выражении (6) используется оценка F_k(S), построенная по формуле (5), то (9) является оценкой РПНУ в смысле приведенного в начале статьи определения. При использовании выражения (4), формула (9) позволяет оценить часть РПНУ, необходимую для покрытия убытков, о которых заявят в соответствующем временном интервале [t_1,t_2).

В частности, если рассмотреть систему непересекающихся временных интервалов [t_i,t_{i+1}), i = 1,2,3,... таких, что

$$\bigcup\limits_{i=1}^{\infty} [t_i, t_{i+1}) = [t,\infty), \quad \quad (12)$$

можно перераспределить РПНУ по этим интервалам в зависимости от ожидаемого количества произошедших незаявленных убытков, которые будут заявлены в соответствующие периоды, например в каждый последующий квартал после отчетной даты t.

Аналогичные замечания относятся и к формулам (10) и (11), с помощью которых можно оценить дисперсию РПНУ и число убытков, заявленных в любом наперед заданном временном интервале [t_1,t_2) после отчетной даты t.

Рассмотрим проблему построения интервальной оценки резерва. Теоретически эта задача решается сравнительно легко: используя аппарат производящих функций и выражение (5) функции распределения резерва для одного полисо-дня, можно получить формулу для расчета функции распределения резерва для всего страхового портфеля и построить толерантные границы. Однако для практических расчетов такой подход не пригоден ввиду очень большого объема вычислений. Поэтому для построения интервальной оценки резерва используется предположение о нормальности его распределения (далее будет показано, что основания для этого имеются), при этом нижняя S_{L} и верхняя S_{U} толерантные границы соответственно равны

$$S_L = \mathbf{M}_t(S) - u_{\frac{1-p}{2}}\cdot \sqrt{\mathbf{D}_t(S)}$$ $$\quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad (13)$$ $$S_L = \mathbf{M}_t(S) + u_{\frac{1-p}{2}}\cdot \sqrt{\mathbf{D}_t(S)},$$ где u_p - квантиль стандартного нормального распределения уровня p.

Численный пример

По данным страхового портфеля, содержащего 10000 однотипных договоров (процедура моделирования изложена ниже), сформирована двумерная цензурированная выборка (см. табл.1) в соответствии с методом, предложенным одним из авторов этой статьи [3]. Объем выборки составил 3430217 полисо-дней. При этом число заявленных урегулированных убытков (I=0, \tau = \infty) составило 1520, неурегулированных убытков (I=1) – 104. Число полисо-дней, в которых на отчетную дату убыток не заявлен, но возможно произошел и будет заявлен в будущем (I=2), равно 791772, а в остальные 2636821 полисо-дни убытков не было (I=0, \tau=\infty).

Таблица 1. Двумерная цензурированная выборка для расчета РПНУ

S I Время, прошедшее от даты происшествия \tau, дни
90 270 450 630 810 990 1170 \infty
0 0 5 26 59 36 38 39 18 2636821
1 2 10 9 9 11 6 1 .
2 83907 161741 156626 161305 146042 73558 8593 .
50 0 12 85 149 153 111 80 31 .
1 1 5 7 10 9 3 . .
100 0 10 43 82 70 44 38 15 .
1 1 4 1 2 2 2 . .
150 0 1 11 42 40 25 31 4 .
1 . 1 . 2 . 1 . .
200 0 . 16 19 15 21 12 1 .
1 . 1 . 3 . . . .
250 0 1 8 10 11 4 10 1 .
1 . . . . . 1 . .
300 0 1 5 11 8 4 3 . .
350 0 . . . 6 3 1 1 .
400 0 . 2 4 3 3 1 . .
450 0 . 1 3 4 1 1 . .
500 0 1 1 2 1 1 4 . .
600 0 . 1 1 . 3 . 2 .
650 0 . 2 . . 1 . . .
700 0 . . . 1 1 . . .
750 0 . . . . 1 . . .
850 0 . . 1 . . . . .
900 0 . . . . 1 . . .
950 0 . . 1 . . . . .
1400 0 . . 1 . . . . .
 

Функцию распределения F(S,\tau) оценивали по методике [3]. На рис.2 для наглядности приведен ее условный вариант F(S,\tau|S>0), т.к. из-за малой величины P(S>0)=0,000557 график F(S,\tau) неинформативен.

ocenka_2.png

Рис. 2. Оценка двумерной функции распределения F(S,\tau|S>0)

Расчет РПНУ и связанных с ним показателей проводился по изложенной выше методике. Так \mathbf{M}_t(S)=22777,21\pm3733,06, \sqrt{\mathbf{D}_t(S)}=2269,54 и N_t=224,81. Оценка среднего размера произошедшего, но незаявленного убытка составила 101.32 при том, что в процессе моделирования выборки этот параметр задавался равным 100. Распределение показателей убытка во времени приведено в табл. 2, а на рис. 3 показана точечная и интервальная оценка резерва, необходимого для покрытия убытков, о которых заявят в соответствующем временном интервале после отчетной даты.

Таблица 2. Распределение показателей убытка во времени

Показатель Время от отчетной даты, дни
[0, 90) [90, 270) [270, 450) [450, 630) [630, 810) [810, 990)
Ожидаемый убыток 7842.6 6547.9 4508.8 2627.4 1069.0 181.6
Ожидаемое число убытков 75. 9 64.0 44.3 26.6 11.7 2.4
Дисперсия 1811382 1479332 1013578 586377 219567 40571
Стандартное отклонение 1345.9 1216.3 1006.8 765.8 468.6 201.4


ocenka_3.png

Рис. 3 Распределение ожидаемого убытка во времени

 Точность оценивания РПНУ

С точки зрения практического применения предложенного алгоритма расчета РПНУ особый интерес представляет вопрос точности оценивания резерва по выборкам, объем которых адекватен имеющимся в распоряжении страховщиков данным. Для исследования точности оценивания резервов использовалось стохастическое моделирование на базе математической модели, достаточно подробно имитирующей процессы, протекающие в реальных страховых компаниях, включая заключение и расторжение страховых договоров, наступление страховых случаев, заявление и урегулирование убытков.

Стохастическое моделирование проводилось в среде SAS в предположении, что размер убытка имеет логарифмически нормальное, а время между датой происшествия и датой заявления о страховом случае – гамма распределение (см. табл. 3). Объем страхового портфеля варьировался от 100 до 100000 однотипных договоров, а частота страховых случаев – от 0.03 до 0.3. Для каждого фиксированного набора значений параметров модели генерировали не менее K=1000 выборок, на основании которых оценивали относительную погрешность и доверительные границы оценки РПНУ.

Таблица 3. Основные параметры модели

Размер среднего убытка Частота наступления страхового случая Параметры распределений:
T \sim \Gamma(k,\theta) S\sim \ln N(a,\sigma^2)
\bar{S}=100 \bar{P}(S>0)=0,2 \theta = 1000
k=1
\sigma=0.9
a =\ln \bar{S} - \sigma^2/2

 Процесс моделирования включает следующие шаги:

(1)                Задают входные параметры модели, включая средний убыток \bar{S} и частоту наступления страховых случаев \bar{P}(S>0);

(2)             Моделируют страховой портфель объемом n договоров и рассчитывают сумму убытков, которые были смоделированы как произошедшие, но незаявленные;

(3)           Формируют многомерную цензурированную выборку и строят оценку функции распределения F(S,\tau), согласно методике [3];

(4)           Оценивают РПНУ по формуле (9);

(5)             Повторяют шаги (2) - (4) не менее K раз;

(6)           Оценивают относительную погрешность оценки РПНУ и соответствующие доверительные границы.

Заметим, что рассчитываемая на шаге 2 сумма произошедших незаявленных убытков является случайной, так как она формируется в процессе моделирования в результате соотношения ряда случайных величин и теоретически равна РПНУ. Обозначим ее математическое ожидание как \mathbf{M}_t(R). Тогда относительную погрешность оценки РПНУ можно рассчитать, например, по формуле

$$K= \mathbf{M}_t(S)/\mathbf{M}_t(R), \quad \quad (14)$$

где    \mathbf{M}_t(S) оценивается на шаге 4 по формуле (9).

На рис. 4 представлена зависимость относительной погрешности оценки РПНУ (14) и границы его 98% толерантного интервала в зависимости от объема выборки, который определяется числом полисов. Из графика видно, что при принятых для моделирования объемах выборки, математическое ожидание исследуемой величины имеет незначительное смещение, не превышающее 5% по абсолютной величине. Причем для выборок более 500 полисов предложенный алгоритм дает несколько завышенную оценку РПНУ, что можно интерпретировать как актуарный запас. Дисперсия относительной погрешности оценки РПНУ резко уменьшается с ростом объема выборки. Количественно это выглядит следующим образом: при увеличении объема выборки в 1000 раз (со 100 до 100 тыс. полисов) дисперсия ошибки уменьшается более чем в 700 раз.

ocenka_4.png

Рис. 4. Погрешность оценки РПНУ в зависимости от объема выборки 

Далее из приведенных на рис. 4 графиков следует, что при объеме выборки в 2000 полисов и более, толерантные границы становятся симметричными относительно своего математического ожидания, которое при этом практически совпадает с медианой. Более наглядно зависимость формы плотности распределения относительной погрешности от объема выборки иллюстрирует рис. 5, где приведены графики для трех значений объема выборки: 250, 1000 и 10000 полисов.

Таким образом, результаты моделирования показывают, что при достаточно большом объеме выборки распределение оценки РПНУ близко к нормальному. Это вывод подтверждает допустимость применения выражения (13) для расчета толерантных границ. Например, прямое сравнение результатов расчета 98% толерантных интервалов по формуле (13) и полученных при моделировании (оценка резерва проводилась по выборке 10000 полисов, толерантные интервалы оценивались по выборке 1000 оценок резерва) показывают, что последние на 5.9% шире, а при объеме выборки в 40000 полисов это различие составляет только 0.8%.

ocenka_5.png

Рис. 5. Плотность распределения нормированного значения РПНУ в зависимости от объема выборки

 

Заключение

В статье проиллюстрированы достоинства и преимущества предложенного метода оценивания РПНУ. Они очевидны – по сравнению с традиционными подходами он позволяет оценить гораздо больше показателей резерва, включая его точечные и интервальные оценки, распределение резерва во времени и по группам полисов. Далее, в основе метода лежит всего одно предположение о том, что используемая для оценки функции распределения F(S,\tau) выборка случайна и однородна (это основное предположение для применимости большинства статистических методов).

Одновременно предположение о том, что используемая для оценки функции распределения F(S,\tau) выборка однородна, является и основным недостатком метода. Дело в том, что на практике это не всегда выполняется: (1) ввиду инфляции размер убытка зависит от календарного времени и (2) при построении оценки распределения F(S,\tau) время урегулирования не рассматривается, а размер убытка часто коррелирует с ним. Первую проблему можно легко преодолеть стандартными методами, если все платежи предварительно привести к фиксированной дате. Вторая проблема теоретически тоже решается. Для этого необходимо использовать трехмерную функцию распределения, добавив к двум координатам S и \tau третью – время урегулирования. Принципиальный алгоритм построения оценки трехмерной функции распределения мало отличается от алгоритма, используемого в настоящей работе. Однако его программная реализация вызывает затруднения.

В качестве окончательного вердикта отметим, что, несмотря на указанные недостатки, предложенный метод достаточно устойчив к определенным отклонениям модели от теоретической (в частности наличию корреляции между размером убытка и датой урегулирования), а поэтому может быть рекомендован для практического применения.

Литература

 1.      Глоссарий страховых терминов, используемых при проведении страховых операций. – М.: МФК, 2008. – 288 с.

2.      Приказ Минфина РФ от 11.06.2002 N 51н (ред. от 08.02.2012 с изменениями, вступившими в силу с 22.04.2012) «Об утверждении правил формирования страховых резервов по страхованию иному, чем страхование жизни»

3.      Баскаков В., Баскаков И. О тарификации и других задачах общего страхования // Актуарий, 2010. №1. С. 37 – 41. 

Поделиться
Вернуться в Актуально