Актуарные расчеты страховых тарифов: SAS Ratemaking

Авторы:

Николай Филипенков, канд. физ.-мат. наук, руководитель направления риск-менеджмента и противодействия мошенничеству компании SAS Россия/СНГ

Евгений Яненко, генеральный директор ООО «Международная актуарная компания»

Никита Наместников, специалист по актуарным расчетам, SAS Россия/СНГ

 Введение

На фоне роста конкуренции на российском страховом рынке вследствие устранения законодательных ограничений на работу здесь иностранных компаний растут и выплаты по страховым случаям. Это, а также нестабильность финансовых рынков и жесткое государственное регулирование, равно как и слабое законодательство, негативно сказываются на уровне дохода. В таких условиях страховые компании ищут способы получения новых источников прибыли и их сохранения.

Исследования рынка страхования в России показывают[1], что в сложившейся ситуации наиболее приоритетными задачами для страховых компаний на пути создания сильных конкурентных преимуществ являются:

  • Определение перспективных сегментов рынка и соответствующих каналов продаж.
  • Усиление клиентоориентированности, а также повышения качества страховых услуг.
  • Оптимизация структуры расходов, включая совершенствование системы риск-менеджмента для получения более полной картины о величине и природе принимаемых рисков.

Одним из первых шагов по достижению поставленных задач может стать создание структуры тарифов на основе реального представления о клиентах и уровне рисков, принимаемых для себя компанией и в итоге снижающих риск потери действительно выгодных клиентов.

На протяжении долгих лет в процессе расчетов страховых тарифов актуарии в значительной мере опирались на не слишком сложные методы одномерного дисперсионного анализа. Однако данный подход обладает рядом недостатков[2]:

  • Он не учитывает корреляций между факторами риска. Например, с одной стороны, молодые водители могут водить более старые автомобили. С другой стороны, одномерный анализ возраста машины может выявить высокий уровень предъявления претензий для старых автомобилей. Однако этот эффект может быть в большей степени достигнут за счет того, что данной категорией автомобилей управляют молодые (как следствие - менее опытные) водители, поскольку старые машины оказываются им по карману.

  • Данный подходе не учитывает взаимосвязи между разными факторами и их совокупное влияние на статистику предъявления претензий.  Например, разница в части страховой премии, которая предназначена для выплаты страхового возмещения для женщин и мужчин, может разниться в зависимости от их возраста.

В 1960-х актуариями был разработан более сложный метод расчета страховых тарифов, известный как minimum bias procedures[3]. Однако данная методология также не предусматривает возможности оценки статистической значимости влияния конкретных переменных на результат моделирования.

В наше время на смену этим методам пришли более сложные методы и технологии статистического многомерного моделирования. По всему миру страховщики применяют сегодня обобщенные линейные модели (Generalized Linear Models; Nelder and Wedderburn, 1972) для прогнозирования рисков, связанных со страхованием собственности и ответственности.

GLM представляет собой обобщение модели множественной регрессии. Главная задача множественной регрессии (этот термин был впервые использован Пирсоном в 1908 г.) заключается в определении взаимосвязи между несколькими независимыми переменными (предикторами) и зависимой переменной. В GLM предполагается, что зависимая переменная Y (число страховых случаев, средний размер убытка) имеет функцию распределения из экспоненциального семейства, которому, среди прочего, принадлежат нормальное, биномиальное, пуассоновское и гамма распределения. Среднее значение \mu выражается через независимые переменные X как:

$$EY = \mu = g^{-1}(X\cdot \beta) \quad \quad (1)$$

где:     EY - математическое ожидание Y

X\cdot \beta - линейный предиктор - линейная комбинация неизвестных параметров \beta, где в качестве коэффициентов линейной комбинации используется матрица независимых переменных (например, вид сообщения, регион, квалификация пилота и т.д.);

g - функция связи: описывает, как зависимая переменная связана с линейным предиктором.

Кроме того, важной особенностью данного подхода является зависимость функции дисперсии V от среднего:

$$Var(Y) = V(\mu) = V(g^{-1}(X \beta))$$

Неизвестные параметры \beta обычно оцениваются методом максимального правдоподобия.

Применительно к задаче расчета страховых тарифов хороший результат получается при использовании в GLM логарифмической функции связи:

$$g(x) = \ln(x) \quad \quad (2)$$

и

$$g^{-1}(x) = \exp{x} \quad \quad (3)$$

В ряде случаев, когда влияние отдельного параметра известно из априорной информации, этот параметр можно включить в модель явно, например, добавить в линейный предиктор «параметр сдвига» \xi :

$$\eta = X\cdot\beta+\xi \quad \quad (4)$$

который дает

$$E(Y) = \mu = g^{-1}(X\cdot\beta+\xi) \quad \quad (5)$$

или с учетом логарифмической функции связи:

$$\mu = g^{-1}(x_1\cdot\beta_1+ ... + x_n \cdot \beta_n + \xi) = \exp(x_1\cdot\beta_1)\cdot ... \cdot \exp(x_n\cdot\beta_n)\cdot\exp(\xi) \quad \quad (6)$$

Таким образом, в результате применения GLM оцениваются значения неизвестных параметров \beta, а значит, находится связь между зависимой переменной (числом страховых случаев, средним размером убытка) и предикторами (факторами тарификации).

Преимуществами данного подхода является то обстоятельство, что линейная модель, а также большинство из наиболее распространенных minimum bias procedures, являются частными случаями обобщенных линейный моделей. Кроме того, данный подход позволяет делать более общие предположения о природе страховых данных и их связи с предиктивной переменной. Помимо этого, методология построения данных моделей является технологически эффективной, что повышает её практическую ценность. И наконец, GLM- подход предоставляет статистическую диагностику, помогающую при отборе только значимых переменных и при проверке допущений модели.

Современный инструментарий

GLM представляют собой сложные статистические модели, опирающиеся на большие объемы статистической информации и методы интеллектуального анализа данных (DataMining). Корректное использование таких моделей невозможно без применения инструментария (специализированных компьютерных программ).

В программный продукт для Data Mining - SAS Enterprise Miner - входит специализированный блок для построения моделей по расчёту страховых тарифов – Ratemaking Node. Этот блок оснащен дружественным интерфейсом и позволяет использовать широкие аналитические возможности системы SAS.

Функционал Ratemaking Node позволяет быстро и легко построить самые распространённые в страховой отрасли GLM модели для расчёта страховых тарифов:

Frequency models – позволяют предсказывать ожидаемую частоту страхового случая;

Severity models – дают возможность предсказывать ожидаемый размер убытка;

Pure premium models – позволяют предсказывать часть страховой премии, которая предназначена для выплаты страхового возмещения.

Для построения GLM моделей актуарию доступен широкий набор функций распределения и связи:

Функция распределения

Функция связи

Пуассона

Логарифмическая

Отрицательное биномиальное

Логарифмическая

Гамма

Логарифмическая, квадратическая, кубическая, обратная

Бинарная

Логит-функция

Нормальное

Логарифмическая, равенство, квадратическая, кубическая, обратная

Обратная Гаусса

Логарифмическая, равенство, квадратическая, кубическая, обратная

Твиди

Логарифмическая


Использование возможностей программных продуктов компании SAS позволяет актуарию выполнить полный цикл актуарной экспертизы страховых тарифов, в том числе:

1)      Формирование статистического базиса:

a.      Для ускорения процесса построения модели можно использовать лишь часть всех данных -  случайную выборку, построенную с помощью одного из предустановленных в блоке Sample методов. Случайная выборка позволяет более оперативно проанализировать факторы, влияющие на уровень риска, чтобы потом использовать эти знания при расчете на основной базе.

2)      Анализ данных расчётного базиса:

a.      В любой момент актуарию доступен широкий набор статистических моделей, позволяющих найти скрытые закономерности и несоответствия в данных расчетного базиса, а также средства визуализации, позволяющие их увидеть.

3)      Модификация переменных, характеризующих уровень риска:

a.      При расчетах с использованием GLM важно изучить свойства распределений анализируемых переменных, которые могут повлиять на точность вычислений: асимметрия, гетероскедастичность, островершинность. Блок Transform Variables позволяет подобрать для каждой переменной подходящее преобразование, чтобы решить возникающие проблемы с распределениями.

b.      Блок Impute  позволяет одним из встроенных методов решить проблему пропущенных значений, наличие которых недопустимо для большинства регрессионных моделей.

c.       С помощью блока Transform Variables значения классифицирующих переменных, определяющих факторы тарификации, группируются по интервалам, используя один из встроенных методов разбиения.

4)      Построение GLM моделей:

a.      Расчет на GLM на основании ограниченной/случайной выборки. Определение параметров модели для расчета на полной выборке.

b.      Расчет GLM на полной выборке.

5)      Анализ полученных результатов:

a.      Результаты расчета по GLM модели, а также анализ точности аппроксимации и применимости модели к изучаемым рискам, представлены в блоке Ratemaking Node в табличном и графическом виде (см. рис. 1).
ratemaking.png

Рис. 1. Визуальные формы блока Ratemaking Node

Заключение

В заключение можно отметить, что в лице SAS Enterprise Miner актуарий получает в руки лучший, по мнению многих аналитических агентств, инструмент интеллектуального анализа данных. Он позволяет рассчитывать тарифные ставки и оценивать страховые резервы, не имея технических ограничений в части выбора методов анализа и обработки данных и используя все признанные в современной статистике многомерныестатистические методы. Для этого, помимо упомянутых GLM, в продукте представлены также деревья решений и нейронные сети.

Применение данного продукта позволит выявить скрытые клиентские сегменты с высокой вероятностью перехода к конкурентам и на практике обеспечить снижение оттока клиентов.

 Успешный расчет тарифов основан на глубине и качестве использования исторических данных о страховых полисах возмещенных убытках. Для формирования инновационных структур тарифов необходим доступ к подробной и достоверной информации о страховых рисках. Сбор и обработка такой информации, обеспечение ее качества в крупной компании невозможны без промышленной платформы обработки и хранения данных, которую также может предоставить компания SAS.

Применение продуктов SAS в бизнес-аналитике и актуарных расчетах расширяет возможности страховых компаний по развитию бизнеса, повышает управляемость компании, обеспечивает гибкость и просчитанность принимаемых решений. Оперативность расчетов и широкие возможности применяемых моделей помогают оперативно реагировать на любые изменения на рынке и принимать в короткие сроки оптимальные решения, основанные на объективной оценке уровня риска.


[1] По данным исследований компании KPMG: “Вознаграждение за риск: Рынок страхования в России в 2013 году

[2] Anderson, D., Feldblum, S., Modlin, C., Schirmacher, D., Schirmacher, E., and Thandi, N., 2007. A Practitioner’s Guide to Generalized Linear Models

[3] The Minimum Bias Procedure A Practitioner "s Guide Sholom Feldblum, FCAS, FSA, MAAA and J. Eric Brosius, FCAS, MAAA

Поделиться
Вернуться в Актуально