Авторы:
Николай Филипенков, канд. физ.-мат. наук, руководитель направления риск-менеджмента и противодействия мошенничеству компании SAS Россия/СНГ
Евгений Яненко, генеральный директор ООО «Международная актуарная компания»
Никита Наместников, специалист по актуарным расчетам, SAS Россия/СНГ
Введение
На фоне роста конкуренции на российском страховом рынке вследствие устранения законодательных ограничений на работу здесь иностранных компаний растут и выплаты по страховым случаям. Это, а также нестабильность финансовых рынков и жесткое государственное регулирование, равно как и слабое законодательство, негативно сказываются на уровне дохода. В таких условиях страховые компании ищут способы получения новых источников прибыли и их сохранения.
Исследования рынка страхования в России показывают[1], что в сложившейся ситуации наиболее приоритетными задачами для страховых компаний на пути создания сильных конкурентных преимуществ являются:
Одним из первых шагов по достижению поставленных задач может стать создание структуры тарифов на основе реального представления о клиентах и уровне рисков, принимаемых для себя компанией и в итоге снижающих риск потери действительно выгодных клиентов.
На протяжении долгих лет в процессе расчетов страховых тарифов актуарии в значительной мере опирались на не слишком сложные методы одномерного дисперсионного анализа. Однако данный подход обладает рядом недостатков[2]:
В 1960-х актуариями был разработан более сложный метод расчета страховых тарифов, известный как minimum bias procedures[3]. Однако данная методология также не предусматривает возможности оценки статистической значимости влияния конкретных переменных на результат моделирования.
В наше время на смену этим методам пришли более сложные методы и технологии статистического многомерного моделирования. По всему миру страховщики применяют сегодня обобщенные линейные модели (Generalized Linear Models; Nelder and Wedderburn, 1972) для прогнозирования рисков, связанных со страхованием собственности и ответственности.
GLM представляет собой обобщение модели множественной регрессии. Главная задача множественной регрессии (этот термин был впервые использован Пирсоном в 1908 г.) заключается в определении взаимосвязи между несколькими независимыми переменными (предикторами) и зависимой переменной. В GLM предполагается, что зависимая переменная Y (число страховых случаев, средний размер убытка) имеет функцию распределения из экспоненциального семейства, которому, среди прочего, принадлежат нормальное, биномиальное, пуассоновское и гамма распределения. Среднее значение \mu выражается через независимые переменные X как:
$$EY = \mu = g^{-1}(X\cdot \beta) \quad \quad (1)$$где: EY - математическое ожидание Y
X\cdot \beta - линейный предиктор - линейная комбинация неизвестных параметров \beta, где в качестве коэффициентов линейной комбинации используется матрица независимых переменных (например, вид сообщения, регион, квалификация пилота и т.д.);
g - функция связи: описывает, как зависимая переменная связана с линейным предиктором.
Кроме того, важной особенностью данного подхода является зависимость функции дисперсии V от среднего:
$$Var(Y) = V(\mu) = V(g^{-1}(X \beta))$$Неизвестные параметры \beta обычно оцениваются методом максимального правдоподобия.
Применительно к задаче расчета страховых тарифов хороший результат получается при использовании в GLM логарифмической функции связи:
$$g(x) = \ln(x) \quad \quad (2)$$и
$$g^{-1}(x) = \exp{x} \quad \quad (3)$$В ряде случаев, когда влияние отдельного параметра известно из априорной информации, этот параметр можно включить в модель явно, например, добавить в линейный предиктор «параметр сдвига» \xi :
$$\eta = X\cdot\beta+\xi \quad \quad (4)$$который дает
$$E(Y) = \mu = g^{-1}(X\cdot\beta+\xi) \quad \quad (5)$$или с учетом логарифмической функции связи:
$$\mu = g^{-1}(x_1\cdot\beta_1+ ... + x_n \cdot \beta_n + \xi) = \exp(x_1\cdot\beta_1)\cdot ... \cdot \exp(x_n\cdot\beta_n)\cdot\exp(\xi) \quad \quad (6)$$Таким образом, в результате применения GLM оцениваются значения неизвестных параметров \beta, а значит, находится связь между зависимой переменной (числом страховых случаев, средним размером убытка) и предикторами (факторами тарификации).
Преимуществами данного подхода является то обстоятельство, что линейная модель, а также большинство из наиболее распространенных minimum bias procedures, являются частными случаями обобщенных линейный моделей. Кроме того, данный подход позволяет делать более общие предположения о природе страховых данных и их связи с предиктивной переменной. Помимо этого, методология построения данных моделей является технологически эффективной, что повышает её практическую ценность. И наконец, GLM- подход предоставляет статистическую диагностику, помогающую при отборе только значимых переменных и при проверке допущений модели.
Современный инструментарий
GLM представляют собой сложные статистические модели, опирающиеся на большие объемы статистической информации и методы интеллектуального анализа данных (DataMining). Корректное использование таких моделей невозможно без применения инструментария (специализированных компьютерных программ).
В программный продукт для Data Mining - SAS Enterprise Miner - входит специализированный блок для построения моделей по расчёту страховых тарифов – Ratemaking Node. Этот блок оснащен дружественным интерфейсом и позволяет использовать широкие аналитические возможности системы SAS.
Функционал Ratemaking Node позволяет быстро и легко построить самые распространённые в страховой отрасли GLM модели для расчёта страховых тарифов:
Frequency models – позволяют предсказывать ожидаемую частоту страхового случая;
Severity models – дают возможность предсказывать ожидаемый размер убытка;
Pure premium models – позволяют предсказывать часть страховой премии, которая предназначена для выплаты страхового возмещения.
Для построения GLM моделей актуарию доступен широкий набор функций распределения и связи:
Функция распределения |
Функция связи |
Пуассона |
Логарифмическая |
Отрицательное биномиальное |
Логарифмическая |
Гамма |
Логарифмическая, квадратическая, кубическая, обратная |
Бинарная |
Логит-функция |
Нормальное |
Логарифмическая, равенство, квадратическая, кубическая, обратная |
Обратная Гаусса |
Логарифмическая, равенство, квадратическая, кубическая, обратная |
Твиди |
Логарифмическая |
Использование возможностей программных продуктов компании SAS позволяет актуарию выполнить полный цикл актуарной экспертизы страховых тарифов, в том числе:
1) Формирование статистического базиса:
a. Для ускорения процесса построения модели можно использовать лишь часть всех данных - случайную выборку, построенную с помощью одного из предустановленных в блоке Sample методов. Случайная выборка позволяет более оперативно проанализировать факторы, влияющие на уровень риска, чтобы потом использовать эти знания при расчете на основной базе.
2) Анализ данных расчётного базиса:
a. В любой момент актуарию доступен широкий набор статистических моделей, позволяющих найти скрытые закономерности и несоответствия в данных расчетного базиса, а также средства визуализации, позволяющие их увидеть.
3) Модификация переменных, характеризующих уровень риска:
a. При расчетах с использованием GLM важно изучить свойства распределений анализируемых переменных, которые могут повлиять на точность вычислений: асимметрия, гетероскедастичность, островершинность. Блок Transform Variables позволяет подобрать для каждой переменной подходящее преобразование, чтобы решить возникающие проблемы с распределениями.
b. Блок Impute позволяет одним из встроенных методов решить проблему пропущенных значений, наличие которых недопустимо для большинства регрессионных моделей.
c. С помощью блока Transform Variables значения классифицирующих переменных, определяющих факторы тарификации, группируются по интервалам, используя один из встроенных методов разбиения.
4) Построение GLM моделей:
a. Расчет на GLM на основании ограниченной/случайной выборки. Определение параметров модели для расчета на полной выборке.
b. Расчет GLM на полной выборке.
5) Анализ полученных результатов:
a. Результаты расчета по GLM модели, а также анализ точности аппроксимации и применимости модели к изучаемым рискам, представлены в блоке Ratemaking Node в табличном и графическом виде (см. рис. 1).
![]()
Рис. 1. Визуальные формы блока Ratemaking Node
Заключение
В заключение можно отметить, что в лице SAS Enterprise Miner актуарий получает в руки лучший, по мнению многих аналитических агентств, инструмент интеллектуального анализа данных. Он позволяет рассчитывать тарифные ставки и оценивать страховые резервы, не имея технических ограничений в части выбора методов анализа и обработки данных и используя все признанные в современной статистике многомерныестатистические методы. Для этого, помимо упомянутых GLM, в продукте представлены также деревья решений и нейронные сети.
Применение данного продукта позволит выявить скрытые клиентские сегменты с высокой вероятностью перехода к конкурентам и на практике обеспечить снижение оттока клиентов.
Успешный расчет тарифов основан на глубине и качестве использования исторических данных о страховых полисах возмещенных убытках. Для формирования инновационных структур тарифов необходим доступ к подробной и достоверной информации о страховых рисках. Сбор и обработка такой информации, обеспечение ее качества в крупной компании невозможны без промышленной платформы обработки и хранения данных, которую также может предоставить компания SAS.
Применение продуктов SAS в бизнес-аналитике и актуарных расчетах расширяет возможности страховых компаний по развитию бизнеса, повышает управляемость компании, обеспечивает гибкость и просчитанность принимаемых решений. Оперативность расчетов и широкие возможности применяемых моделей помогают оперативно реагировать на любые изменения на рынке и принимать в короткие сроки оптимальные решения, основанные на объективной оценке уровня риска.
[1] По данным исследований компании KPMG: “Вознаграждение за риск: Рынок страхования в России в 2013 году
[2] Anderson, D., Feldblum, S., Modlin, C., Schirmacher, D., Schirmacher, E., and Thandi, N., 2007. A Practitioner’s Guide to Generalized Linear Models
[3] The Minimum Bias Procedure A Practitioner "s Guide Sholom Feldblum, FCAS, FSA, MAAA and J. Eric Brosius, FCAS, MAAA