1 Repaso
1.1 Conceptos básicos
La función de distribución acumulativa, también llamada función de distribución y generalmente denominada \(F_{X}(x)\) o \(F(x)\), 1 para una variable aleatoria \(X\) es la probabilidad de que \(X\) es menor o igual que un número dado. Es decir, \(F_{X}(x)=\operatorname{Pr}(X \leq x)\).
La función de distribución debe satisfacer una serie de requisitos:
- \(0 \leq F(x) \leq 1\) para todo \(x\).
- \(F(x)\) no es decreciente.
- \(F(x)\) es continua por la derecha.
- \(\lim_{x \rightarrow-\infty} F(x)=0\) y \(\lim _{x \rightarrow \infty} F(x)=1.\)
Las variables aleatorias funcionan para distintos objetivos en el ámbito actuarial
Modelo 1. Edad para la muerte: Todas las edades entre 0 y 100 son posibles. Si bien la experiencia sugiere que existe un límite superior para la vida humana, los modelos sin límite superior pueden ser útiles si asignan probabilidades extremadamente bajas a edades extremas. Esto permite al modelador evitar establecer una edad máxima específica: \[\begin{equation*} F_{1}(x)= \begin{cases} 0, & x<0 \\ 0.01 x, & 0 \leq x<100 \\ 1, & x \geq 100 \end{cases} \end{equation*}\] This cdf is illustrated in Figure 2.1.
<- function(x) {
F1 case_when(
< 0 ~ 0,
x between(x, 0, 100) ~ 0.01 * x,
>= 100 ~ 1
x
)
}
<- 0:100
x plot(F1(x), type = "l")
Modelo 2. Cantidad de dólares pagados en un reclamo de seguro de automóvil: Todos los valores positivos son posibles. Al igual que con la mortalidad, es probable que haya un límite superior (todo el dinero del mundo por ejemplo), pero este modelo ilustra que, en el modelado, la correspondencia con la realidad no tiene por qué ser perfecta: \[\begin{equation*} F_{2}(x)= \begin{cases} 0, & x<0 \\ 1-\left(\frac{2000}{x+2000}\right)^{3}, & x\geq 0 \end{cases} \end{equation*}\]
<- function(x) {
F2 case_when(
< 0 ~ 0,
x >= 0 ~ 1 - (2000 / (x + 2000))^3
x
)
}
<- 0:3000
x plot(F2(x), type = "l")
Model 3. Número de reclamos de una poliza para un año: La probabilidad se concentra en los cinco puntos \((0,1,2,3,4)\) y la probabilidad en cada uno viene dada por el tamaño del salto en la función de distribución: \[\begin{equation*} F_{3}(x)= \begin{cases} 0, & x<0 \\ 0.5, & 0 \leq x<1 \\ 0.75, & 1 \leq x<2 \\ 0.87, & 2 \leq x<3 \\ 0.95, & 3 \leq x<4 \\ 1, & x \geq 4 \end{cases} \end{equation*}\]
<- function(x) {
F3 case_when(
< 0 ~ 0,
x 0 <= x & x < 1 ~ 0.5,
1 <= x & x < 2 ~ 0.75,
2 <= x & x < 3 ~ 0.87,
3 <= x & x < 4 ~ 0.95,
4 <= x ~ 1
)
}
<- 0:5
x plot(F3(x), type = "s", ylim = c(0, 1))
Model 4. Total de dólares pagados en una poliza de negligencia médica en un año: La mayor parte de la probabilidad está en cero (0,7) porque en la mayoría de los años no se paga nada. El restante \(0.3\) de probabilidad se distribuye entre valores positivos: \[\begin{equation*} F_{4}(x)= \begin{cases} 0, & x<0 \\ 1-0.3 e^{-0.00001 x}, & x \geq 0 \end{cases} \end{equation*}\]
<- function(x) {
F4 case_when(
< 0 ~ 0,
x >= 0 ~ 1 - 0.3 * exp(-0.00001 * x)
x
)
}
<- 0:500000
x plot(F4(x), type = "l", ylim = c(0, 1))
La función de supervivencia, generalmente denominada \(S_{X}(x)\) o \(S(x)\), para una variable aleatoria \(X\) es la probabilidad de que \(X\) sea mayor que un numero dado Es decir, \(S_{X}(x)=\operatorname{Pr}(X>x)=1-F_{X}(x)\).
Como resultado:
- \(0 \leq S (x) \leq 1\) para todo \(x\)
- \(S(x)\) no es creciente.
- \(S(x)\) es continua por la derecha.
- \(\lim _{x \rightarrow-\infty} S(x)=1\) y \(\lim _{x \rightarrow \infty} S(x)=0\)
La función de densidad de probabilidad, también llamada función de densidad y generalmente denotada como \(f_{X}(x)\) o \(f(x)\), es la derivada de la función de distribución o, de manera equivalente , el negativo de la derivada de la función de supervivencia. Es decir, \(f(x)=F^{\prime}(x)=-S^{\prime}(x)\).
La tasa de riesgo, también conocida como la fuerza de la mortalidad y la tasa de falla y generalmente denotada \(h_{X}(x)\) o \(h(x)\), es la relación de la funciones de densidad y supervivencia cuando se define la función de densidad. Es decir, \(h_{X}(x)=f_{X}(x) / S_{X}(x)\).
1.1.1 Ejercicios
Para los modelos 1, 2, 3 y 4, encuentre y dibuje las funciones funciones de densidad (\(f_X(x)\)) o probabilidad de masa (\(p_X(x)\)), sobrevivencia (\(S_X(x)\)) y tasa de mortalidad (\(h_X(x)\)).
1.2 Medidas básicas distribucionales
El k-ésimo momento central de una variable aleatoria es el valor esperado de la k-ésima potencia de la desviación de la variable con respecto a su media. Se denota por \(\mathbb{E}\left[(X-\mu)^{k}\right]\) o por \(\mu_{k}\). El segundo momento central generalmente se denomina varianza y se denota \(\sigma^{2}\) o \(\operatorname{Var}(X)\), y su raíz cuadrada, \(\sigma\), se denomina Desviación Estándar. La relación entre la desviación estándar y la media se llama coeficiente de variación. La relación entre el tercer momento central y el cubo de la desviación estándar, \(\gamma_{1}=\mu_{3} / \sigma^{3}\), se denomina asimetría. La relación entre el cuarto momento central y la cuarta potencia de la desviación estándar, \(\gamma_{2}=\mu_{4} / \sigma^{4}\), se denomina curtosis.
Para un valor dado de \(d\) con \(\operatorname{Pr}(X>d)>0\), la variable de exceso de pérdida es \(Y^{P}=X-d\) dado que \(X> d\). Su valor esperado, \[\begin{equation*} e_{X}(d)=e(d)=\mathrm{E}\left(Y^{P}\right)=\mathrm{E}(X-d \mid X >d), \end{equation*}\] se denomina función de exceso de pérdida media. Otros nombres para esta expectativa son función de vida residual media y expectativa de vida completa. Cuando se utiliza la última terminología, el símbolo comúnmente utilizado es \(\stackrel{\circ}{e}_{d}\).
Esta esperanza se estima como
\[\begin{equation*} \begin{aligned} e_{X}(d) &=\frac{\int_{d}^{\infty}(x-d) f(x) d x}{1-F(d)} \\ &=\frac{-\left.(x-d) S(x)\right|_{d} ^{\infty}+\int_{d}^{\infty} S(x) d x}{S(d)} \\ &=\frac{\int_{d}^{\infty} S(x) d x}{S(d)} \end{aligned} \end{equation*}\]
La variable censurada y desplazada a la izquierda es \[\begin{equation*} Y^{L}=(X-d)_{+}= \begin{cases}0, & X \leq d \\ X-d, & X>d\end{cases} \end{equation*}\]
Su esperanza es \[\begin{equation*} \mathrm{E}\left[(X-d)_{+}^{k}\right]=e^{k}(d)[1-F(d)] . \end{equation*}\]
La variable de pérdida limitada es \[\begin{equation*} Y=X \wedge u= \begin{cases}X, & X<u \\ u, & X \geq u\end{cases} \end{equation*}\] Su valor esperado es \(E(X \wedge u)\).
\[\begin{equation*} \mathrm{E}\left[(X \wedge u)^{k}\right]= \begin{cases} \int_{-\infty}^{u} x^{k} f(x) d x+u^{k}[1-F(u)], & \text{caso continuo.}\\ \sum_{x_{j} \leq u} x_{j}^{k} p\left(x_{j}\right)+u^{k}[1-F(u)], & \text{caso discreto.} \\ \end{cases} \end{equation*}\]
1.2.1 Ejercicios
Suponga que se tiene una variable aleatoria Pareto con \(\alpha=3\) y \(\theta =10\) y una Gamma \(\alpha=1/3\) y \(\theta - 15\). Ambas tienen media igual a 5 y varianza igual a 75.
Grafique las funciones de densidad, la tasa de riesgo y la media de exceso de pérdida para ambos casos. Explique como estos resultados son coherentes con la teoría.
Ayuda: Primero verifique que la gamma y la pareto están igualmente parametrizadas en el libro y en las funciones de R.
\[\begin{align*} f_{gamma} (x) & = \frac{(x/\theta)^\alpha e^{-x/\theta}}{x\Gamma(\alpha)} \\ f_{pareto} (x) & = \frac{\alpha \theta^\alpha}{x^{\alpha + 1}},\ x>\theta \end{align*}\]
1.3 Comparación de las colas de una distribución
En clase estudiamos el caso de las distribuciones gamma y pareto. Concluimos que la gamma tiene “colas ligeras”, mientras la pareto tiene “cola pesadas”. Se usaron la comparación por momentos, por comparación asintótica entre otras.
1.3.1 Clasificación basada en momentos
La regla general es
- Si todos los momentos positivos existen, indican una (relativa) cola ligera derecha.
- Si solo existen momentos positivos hasta cierto valor (o no existen del todo) indican una cola pesada derecha.
Para la distribución gamma se tiene
\[\begin{equation*} \begin{aligned} \mu_{k}^{\prime} &=\int_{0}^{\infty} x^{k} \frac{x^{\alpha-1} e^{-x / \theta}}{\Gamma(\alpha) \theta^{\alpha}} d x \\ &=\int_{0}^{\infty}(y \theta)^{k} \frac{(y \theta)^{\alpha-1} e^{-y}}{\Gamma(\alpha) \theta^{\alpha}} \theta d y, \text { making the substitution } y=x / \theta \\ &=\frac{\theta^{k}}{\Gamma(\alpha)} \Gamma(\alpha+k)<\infty \text { for all } k>0 . \end{aligned} \end{equation*}\]
Mientras que para la pareto se tiene que,
\[\begin{equation*} \begin{aligned} \mu_{k}^{\prime} &=\int_{0}^{\infty} x^{k} \frac{\alpha \theta^{\alpha}}{(x+\theta)^{\alpha+1}} d x \\ &=\int_{\theta}^{\infty}(y-\theta)^{k} \frac{\alpha \theta^{\alpha}}{y^{\alpha+1}} d y, \text { cambio de variable } y=x+\theta \\ &=\alpha \theta^{\alpha} \int_{\theta}^{\infty} \sum_{j=0}^{k}\binom{k}{j}y^{j-\alpha-1}(-\theta)^{k-j} d y \text { para valores enteros de } k . \end{aligned} \end{equation*}\]
Algo no tan evidente, es que esta integral solo existe si \(j-\alpha-1<-1\) para todo \(j\) o equivalente si \(k<\alpha\). Es decir, solo algunos momentos existen.
Por lo tanto la Pareto tiene colas pesadas y la gamma colas ligeras.
1.3.2 Clasificación por la comparación en el límite
Usando la regla de L’Hôpital, se puede comparar dos distribución \[\begin{equation*} \lim _{x \rightarrow \infty} \frac{S_{1}(x)}{S_{2}(x)}=\lim _{x \rightarrow \infty} \frac{S_{1}^{\prime}(x)}{S_{2}^{\prime}(x)}=\lim _{x \rightarrow \infty} \frac{-f_{1}(x)}{-f_{2}(x)}=\lim _{x \rightarrow \infty} \frac{f_{1}(x)}{f_{2}(x)} \end{equation*}\]
\[\begin{equation*} \begin{aligned} \lim _{x \rightarrow \infty} \frac{f_{\text {Pareto }}(x)}{f_{\text {gamma }}(x)} &=\lim _{x \rightarrow \infty} \frac{\alpha \theta^{\alpha}(x+\theta)^{-\alpha-1}}{x^{\tau-1} e^{-x / \lambda} \lambda^{-\tau} \Gamma(\tau)^{-1}} \\ &=c \lim _{x \rightarrow \infty} \frac{e^{x / \lambda}}{(x+\theta)^{\alpha+1} x^{\tau-1}} \\ &>c \lim _{x \rightarrow \infty} \frac{e^{x / \lambda}}{(x+\theta)^{\alpha+\tau}} = \infty \end{aligned} \end{equation*}\]
Por lo tanto la Pareto “gana” contra la Gamma. El lado derecho de la distribución de Pareto es más ancha que la Gamma.
1.3.3 Clasificación basado en la función de riesgo
La regla general con respecto a la tasa de riesgo:
- Si es decreciente, entonces hay cola pesadas.
- Si es creciente, entonces hay colas ligeras.
Para la pareto se tiene que \[\begin{equation*} h(x)=\frac{f(x)}{S(x)}=\frac{\alpha \theta^{\alpha}(x+\theta)^{-\alpha-1}}{\theta^{\alpha}(x+\theta)^{-\alpha}}=\frac{\alpha}{x+\theta} \end{equation*}\]
La distribución gamma es algo complicada, pero se puede probar que
- Si \(\alpha>1\) tiene colas ligeras.
- Si \(\alpha<1\) tiene colas pesadas.
- Si \(\alpha=1\) la distribución tiene tasa constante de riesgo.
1.3.4 Ejercicios
¿Qué cola es más pesada: la de una Weibull \(\theta=10\) y \(\tau = 2\) o una Pareto? Nuevamente use todos los criterios para determinar una respuesta.
\[ f_{weibull} = \frac{\tau(x/\theta)^\tau e^{-(x/\theta)^\tau}}{x}\\ \]
1.4 Medidas de riesgo
Una medida de riesgo \(\rho(X)\), se define como el monto de activos requeridos para protegerse contra escenarios adversos del riesgo inherente de \(X\). En otras palabras, cuánto dinero debe tener guardada la institución, en el peor de los escenarios de pérdida.
Una medida de riesgo coherente es una medida de riesgo \(\rho(X)\) que tiene las siguientes cuatro propiedades para cualesquiera dos variables aleatorias de pérdida \(X\) y \(Y\): 1. Subaditividad : \(\rho(X+Y) \leq \rho(X)+\rho(Y)\). 2. Monotonicidad: Si \(X \leq Y\) para todos los resultados posibles, entonces \(\rho(X) \leq \rho(Y)\). 3. Homogeneidad positiva: Para cualquier constante positiva \(c, \rho(c X)=c \rho(X)\). 4. Invariancia de traslación: Para cualquier constante positiva c, \(\rho(X+c)=\rho(X)+c\).
- Subaditividad es sobre diversificación.
- Monotonicidad se refiere a la selección de instrumentos o actividades riesgosas.
- Homogeneidad es sobre equivalencia entre monedas.
- Invariancia es sobre gastos fijos de operación.
1.5 VaR
Sea \(X\) una variable aleatoria de pérdida. El valor en riesgo de \(X\) en el nivel de \(100 p \%\), indicado como \(\operatorname{VaR}_{p}(X)\) o \(\pi_{p}\), es el percentil 100 (o cuantil) de la distribución de \(X\). Para distribuciones continuas, podemos simplemente escribir \(\operatorname{VaR}_{p}(X)\) para la variable aleatoria \(X\) como el valor de \(\pi_{p}\) que satisface\[\begin{equation*} \operatorname{Pr}\left(X>\pi_{p}\right)=1-p \end{equation*}\]
En general, el VaR no es una medida coherente de riesgo ya que no cumple el criterio de subadtividad.
Cuál sería el VaR de una distribución normal \(X\sim\mathcal{N}(\mu, \sigma^2)\).
Usando este resultado calcule el VaR \(Y \sim \mathrm{Lognormal}(\mu,\sigma)\)
Compare ambos resultados mediante un gráfico.
1.6 CVaR o TVaR
Sea \(X\) una variable aleatoria de pérdida. El valor final en riesgo de \(X\) en el nivel de seguridad \(100 p \%\), denotado \(\mathrm{TVaR}_{p}(X)\), es la pérdida esperada dada que la pérdida excede el percentil (o cuantil) 100p de la distribución de \(X\).
Se puede reescribir el \(\operatorname{TVaR}_{p}\) como
\[\begin{equation*} \operatorname{TVaR}_{p}(X)=\mathrm{E}\left(X \mid X>\pi_{p}\right)=\frac{\int_{\pi_{p}}^{\infty} x f(x) d x}{1-F\left(\pi_{p}\right)} \end{equation*}\]
Otra forma de rescribirlo es \[\begin{equation*} \operatorname{TVaR}_{p}(X)=\frac{\int_{p}^{1} \operatorname{VaR}_{u}(X) d u}{1-p} . \end{equation*}\]
Por lo tanto, se puede ver que TVaR promedia todos los valores de VaR por encima del nivel de seguridad \(p\). Esto significa que TVaR nos dice mucho más sobre la cola de la distribución que el VaR solo. Finalmente, TVaR también se puede escribir como
\[\begin{equation*} \begin{aligned} \operatorname{TVaR}_{p}(X) &=\mathrm{E}\left(X \mid X>\pi_{p}\right) \\ &=\pi_{p}+\frac{\int_{x_{p}}^{\infty}\left(x-\pi_{p}\right) f(x) d x}{1-p} \\ &=\operatorname{VaR}_{p}(X)+e\left(\pi_{p}\right) \end{aligned} \end{equation*}\]
donde \(e(\pi_{p})\) es el la función media del exceso de pérdida evaluado en el percentil \(p\).
1.6.1 Ejercicios
Considere 2 variables aleatorias \(X\sim\mathrm{Unif}(0,100)\) y \(Y\sim\mathrm{Exp}(31.71)\).
Calcule el VaR a un nivel del \(95\%\). Dibuje ambas distribuciones para entender el resultado.
Estime el CVaR para determinar cual distribución es más riesgosa.
Considere \(X\) y \(Y\) dos variables aleatorias,
Compruebe que la \(\mathbb{E}[X]\) es una medida coherente de riesgo,
Compruebe que la \(\mathrm{sd}(X)\) falla en la condición de invarianza sobre traslaciones para ser una medida coherente.
Ahora considere las medidas de riesgo para un \(\alpha>0\) \[\begin{align*} \rho_{sd} (x) & = \mathbb{E}[X] + \alpha\ \mathrm{sd}(X) \end{align*}\] ¿Es \(\rho_{sd}\) una medida coherente? ¿Por qué?