from scipy.stats import bernoulli # Dist. Bernoulli
from scipy.stats import binom # Dist. Binomial
from scipy.stats import multinomial # Dist. Multinomial
from scipy.stats import norm # Dist. Normal
from scipy.stats import poisson # dist. Poisson
from scipy.stats import expon # Dist. Exponencial
from scipy.stats import beta # Dist. Beta
from scipy.stats import gamma # Dist. Gamma
from scipy.stats import chi2 # Dist Chi2
from scipy.stats import t # Dist. T de Student
from scipy import stats
import numpy as np
import matplotlib.pyplot as plt


                              
                                   # Parámetro de probabilidad especificado
p = 0.5
x = [i for i in range(0,10)]
# Muestra según la distribución de Bernoulli
y = bernoulli.rvs(p, size=10)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
p = 0.5
n = 10
x = [i for i in range(0,n)]
# Muestra según distribución Binomial
y = binom.rvs(n, p, size=10)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
p = [0.3,0.2,0.5]
n = 10
x = [i for i in range(0,n)]
# Muestra según distribución Multinomial
y = multinomial.rvs(n, p, size=10)
plt.plot(x,y, "ob")
plt.show()


                              
                                   x1 = np.arange(-20, 20, 0.1)
y1 = norm.pdf(x1, 0, 5)
y2 = norm.pdf(x1, 0, 3)
y3 = norm.pdf(x1, 5, 3)
plt.plot(x1, y2) 
plt.plot(x1, y1)
plt.plot(x1, y3) 
plt.legend(["Desviación estándar 3",
            "Desviación estándar 5",
            "valor medio de 5"],
           loc = 'upper left')
plt.show()


                              
                                   # Parámetro de probabilidad especificado
mu = 2
n = 100
x = [i for i in range(0,n)]
# Muestra según distribución de Poisson
y = poisson.rvs(mu, size=n)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
mu = 2
n = 100
x = [i for i in range(0,n)]
# Muestra según distribución Exponencial
y = expon.rvs(scale=2, size=n)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
a = 2
b = 3
n = 100
x = [i for i in range(0,n)]
# Muestra según distribución Beta
y = beta.rvs(a, b, size=n)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
a = 2
b = 3
n = 100
x = [i for i in range(0,n)]
# Muestra según distribución Gamma
y = gamma.rvs(a, b, size=n)
plt.plot(x,y, "ob")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
df1 = 10
df2 = 20
df3 = 30
df4 = 40
df5 = 50
# calcular el rango que queremos mostrar
x = np.linspace(0,
                30,
                500)
# Muestra según distribución chi2
rv1 = chi2(df1)
rv2 = chi2(df2)
rv3 = chi2(df3)
rv4 = chi2(df4)
rv5 = chi2(df5)
plt.plot(x, rv1.pdf(x), 'r', label='df = 10')
plt.plot(x, rv2.pdf(x), 'g',label='df = 20')
plt.plot(x, rv3.pdf(x), 'b', label='df = 30')
plt.plot(x, rv4.pdf(x), 'black',label='df = 40')
plt.plot(x, rv5.pdf(x), 'yellow',label='df = 50')
plt.legend(loc="upper left")
plt.show()


                              
                                   # Parámetro de probabilidad especificado
df1 = 1
df2 = 2
df3 = 3
df4 = 4
# calcular el rango que queremos mostrar
x = np.linspace(-10,
                10,
                200)
# Muestra según distribución t
rv1 = t(df1)
rv2 = t(df2)
rv3 = t(df3)
rv4 = t(df4)
plt.plot(x, rv1.pdf(x), 'r', label='df = 10')
plt.plot(x, rv2.pdf(x), 'g',label='df = 20')
plt.plot(x, rv3.pdf(x), 'b', label='df = 30')
plt.plot(x, rv4.pdf(x), 'black',label='df = 40')
plt.plot(x, norm.pdf(x), 'yellow', label='Gaussian')
plt.legend(loc="upper left")
plt.show()


                              
                                   seed = np.random.default_rng()
# Verdad básica: muestreo de la misma distribución
rvs1 = stats.norm.rvs(loc = 5,
                      scale =10,
                      size = 500,
                      random_state = seed
                     )
rvs2 = stats.norm.rvs(loc = 5,
                      scale = 10,
                      size = 500,
                      random_state = seed
                     )
print(stats.ttest_ind(rvs1, rvs2))
# Ejemplo de respuesta, varía mucho No se puede decir
# nada definitivo del resultado dado el valor p
# Ttest_indResult(statistic=-0.7362272777889193,
# pvalue=0.46176540317360304)
rvs3 = stats.norm.rvs(loc = 0,
                      scale = 10,
                      size = 500,
                      random_state = seed
                     )
print(stats.ttest_ind(rvs1, rvs3))

# Respuesta de muestra, varía mucho Podemos decir con
# mucha confianza que dos datos no son de la misma
# distribución
# Ttest_indResult(statistic = 8.065543453125999,
# pvalue = 2.078369795336982e-15)

Ttest_indResult(statistic=0.15019938905647343, pvalue=0.8806376574425193)
Ttest_indResult(statistic=7.761945071408706, pvalue=2.0640142442347023e-14)

Distribuciones de Probabilidad

1. Distribución de Bernoulli:

2. Distribución Binomial

3. Distribución multinomial

4. Distribución Gaussiana

5. Distribución de Poisson:

6. Distribución exponencial

7. Distribución beta

9. Distribución chi-cuadrado:

10. Distribución t de Student