import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import linear_model
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.feature_selection import f_regression


              
                X=[[1],[2],[3],[4],[5],[6],[7],[8],[9]]
y=[1,2,3,4,5,6,7,8,9]


              
                plt.scatter(X,y)
plt.show()


              
                model = linear_model.LinearRegression(fit_intercept = False)
model.fit(X,y)

LinearRegression(fit_intercept=False)


              
                model.coef_

array([1.])


              
                X_pred=[[10],[11],[12],[13],[14]]
model.predict(X_pred)

array([10., 11., 12., 13., 14.])


              
                plt.scatter(X,y)
plt.scatter(X_pred,model.predict(X_pred))
plt.show()


              
                # 1. Conjunto de datos
X=[[11],[12],[13],[14],[15],[16],[17],[18],[19]]
y=[1,2,3,4,5,6,7,8,9]
# 2. Definir y ajustar el modelo
model=linear_model.LinearRegression(fit_intercept=False)
model.fit(X,y)
print("Coeficiente: ",model.coef_, "\n")
# 3. Obtener predicciones
X_pred=np.arange(1,25).reshape(-1,1)
y_pred=model.predict(X_pred)
# 4. Visualización (valores del conjunto de datos vs predicciones)
plt.scatter(X,y)
plt.scatter(X_pred,y_pred)
plt.show()

Coeficiente:  [0.35251799]


              
                # Se define y se ajusta el modelo
model=linear_model.LinearRegression()
model.fit(X,y)
print("\nIntersección: ",model.intercept_)
print("\nCoeficiente: ", model.coef_, "\n")
# Obtener predicicones
X_pred=np.arange(1,25).reshape(-1,1)
y_pred=model.predict(X_pred)
# Visualización
plt.scatter(X_pred,y_pred, color='orange')
plt.scatter(X,y)
plt.show()

Intersección:  -10.000000000000004
Coeficiente:  [1.]


              
                # Conjunto de datos
X=[[1],[2],[3],[4],[5],[6],[7],[8],[9]]
y=[1,2,3,4,5,6,7,8,9]
# Crea y ajusta el modelo de regresión lineal
model = linear_model.LinearRegression(fit_intercept=False)
model.fit(X,y)
# Predicciones del modelo
X_pred = [[10],[11],[12],[13],[14]]
y_true = X_pred
y_pred = model.predict(X_pred)
# Cálculo del Error Cuadrático Medio (MSE)
print('Error: %.2f' % mean_squared_error(X_pred, y_pred))
# Coeficioente de determinación: 1 será una predicción perfecta
print('Coeficiente: %.2f' % r2_score(y_true, y_pred))

Error: 0.00
Coeficiente: 1.00


              
                # Predicciones 1
y_true = [1, 2, 3]
y_pred = [1, 2, 3]
print('Coeficiente de determinación: %.2f' % r2_score(y_true, y_pred))
# Predicciones 2
y_true = [1, 2, 3]
y_pred = [1.1, 2.1, 3.1]
print('Coeficiente de determinación: %.2f' % r2_score(y_true, y_pred))
# Predicciones 3
y_true = [1, 2, 3]
y_pred = [3, 2, 1]
print('Coeficiente de determinación: %.2f' % r2_score(y_true, y_pred))

Coeficiente de determinación: 1.00
Coeficiente de determinación: 0.98
Coeficiente de determinación: -3.00


              
                # Crea el conjunto de datos
df = pd.DataFrame(np.arange(0, 10))
# Se cargan los datos ficticios aleatórios
df['ventas'] = [100, 120, 115, 150, 175, 180, 200, 230, 230, 250]
df['temperatura'] = [20, 22, 21, 26, 28, 30, 32, 34, 36, 38]
df['prob_lluvia'] = [0.85, 0.6, 0.8, 0.6, 0.55, 0.53, 0.4, 0.35, 0.5, 0.18]
df['precio_accion'] = [39.8, 39.8, 41.8, 46.8, 39.11, 37.86, 35.7, 35.9, 39.1, 42]
# Visualiza el conjunto de datos
df.head()


              
                # Gráficos de dispersión de las variables, temperatura,
# probabilidad de lluvia, y precio de la acción según
# las ventas
fig, ax = plt.subplots(3, figsize=(16,8))
ax = plt.subplot(221)
ax.scatter(df['ventas'], df['temperatura'])
ax = plt.subplot(222)
ax.scatter(df['ventas'], df['prob_lluvia'])
ax = plt.subplot(223)
ax.scatter(df['ventas'], df['precio_accion'])
plt.show()


              
                F, pval = f_regression(df[['precio_accion','prob_lluvia','temperatura']], df['ventas'])
print('precio_accion: %.8f' % pval[0],'\nprob_lluvia: %.8f' % pval[1], '\ntemperatura: %.8f' % pval[2])

precio_accion: 0.36620290 
prob_lluvia: 0.00020982 
temperatura: 0.00000000


              
                # Ajusta el modelo, se obtiene la intercepción y el coeficiente
model.fit(df[['prob_lluvia', 'temperatura',]], df['ventas'])
print('Intercepción: ', model.intercept_)
print('Coeficiente: ', model.coef_)
# Se muestra la ecuación del modelo de regresión lineal
print('\nVentas = %.2f' % model.intercept_, '+ (%.2f' % model.coef_[0], '* Probabilidad de Lluvia) + (%.2f' % model.coef_[1], ' * Temperatura)')
# Obtiene predicciones
y_pred = model.predict(df[['prob_lluvia','temperatura']])
# Calcula el Error Cuadrático Medio (MSE)
print('\nError (MSE): %.2f' % mean_squared_error(df['ventas'],y_pred))
# Calcula el Coeficiente de Determinación
print('Coeficiente de Determinación: %.2f' % r2_score(df['ventas'],y_pred))
# Representación gráfica del modelo de regresión lineal
plt.plot(df.index, y_pred, color='orange')
plt.scatter(df.index, df['ventas'])
plt.legend(['Predicicones', 'Ventas reales'])
plt.show()

Intercepción:  0.0
Coeficiente:  [-43.55818331   6.91493153]

Ventas = 0.00 + (-43.56 * Probabilidad de Lluvia) + (6.91  * Temperatura)

Error (MSE): 26.99
Coeficiente de Determinación: 0.99


              
                print('Predicción: %.0f' % model.predict([[0.1, 27]]))

Predicción: 182

Regresión Lineal con Scikit-learn.

Análisis del modelo de regresión lineal.¶

	0	ventas	temperatura	prob_lluvia	precio_accion
0	0	100	20	0.85	39.80
1	1	120	22	0.60	39.80
2	2	115	21	0.80	41.80
3	3	150	26	0.60	46.80
4	4	175	28	0.55	39.11