复制
收藏
提问
简洁
import numpy as np import pandas as pd df = pd.read_csv('./wine3.csv') data = df.dropna(axis=1,thresh=df.shape[0]*0.8,inplace=False) data['type'].replace(np.nan,data['type'].mode()[0]) diabetes_X, diabetes_y = datasets.load_diabetes(return_X_y=True) diabetes_X = diabetes_X[:, np.newaxis, 2] diabetes_X_train = diabetes_X[:-20] diabetes_X_test = diabetes_X[-20:] diabetes_y_train = diabetes_y[:-20] diabetes_y_test = diabetes_y[-20:] regr = linear_model.LinearRegression() regr.fit(diabetes_X_train, diabetes_y_train) diabetes_y_pred = regr.predict(diabetes_X_test) print("Coefficients: \n", regr.coef_) print("Mean squared error: %.2f" % mean_squared_error(diabetes_y_test, diabetes_y_pred)) plt.scatter(diabetes_X_test, diabetes_y_test, color="black") plt.plot(diabetes_X_test, diabetes_y_pred, color="blue", linewidth=3) plt.xticks(()) plt.yticks(()) 1.plt.show()
2个月前
全网
文档
学术
百科
知识库
回答简洁模式
深入研究一些
- 1. 导入库和数据:首先,代码中导入了
numpy
和pandas
库,并使用pandas
读取CSV文件创建了DataFramedf
13。 - 2. 数据清洗:使用
dropna
方法删除了包含超过20%空值的列,并且用众数填充了'type'列的空值3。 - 3. 数据集划分:加载了糖尿病数据集,并进行了训练集和测试集的划分3。
- 4. 线性回归模型:创建了线性回归模型,使用训练集拟合模型,并用测试集进行预测3。
- 5. 结果评估:打印了回归系数和均方误差,并通过图表展示了测试集的真实值和预测值3。
- 6. 显示图表:最后使用
plt.show()
显示了图表3。
请注意,代码中mean_squared_error
函数没有导入,这将导致运行时出现错误。正确的做法是在使用之前导入该函数,例如从sklearn.metrics
导入。同时,plt
也没有导入,需要导入matplotlib.pyplot
作为plt
。3
你觉得结果怎么样?