MODELLING DATA
#Recall data kita
df>head()
Langkah-langkahnya.....
#Pertama, buat variabel x dan y
x= df.drop(columns='price')
y= df['price']
#Kedua, kita split data kita menjadi training and testing dengan porsi 80:20
x_train, x_test, y_train, y_test = train_test_split(x,y, test_size=0.2, random_state=4)
#Cek shape dari data training dan testing
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)
#ketiga, kita bikin object linear regresi
lin_reg = LinearRegression()
#keempat, train the model menggunakan training data yang sudah displit
lin_reg.fit(x_train, y_train)
#kelima, cari tau nilai slope/koefisien (m) dan intercept (b)
print(lin_reg.coef_)
print(lin_reg.intercept__)
#kita oba buat kedalam dataframe agar lebih rapi
coef_dict = {
'features': x.columns,
'coef_value':lin_reg.coef_
}
coef = pd.DataFrame(coef_dict, columns=['features','coef_value'])
coef
y_pred = lin_reg.predict(x_test)
#keenam, kita cari tahu accuracy score dari model kita menggunakan testeing data yang sudah displit
lin_reg.score(x_test, y_test)
#prediksi harga rumah idaman
lin_reg.predict([[3,2,1800,7,1990]])
bagus. tapi ini bagian dari multiple regression kah?
BalasHapusOle Aldu, Tks...Semoga bermanfaat untuk yg lain jga
BalasHapus