Существует много типов линейной регрессии, в том числе простая линейная регрессия, множественная регрессия и полиномиальная линейная регрессия.

Полиномиальная регрессия похожа на множественную регрессию, но в то же время вместо разных переменных, таких как X1, X2,… .. Xn, у нас есть одна и та же переменная X1, но в разной степени. Итак, вместо X2 у нас есть X1², вместо X3 у нас есть x1² и так далее. Итак, в основном мы используем одну переменную, но мы используем разную мощность этой переменной.

Когда нам следует использовать полиномиальную регрессию?

Допустим, у нас есть наблюдение, подобное изображению ниже, тогда линия, которая соответствует этим данным, очевидно, представляет собой простую линейную регрессию. вы можете видеть, что данные действительно хорошо подходят.

Но представьте себе, если ваш набор данных такой. Поэтому, если вы попробуете использовать простую линейную регрессию, вы увидите, что несколько данных лежат под линией.

Так как же их исправить? Мы можем попытаться исправить это, используя полином, который в данном случае идеально подходит. и вы также можете увидеть формулу на изображении ниже. в простой регрессии мы добавляем b2x1², что дает нам параболический эффект.

Полиномиальная регрессия немного отличается от простой регрессии, но в то же время у нее есть разные варианты использования, которые возникают от случая к случаю. Вы должны применить простую регрессию, множественную регрессию и полиномиальную регрессию и посмотреть, что произойдет. В какой-то момент полиномиальная регрессия подходит лучше. Например, есть смысл описать, как распространяются болезни и как пандемии распространяются по территории, по всему миру.

Вопрос: почему он называется линейным по-прежнему?

Уловка здесь в том, что когда мы говорим о линейной регрессии, мы не говорим о переменной x. даже существует нелинейная связь между y и x. Когда мы говорим о классе регрессии, мы говорим о коэффициенте b. здесь be является линейным, то есть b, b1, b2,… bn.

Итак, здесь мы находим значение коэффициента, то есть b, а затем мы просто подключаем x и узнаем значение y. Вот почему линейная и нелинейная регрессия относится к коэффициенту. Полиномиальная регрессия также называется частным случаем множественной регрессии.

Теперь посмотрим, как применить полиномиальную регрессию с помощью Python.

Здесь мы берем набор данных радужной оболочки глаза.

import numpy as np
import pandas as pd
dataset = pd.read_csv('../input/iris/Iris.csv')
X = dataset.iloc[:, [1,2]].values
y = dataset.iloc[:, -1].values
dataset

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 1)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train= sc.fit_transform(X_train)
X_test = sc.transform(X_test)
from sklearn.svm import SVC
classifier = SVC(kernel = 'poly',random_state = 0)
classifier.fit(X_train, y_train)

Вывод: SVC (ядро = ’poly’, random_state = 0)

ypred = classifier.predict(X_test)
print ((ypred))

y_pred = classifier.predict(X_test)
print(np.concatenate((y_pred.reshape(len(y_pred),1), y_test.reshape(len(y_test),1)),1))

from sklearn.metrics import confusion_matrix, accuracy_score
cm = confusion_matrix(y_test, y_pred)
print(cm)
accuracy_score(y_test, y_pred)

Вывод:
[[11 0 0]
[0 1 12]
[0 0 6]]

Точность: 0,6

В статистике полиномиальная регрессия - это форма регрессионного анализа, в котором взаимосвязь между независимой переменной x и зависимой переменной y моделируется как полином n-й степени от x. Полиномиальная регрессия соответствует нелинейному соотношению между значением x и соответствующим условным средним y, обозначенным E (y | x), и использовалась для описания нелинейных явлений, таких как скорость роста тканей, [1] распределение углерода изотопов в отложениях озер [2] и прогрессировании эпидемий болезней. [3] Хотя полиномиальная регрессия подгоняет нелинейную модель к данным, как проблема статистической оценки она является линейной в том смысле, что функция регрессии E (y | x) линейна по неизвестным параметрам, которые оцениваются по данным. По этой причине полиномиальная регрессия считается частным случаем множественной линейной регрессии.

Первоначально опубликовано на https://www.numpyninja.com 21 сентября 2020 г.