OneHotEncoder
One-hot кодирование категориальных признаков.
Сигнатура
OneHotEncoder(sparse_output=True, handle_unknown='error')Превращает каждый категориальный признак в набор бинарных столбцов. Параметр handle_unknown='ignore' защищает от незнакомых категорий на тесте, а sparse_output=False возвращает обычный массив.
from sklearn.preprocessing import OneHotEncoder
import numpy as np
enc = OneHotEncoder(sparse_output=False, handle_unknown='ignore')
X = np.array([['red'], ['green'], ['blue']])
print(enc.fit_transform(X))