Scikit-learn's LabelBinarizer vs. OneHotEncoder

Question

1 Answer

Anurag · Answer 1 · 2019-07-02T10:53:13+0000

Label Binarizer:

It assigns a unique value or number to each label in a categorical feature.

For example:

>>> from sklearn import preprocessing
>>> lb = preprocessing.LabelBinarizer()
>>> lb.fit([1, 2, 6, 4, 2])
LabelBinarizer(neg_label=0, pos_label=1, sparse_output=False)
>>> lb.classes_
array([1, 2, 4, 6])
>>> lb.transform([1, 6])
array([[1, 0, 0, 0],
[0, 0, 0, 1]])

One Hot Encoding:

It encodes categorical integer features as a one-hot numeric array. It makes model training easier and faster.

For example:

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(handle_unknown='ignore')
X = [['Male', 1], ['Female', 3], ['Female', 2]]
enc.fit(X)

Hope this answer helps.

If you want to be build successful data science career then enroll for best data science certification.

Scikit-learn's LabelBinarizer vs. OneHotEncoder

1 Answer

Related questions

Browse Categories

Browse By Domains

Popular Courses

Popular Tutorials

Popular Resources