Inhaltsverzeichnis:

Warum zuerst runterfallen und Dummies holen?
Warum zuerst runterfallen und Dummies holen?
Anonim

1 Antwort. drop_first=True ist wichtig zu verwenden, da es dabei hilft, die zusätzliche Sp alte zu reduzieren, die während der Erstellung von Dummy-Variablen erstellt wird. Daher reduziert es die zwischen Dummy-Variablen erzeugten Korrelationen.

Warum fallen wir zuerst, um Dummies zu bekommen?

Das Weglassen der ersten kategorialen Variablen ist möglich, denn wenn jede andere Dummy-Sp alte 0 ist, dann wäre Ihr erster Wert 1 gewesen. Was Sie an Redundanz entfernen, gewinnen Sie Verwirrung.

Was machen PD-Dummies?

get_dummies wird zur Datenmanipulation verwendet. Es wandelt kategoriale Daten in Dummy- oder Indikatorvariablen um.

Warum verwenden wir Get_dummies in Python?

Die Funktion get_dummies wird verwendet, um kategoriale Variablen in Dummy-/Indikatorvariablen umzuwandeln. Daten, um Dummy-Indikatoren zu erh alten. String zum Anhängen von DataFrame-Sp altennamen.

Was ist der Unterschied zwischen OneHotEncoder und Get_dummies?

OneHotEncoder ist eine Sklearn-Vorverarbeitungsfunktion. Im Gegensatz zu get_dummies fügt OHE keine Variablen zu Ihrem Datenrahmen hinzu Es erstellt Dummy-Variablen durch Transformation von X, und alle Dummys werden in X gespeichert. Und Sie können angeben, welche Sp alten Sie Dummys erstellen möchten wenn du X von OHE anpasst.

Pandas bekommen Dummies | pd.get_dummies

Beliebtes Thema