To je tehnika rudarenja podataka koja pretvara sirove podatke u razumljiv format. Sirovi podaci (podaci iz stvarnog svijeta) uvijek su nepotpuni i ti se podaci ne mogu poslati kroz model. To bi izazvalo određene greške. Zato moramo unaprijed obraditi podatke prije slanja kroz model
Zašto trebamo unaprijed obraditi podatke?
To je tehnika rudarenja podataka koja pretvara neobrađene podatke u razumljiv format Sirovi podaci (podaci iz stvarnog svijeta) uvijek su nepotpuni i ti se podaci ne mogu poslati kroz model. To bi izazvalo određene greške. Zato moramo unaprijed obraditi podatke prije slanja kroz model.
Trebam li unaprijed obraditi testne podatke?
Osnovna suština ovoga je: Ne biste trebali koristiti metodu predobrade koja je ugrađena na cijeli skup podataka, za transformaciju podataka testa ili treniranja. Ako to učinite, nehotice prenosite informacije iz garniture vlaka u ispitni set.
Što je problem s curenjem podataka?
curenje podataka je neovlašteni prijenos podataka unutar organizacije do vanjskog odredišta ili primatelja… Curenje podataka, također poznato kao mala i spora krađa podataka, veliki je problem za sigurnost podataka, a šteta nanesena bilo kojoj organizaciji, bez obzira na veličinu ili industriju, može biti ozbiljna.
Kako transformirati testne podatke?
transform će transformirati sve značajke oduzimanjem srednje vrijednosti i dijeljenjem s varijansom. Radi praktičnosti, ova dva poziva funkcije mogu se obaviti u jednom koraku pomoću fit_transform.