2009. november 27., péntek

kezdő adattisztítás

Az excelben van egy hasznos funkció azoknak, akik olyan adathalmazzal dolgoznak, ami tele van ismétlődésekkel és ezeket manuális kell(ene) kiszűrni.

Lehetőség van ugyanis arra, hogy egy adathalmazban a - valamilyen értékek alapján - azonos sorokat kiszűrje az excel, ezáltal egy duplikációmentes táblázatot kapjunk. Ez a funkció az "Adatok" fülön található és a neve "Ismétlődések eltávolítása".

Nézzünk egy példát, adva van egy adatbázis nevekkel és plusz egy azonosítóval:


















Ha csak a név oszlopból távolítanám el a duplikációkat (csak ezt az oszlopot jelölöm ki), akkor nem a helyes eredményt kapjuk:

















Ha a helyes értékeket akarjuk kiszűrni, akkor érdemes a születési helyet is belevenni, mert ez lesz az egyedi azonosítója a személynek (név+szül.hely):


















Ez a jó megoldás! Gyors és hasznos eszköz, amikor több adathalmazt fésülünk össze és az ismétlődésektől meg akarunk szabadulni.

Nincsenek megjegyzések:

Megjegyzés küldése