mandag den 29. april 2013

Testing the Data Warehouse - STAReast - Tutorial - Geoff Horne

Så kom turen til mandagens anden halvdags tutorial - her var mit valg blevet 'test af datawarehouse', som jeg tidligere har arbejdet en del med - primært i den finansielle sektor. Jeg har fået nogle kommentarer via sms om min 'langsommelighed' med at opdatere min blog - husk venligst de 6 timers forskel i tiden - nu er kl. 16.55 her, og 22.55 hjemme i Danmark - så min dag/aften har fortsat mange timer - som jeg vil nyde her i selskab med mange interessante testkollegaer fra det meste af verdenen - dog var jeg den eneste ikke amerikaner til denne tutorial.

Geoff Horne startede sin tutorial med udgangspunkt i et af de hotte buzz-word i øjeblikket - BIG DATA. Det refererer det de gigantiske mængder af data - ofte på ustruktureret form - vi i dag har i forskellige systemer. Af disse ofte er i ustruktureret form giver selvfølgelig mening når man tænker på de mange forskellige kildesystemer og -former, herunder sociale medier, blogs m.m. En måde at få struktur på dem er 'selvfølgelig' via et datawarehouse.

Hvis du har behov for at blive opdateret med hensyn til BIG DATA - så har Sogeti's VINT-center udarbejdet en række skrifter om disse - tjek nedenstående link til et af disse skrifter:

BIG DATA

Det var gennemgående i tutorialen at test i datawarehouse er vigtigt - bl.a. med udgangspunkt i den ofte meget svingende kvalitet i kildedata, opsætning af ETL-regler og 'rensning' af data. Et af hans budskaber var da også en løbende måling af datakvaliteten i kildesystemerne, herunder udbedring af disse' klart skulle overvejes af alle FØR etablering af et datawarehouse.

Det er umiddelbart spændende at se på, hvilke færdigheder det kræver af testere i forhold til datawarehouse-test - altså udover de sædvanlige:

- kendskab til datawarehouse konceptet
- viden om både de tekniske emner og den forretningsmæssige brug
- kendskab til SQL, stored procedures, SQL-test
- kendskab til datamodellering, datamapping, ETL-tools, DBA-viden - nogle af disse til brug for review
- excel - specielt datanalyse-delen
- kendskab til sammenhæng mellem data og forretningsprocesser.

Test af datawarehouse er jo en meget 'data-nær-test' (mit eget begreb - ved ikke om det findes - men nu gør det ihvertfald).

Jeg kunne ikke lade være med at spørge til hvilke testdesignteknikker der var mest anvendelig, når det kommer til test af datawarehouse. Min umiddelbare - ikke særligt beskedne - holdning er nok, at jeg nok kunne lære ham og de øvrige ca. 40 deltagere, lidt....måske mere end lidt. Udover ækvivalensklasser, grænseværditest og parvis test, kunne beslutningstabeltest også finde anvendelse ved f.eks. test af mapping-regler.

Ingen kommentarer:

Send en kommentar