ETL Tool
Ett datalager är en arkitektonisk konstruktion av ett informationssystem som ger användare med nuvarande och historiska beslutsstödsinformation som är svårt att tillgång eller finns i traditionella operativa system.
Företag under årens lopp har samlat stora mängder data. Datalager sätter dessa data att använda, genom att analysera trender i data, som kan användas konkurrensfördel.
ETL system är grunden för alla system, DW
Ett system för ETL extraherar data från källsystem framtvingar uppgifternas kvalitet & konsekvens, överensstämmer data så att separata källa system kan användas tillsammans, levererar data i ett redo presentationsformat som kan användas av slutanvändare
Den förbrukar nästan 70-80% av resurser som krävs för genomförande och upprätthållande av en DW
Uppdrag av ETL system: Hämta data ur källsystem & läsa in den i DW
Utdrag: Extrahera relevanta uppgifter
Omforma: Omvandla data till DW format, bygga nycklar, rengöring av data
Belastning: Läsa in data i DW, bygga aggregat, etc.
BESKRIVNING/KONTROLLER:
En java-baserad ETL verktyg för hämtning av data från olika källor (XML, kalkylblad, textfiler, RDBMS), tillämpa flera transformationer (som deduplication, saknade värden, standardisering av datum, versaler, gemener) på källdata och påfyllning av strukturerade data i star schema görs.
Exempel: för ett universitet registreringssystem, kan källfilen innehåller detaljerad information om studenter, kurser, fakultet, campus, läsår och termin.