Een datawarehouse is een architectonische constructie van een informatiesysteem waarmee gebruikers met actuele en historische besluit ondersteuningsinformatie die moeilijk toegankelijke of aanwezig zijn in traditionele operationele systemen.
Bedrijven door de jaren heen hebben grote hoeveelheden gegevens verzameld. Datawarehouse zet deze gegevens te gebruiken, door het analyseren van trends in deze gegevens, die kan worden gebruikt om het concurrentievoordeel opleveren.
ETL systeem is de basis van elk systeem DW
Een ETL-systeem haalt gegevens uit de bronsystemen afdwingt datakwaliteit & consistentie, gegevens voldoet dus die afzonderlijke bron systemen kunnen samen worden gebruikt, waarmee u gegevens in een presentatie klaar indeling die kan worden gebruikt door eindgebruikers
Het verbruikt bijna 70-80% van de middelen die nodig zijn voor het onderhoud van een DW & implementatie
Missie van ETL systeem: get data uit de bronsystemen & laden in de DW
Extract: Extract relevante gegevens
Transformeren: Transformatie naar DW gegevensindeling, bouwen de sleutels, Cleansing vangegevens
Belasting: Gegevens laden in DW, aggregaten, enz te bouwen.
BESCHRIJVING:
Een op java gebaseerde ETL tool voor de extractie van gegevens uit verschillende bronnen (XML, spreadsheets, platte bestanden, RDBMS), verschillende transformaties (zoals ontdubbeling, ontbrekende waarden, standaardisatie van datums, hoofdletters, kleine letters) toepassen op de brongegevens en laden van gestructureerde gegevens in ster-schema is gemaakt.
Voorbeeld: voor een registratiesysteem van de Universiteit, het bronbestand kan bevatten gedetailleerde informatie over studenten, cursussen, docenten, campus, academiejaar en semester.