Stap 1: Extractie uit verschillende bronnen
Volgende stappen betrokken zijn bij het hele proces:
1. extractie uit verschillende bronnen
a. de XML - voor het extraheren van gegevens uit XML-bestanden SAX parsers kunnen worden gebruikt, dat is een gebeurtenis gebaseerd sequentiële toegang parser API. SAX parsers werken op elk stuk van het XML-document opeenvolgend. We halen de elementen van het XML-bestand op basis van de metadata verstrekt samen met het bronbestand.
b. de werkblad - voor het extraheren van gegevens uit het werkblad we Apache POI API's kunt gebruiken. POI ondersteunt zowel xls en xlsx formaten. Het biedt ondersteuning voor het werken met Microsoft Excel-documenten en het vermag steel zowel XLS en XLSX-formaten van spreadsheets.
c. platte bestanden – voor het extraheren van gegevens uit platte bestanden, we lezen het bestand achtereenvolgens met behulp van stream lezer op basis van de metadata langs voorzien.