ETL Tool (1 / 3 steg)
Steg 1: Extraktion från olika källor
Följande steg är involverade i hela processen:
1. utdrag från olika källor
a. XML - för att extrahera data från XML-filer SAX protokolltolkare kan användas, vilket är en händelse baserade sekventiell åtkomst parser API. SAX protokolltolkare fungerar på varje bit av XML-dokumentet sekventiellt. Vi extrahera element från XML-filen baseras på metadata som tillsammans med källfilen.
b. kalkylblad - för att extrahera data från kalkylbladet kan vi använda Apache POI API: er. POI stöder både xls och xlsx format. Det ger stöd för att arbeta med Microsoft Excel-dokument och kan hantera både XLS och XLSX format av kalkylark.
c. flata filer – för att extrahera data från textfiler, vi läser filen sekventiellt med stream läsaren baserat på metadata som tillhandahålls tillsammans med.