Pentaho Data Integration (PDI) atau disebut juga dengan Kettle merupakan salah satu open source tools yang dibuat oleh Pentaho yang digunakan untuk melakukan integrasi data. Solusi utama yang disediakan oleh Kettle yaitu Extract Transform Load (ETL). Data yang diproses dapat diambil dari beragam format dan sumber data. Pentaho menyediakan dua jenis software untuk digunakan yaitu Enterprise Edition dan Community Project. Pembahasan pada modul training ini difokuskan pada penggunaan Pentaho Community Project pada sistem operasi Windows.
Materi training ini membahas konsep dan teknik penggunaan PDI yang berhubungan dengan proses ETL, sehingga diharapkan setelah mengikuti training para peserta akan memiliki pengetahuan untuk membangun solusi ETL dalam mengintegrasikan data dengan PDI sesuai dengan kebutuhan di lapangan.
Materi training disusun dari berbagai sumber dan media pembelajaran. Training akan disampaikan dalam bentuk pengenalan konsep, teori, dan praktek dalam porsi yang setimbang, serta dipandu oleh trainer atau instruktur yang telah berpengalaman di bidangnya.
Outline Materi
- Introduction to PDI
- Installing PDI
- Using Spoon Interface
- Kettle Variables
- Getting Data from Plain Files & Databases
- Combining sources into Dataset
- Design and Running Transformation
- Error Handling
- Sorting and Aggregating Data
- Filtering Rows
- Loading Data
- Insert and Update Data in Database
- Loading a Data Mart
- PDI Jobs
- Designing and Running Jobs
- Combining Jobs and Transformations