SSIS:n avulla tietojen siirrot onnistuvat helposti ja tehokkaasti

SSIS on Microsoftin tietojen integrointityökalu. Sen avulla saadaan kerättyä ja yhdistettyä dataa eri tietolähteistä esimerkiksi raportointia ja tietojen analysointia varten. Organisaatioiden siirtyessä hyödyntämään pilvipalveluita ja esimerkiksi Azure Data Factory työkalua on SSIS toistaiseksi säilyttänyt paikkansa integraatiovälineenä.  Tässä artikkelissa avaamme tarkemmin SSIS työkalun käyttöä ja tilanteita, joissa se edelleen on tehokas ratkaisu.

Mikä SSIS on?

SSIS (SQL Server Integration Services) on tietojen integrointityökalu ja osa Microsoft SQL Server BI (Business Intelligence) tietokantatuotteita.

SSIS on Microsoftin ETL työkalu. ETL tulee sanoista Extract, Transform ja Load, ja tarkoittaa datan siirtämistä, muokkaamista ja lataamista. Perusidea on, että tietolähteistä ladataan (Extract) aineistoa SSIS välineellä tehtyyn pakettiin, jossa tehdään mahdolliset tietomuunnot (Transform), kuten datan siivoamiset sekä yhdistämiset, jotta aineisto saadaan ladattua (Load) tarvittavassa muodossa lopulliseen kohteeseen. Tietolähde ja tietokohde ovat tyypillisesti tietokantoja, mutta ne voivat olla jotain muutakin, esimerkiksi Excel taulukko, CSV tiedosto tai vaikkapa Sharepoint -sivusto. SSIS väline tarjoaa joukon valmiita tieto adaptereita, joilla voidaan liittyä yleisimpiin tuotteisiin. Itse ETL prosessit tehdään graafista käyttöliittymää hyödyntäen, joka on integroitu Visual Studio -välineeseen. Tarvittaessa ETL prosesseja voidaan myös laajentaa C# tai Visual Basic koodilla.

Mihin sitä käytetään?

SSIS on työkalu,jolla tietoa ladataan paikasta toiseen. Se on tehokas työkalu ja soveltuu suurien tietomassojen käsittelyyn.  Lataukset voidaan tehdä kertaalleen,
uusinta-ajoina tai täydentävinä ajoina. SSIS:n avulla siis ladataan dataa
paikasta A paikkaan B eräajoina, mutta ei suoranaisesti integroida kahta
operatiivista järjestelmään keskustelemaan keskenään.

SSIS työkalua voidaan hyödyntää esimerkiksi tietovarastojen rakentamisessa raportointia ja analysointia varten. Sen avulla dataa saadaan kerättyä ja yhdistettyä eri tietolähteistä yhteen BI raportointiympäristöön.

Tyypillinen käyttötapaus on myös uuden järjestelmän käyttöönotto, jossa yhdestä tai
useammasta vanhasta järjestelmästä ladataan tietoa uuteen järjestelmään. Tyypillisesti työkalun avulla tiedot ladataan välivarastoon. Välivarastossa dataa voidaan tarvittaessa muokata siihen muotoon, missä se halutaan siirtää uuteen järjestelmään.

Lisäksi SSIS toteutuksia voidaan hyödyntää datan puhdistus- ja tarkistusajoissa sekä erilaisissa tietokantojen ylläpitotehtävissä. 

Mihin SSIS työkalua käytetään pilviaikana?

Organisaatioiden siirtyessä hyödyntämään pilvipalveluita ja esimerkiksi Azure DataFactory työkalua on SSIS edelleen säilyttänyt paikkansa integraatiovälineenä. SSIS integrointityökalua hyödynnetään tilanteissa, joissa järjestelmät ovat sijoitettuna OnPremise ympäristöön. Tällaisissa tilanteissa SSIS on toimiva ja usein kustannustehokas vaihtoehto. SSIS sisältyy SQL Serverin lisenssiin, joten datan siirto tietokantojen välillä toteutettua kustannustehokkaasti, ilman erillisiä työkaluhankintoja. Toisaalta SSIS työkaluun sisältyvät myös dapterit pilvipalveluihin ja se soveltuu hyvin datan siirtämiseen OnPremise ympäristöstä pilveen.

Mihin SSIS soveltuu parhaiten?

SSIS soveltuu parhaiten Microsoft -arkkitehtuuriin, mutta osaa keskustella myös muiden valmistajien järjestelmien kanssa. SSIS työkalu soveltuu hyvin tilanteeseen, jossa halutaan käsitellä isoja tietomääriä. 

Mitkä ovat tyypilliset haasteet SSIS toteutuksissa?

Tyypillisiä haasteita SSIS toteutuksissa ovat monimuotoisten lähdeaineistojen aiheuttamat ongelmatilanteet. Lähdeaineistot voivat olla peräisin vanhoista järjestelmistä ja järjestelmiä voi olla useita. Dokumentaatio voi olla vajavaista ja joudutaan tekemään ylimääräistä selvittelyä. Mikäli tietoa ladataan heterogeenisessä ympäristössä, eivät tietotyypit välttämättä ole yhtenäisiä ja yhdistämisessä voi olla haasteita. Esimerkiksi päivämäärä on sellainen tieto, joka voidaan esittää eri tavalla eri valmistajien tietokannoissa.

Myös erittäin suuret tietomäärät voivat aiheuttaa haasteita.

Mitä tulee huomioida SSIS toteutuksissa?

SSIS toteutuksissa olisi hyvä kartoittaa etukäteen, millaisia tietolähteet ovat:
missä rakenteissa tiedot sijaitsevat ja löytyykö lähdetiedoista
dokumentaatioita. On myös selvitettävä, tarvitseeko dataa siivota tai muokata
ennen lopulliseen kohteeseen lataamista sekä selvittää ladattavat tietomäärät.

 Kenen käytettäväksi SSIS soveltuu?

Yleensä SSIS työkalua käyttävät yrityksissä henkilöt, jotka hallinnoivat tietokantoja.
Esimerkiksi SQL Server ylläpitäjät ja ne henkilöt, jotka tekevät BI raportointia. Myös ohjelmistokehittäjät hyödyntävät SSIS työkalua. SSIS:n perusteet on helppo omaksua, mikäli Microsoft Visual Studio on tuttu työväline ja tietokantojen perusteet ovat hallussa. 

Vastaukset kysymysiin on koonnut Juha Kokkonen, jolla on yli 10 vuoden kokemus erilaisista integraatioista, joista useimmat on toteutettu SSIS:llä.

Haluatko keskustella tarkemmin SSIS (SQL Server Integration Services) työkalun hyödyntämisestä? Ota yhteyttä https://www.t-base.fi/ota-yhteytta/  tai lue lisää  esimerkiksi SQL Serverin merkkijonofunktioista:  https://www.t-base.fi/blogi/sql-server-2017-uudet-merkkijonofunktiot/