Tekoälyteknologiamme

Mitä käsittelemme

The Intelligence Company käsittelee suurta määrää yritystietolähteitä ympäri vuorokauden. Valtakunnallisen luottotietoyhtiön lupamme ansiosta rekisterissämme on myös kaikki 15 vuotta täyttäneet ruotsalaiset.

Huomaa, että yksityishenkilöiden osalta käsittelemme vain tietoja, jotka ovat välttämättömiä luottotietopalvelujen tarjoamiseksi kyselykopion kanssa markkinoilla. Täydellinen luettelo näistä tietolähteistä löytyy tietoa meistä -osiosta.

Käytämme pääasiassa poikkeamien havaitsemista.

Mitä on poikkeamien havaitseminen?

Poikkeamien havaitseminen, jota kutsutaan myös anomalioiden havaitsemiseksi, tarkoittaa epätavallisen tai poikkeavan datan erottamista suuresta datamäärästä. Kyse on sellaisen tunnistamisesta, joka erottuu suuresta massasta ja voi vaikuttaa poikkeavalta.

Poikkeamien havaitsemisessa käytetään koneoppimista, joka on osa tekoälyä. Tietokoneelle opetetaan normaalit käyttäytymismallit ja merkitään tapahtumat, jotka eivät vastaa normaalia käyttäytymistä.

Poikkeamien havaitsemisalgoritmit

Poikkeamien havaitsemiseen on useita menetelmiä, ja tässä kuvaamme joitakin niistä.

Klusterianalyysi

Tarkoittaa, että tietojoukko ryhmitellään samankaltaisiin osajoukkoihin, joita kutsutaan klustereiksi. Klustereiden keskustaa eli painopistettä kutsutaan sentroidiksi, ja etäisyys sentroidista jäseniin mitataan. Jos datapisteet ovat liian kaukana sentroidista, se tarkoittaa poikkeamaa. Wikipedia havainnollistaa esimerkin:

Esimerkki klusterianalyysistä

Klusteroinnissa on useita menetelmiä ja algoritmeja, kuten K-Means, Mean-shift ja agglomeratiivinen hierarkkinen klusterointi.

Päätöspuut ja regressioanalyysi

Päätöspuu on malli, jossa esitetään kysymyksiä ja vastauksesta riippuen siirrytään seuraavaan haaraan. Päätöspuita voidaan käyttää esimerkiksi yritysten konkurssien ennustamiseen. Puu voi käsitellä KYLLÄ/EI-kysymyksiä, eli binaaripuita, tai puita, joissa vastaus voi olla vaihteluväli.

Päätöspuita käytetään usein yhdessä regressioanalyysin kanssa, jossa on useita variantteja, ja yksinkertaisin on lineaarinen regressio, jossa esimerkiksi löydetään lineaarinen suhde eli suora viiva, joka sopii pistejoukkoon. Wikipedian kuva näyttää esimerkin, jossa sininen viiva edustaa parhaiten datajoukkoa.

Hyvä esimerkki regressioanalyysin käytöstä on, kun kerätään henkilöiden ikä, sukupuoli, paino ja pituus ja piirretään viiva, joka parhaiten sopii kunkin sukupuolen ja iän datajoukkoon. Sen jälkeen viivaa voidaan käyttää ennustamaan paino henkilön pituuden, iän ja sukupuolen perusteella.

Regressioanalyysi esimerkki

Neuroverkot

Neuroverkot ovat yksi edistyneimmistä koneoppimisalgoritmeista ja niitä käytetään yleensä monimutkaisten ongelmien ratkaisemiseen. Neuroverkot koostuvat toisiinsa kytketyistä solmuista useissa kerroksissa, joissa jokainen solmu vastaanottaa dataa, käyttää algoritmia ja välittää datan seuraavalle solmulle.

Neuroverkkoa koulutetaan säätämällä solmujen välisten linkkien painoja. Kaksi yleistä käyttötarkoitusta ovat esimerkiksi kuvioiden tunnistaminen rakenteettomasta tiedosta tai mallien tunnistaminen.

Kuva Wikipediasta näyttää yksinkertaistetusti miten neuronit ovat yhteydessä toisiinsa:

Esimerkki neuroverkosta