Vår AI-teknologi

Hva vi behandler

The Intelligence Company behandler en stor mengde datakilder om selskaper døgnet rundt. Men med vår tillatelse som landsdekkende kredittopplysningsselskap har vi også alle svensker fra 15 års alder i vårt register.

Merk at for privatpersoner behandler vi kun den informasjonen som er nødvendig for å tilby kredittopplysninger med forespørselskopi på markedet. Hele listen over disse datakildene finnes under om oss.

Vi bruker hovedsakelig avviksdeteksjon.

Hva er avviksdeteksjon / anomalideteksjon?

Avviksdeteksjon, også kalt anomalideteksjon, innebærer at man skiller ut data som er uvanlig eller annerledes fra en stor mengde data. Det handler om å identifisere det som skiller seg ut fra en stor mengde og kan oppleves som annerledes.

Innen avviksdeteksjon bruker man maskinlæring, en del av kunstig intelligens, AI. Man lærer en datamaskin normale mønstre og flagger hendelser som ikke tilsvarer normale atferder.

Algoritmer for avviksdeteksjon

Det finnes en rekke metoder for avviksdeteksjon, og her beskriver vi noen av disse.

Klyngeanalyse

Innebærer at datamengden grupperes inn i lignende delmengder, såkalte klynger. Senteret, dvs. tyngdepunktet for klyngene, kalles centroid, og man måler avstanden fra centroiden til medlemmene. Hvis datapunkter ligger for langt utenfor centroiden, betyr det et avvik. Et bilde fra Wikipedia viser et eksempel:

Klyngeanalyse eksempel

Innen klynging finnes det en rekke metoder og algoritmer, blant annet K-Means, Mean-shift og agglomerativ hierarkisk klynging.

Beslutningstrær og regresjonsanalyse

Beslutningstre er en modell der man stiller spørsmål og avhengig av svar beveger seg til neste gren. For eksempel kan beslutningstrær brukes til å forutsi konkurser hos selskaper. Treet kan handle om JA/NEI-spørsmål, dvs. binære trær, eller trær der svaret kan være et spenn.

Beslutningstrær brukes ofte sammen med regresjonsanalyse der det finnes flere varianter, og den enkleste er lineær regresjon som handler om at man for eksempel finner et lineært forhold, dvs. en rett linje, som passer gjennom en mengde punkter. Et bilde fra Wikipedia viser et eksempel der den blå linjen best representerer datamengden.

Et godt eksempel på hvordan regresjonsanalyse kan brukes er hvis man samler alder, kjønn, vekt og høyde på personer og trekker en linje som best passer respektive datamengde for kjønn og alder. Deretter kan man bruke linjen til å forutsi hva vekten er gitt personens høyde, alder og kjønn.

Regresjonsanalyse eksempel

Nevrale nettverk / Nevronnett

Nevrale nettverk er en av de mer avanserte maskinlæringsalgoritmene og brukes oftest til å løse komplekse problemer. Nevrale nettverk består av sammenkoblede noder i flere lag der hver node mottar data, bruker en algoritme og sender data videre til neste node.

Det nevrale nettverket trenes ved å justere vektene på koblingene mellom nodene. To vanlige bruksområder er for eksempel å oppdage mønstre i ustrukturert informasjon eller identifisere mønstre.

Et bilde fra Wikipedia viser forenklet hvordan nevroner er sammenkoblet:

Nevralt nettverk eksempel