Vores AI-teknologi

Hvad vi behandler

The Intelligence Company bearbejder en stor mængde datakilder om virksomheder døgnet rundt. Men med vores tilladelse som landsdækkende kreditoplysningsselskab har vi også alle svenskere fra 15 års alderen i vores register.

Bemærk at vi for privatpersoner kun behandler den information, der er nødvendig for at tilbyde kreditoplysninger med forespørgselskopi på markedet. Hele listen over disse datakilder findes under om os.

Vi bruger primært afvigelsesdetektion.

Hvad er afvigelsesdetektion / anomalidetektion?

Afvigelsesdetektion, også kaldet anomalidetektion, indebærer at man identificerer data, der er usædvanlig eller anderledes ud fra en stor mængde data. Det handler om at identificere det, der skiller sig ud fra en stor mængde og kan opleves anderledes.

Inden for afvigelsesdetektion bruger man maskinlæring, en del af kunstig intelligens, AI. Man lærer en computer normale mønstre og flagger hændelser, der ikke svarer til normal adfærd.

Algoritmer til afvigelsesdetektion

Der findes en række metoder til afvigelsesdetektion, og her beskriver vi nogle af disse.

Klyngeanalyse

Indebærer at datamængden grupperes i lignende delmængder såkaldte klynger. Centrum dvs. tyngdepunktet for klyngerne kaldes centroid, og man måler afstanden fra centroiden til medlemmerne. Hvis datapunkter ligger for langt uden for centroiden, betyder det en afvigelse. Et billede fra Wikipedia viser et eksempel:

Klyngeanalyse eksempel

Inden for clustering findes der en række metoder og algoritmer, blandt andet K-Means, Mean-shift og agglomerativ hierarkisk clustering.

Beslutningstræ og regressionsanalyse

Beslutningstræ er en model, hvor man stiller spørgsmål og afhængigt af svar bevæger sig til næste gren. F.eks. kan beslutningstræer bruges til at forudsige konkurser hos virksomheder. Træet kan handle om JA/NEJ spørgsmål, dvs. binære træer eller træer, hvor svaret kan være intervaller.

Beslutningstræer bruges ofte sammen med regressionsanalyse, hvor der findes flere varianter, og den enkleste er lineær regression, som handler om, at man f.eks. finder et lineært forhold, dvs. en ret linje, som passer gennem en mængde af punkter. Et billede fra Wikipedia får vise et eksempel, hvor den blå linje bedst repræsenterer datamængden.

Et godt eksempel på, hvordan regressionsanalyse kan bruges, er hvis man samler alder, køn, vægt og højde på personer og trækker en linje, der bedst passer til den respektive datamængde for køn og alder. Derefter kan man bruge linjen til at forudsige, hvad vægten er givet personens højde, alder og køn.

Regressionsanalyse eksempel

Neurale netværk

Neurale netværk er en af de mere avancerede maskinlæringsalgoritmer og bruges oftest til at løse komplekse problemer. Neurale netværk består af sammenkoblede noder i flere lag hvor hver node modtager data, bruger en algoritme og videregiver data til næste node.

Det neurale netværk trænes ved at justere vægtene på linkene mellem noderne. To almindelige anvendelsesområder er for eksempel at opdage mønstre i ustruktureret information eller identificere mønstre.

Et billede fra Wikipedia viser forenklet, hvordan neuroner er forbundet:

Neuralt netværk eksempel