PHASE IV AI – Privacy compliant health data as a service for AI development

Mahdollistamme tekoälyn kehittäjille pääsyn suurempiin tietoaltaisiin

Datapohjaiset työkalut (erityisesti tekoäly) tarvitsevat yleensä suuren määrän dataa relevanssin ja tarkkuuden saavuttamiseksi. Siksi tällaisten työkalujen kehittäminen terveydenhuollon ratkaisuja varten edellyttää, että validoituja, kooltaan sopivia tietokokonaisuuksia voidaan soveltaa laaja-alaisesti suuriin populaatioihin. Tietojen soveltaminen terveydenhuollossa on kuitenkin nykyään hankalaa terveystietojen arkaluonteisuuden ja korkean yksityisyyden suojan vuoksi.

Datalähtöiset lähestymistavat eivät välttämättä toimi pienen paikallisen väestön sairauksissa. De-identifikaatio ei useinkaan ole tarpeeksi vahvaa tai nykypäivän de-identifiointistrategiat eivät johda vaadittuun tilastolliseen voimaan. Näin ollen tällaisia sairauksia ei aina voida optimaalisella tavalla tutkia tekoälypohjaisella tekniikalla olemassa olevien anonymisointi- tai syntetisointitekniikoiden rajoitusten vuoksi. Synteettinen data ja federoitu oppiminen auttavat tässä, koska ne helpottavat tietojen jakamista vaarantamatta tietoturvaa.

Synteettiset tiedot voidaan validoida taustalla olevien reaalimaailman tietojen avulla. Synteettisen tiedon tuottamisen kriteerit ovat tällä hetkellä tutkimuksen kohteena, ja niillä pyritään varmistamaan, että tieto on yleisesti käyttökelpoista. Lisäksi laadunarviointi- ja validointityökaluista puuttuu myös hyödyllisyys- ja yksityisyyskriteereitä mittaava laatumittari.

Tavoitteet:

  • Parannetut teknologiat (federoidulle) anonymisoinnille ja terveystietojen syntetisoinnille vahvoilla de-identifiointiominaisuuksilla
  • Mahdollistetaan tekoälyn kehittäjille pääsy suurempiin tietoaltaisiin federoidun oppimisen avulla helppokäyttöisten ja mukautettavien tietopalveluiden avulla
  • Data Marketin perustaminen – helpotetaan tietojen jakamista ja luodaan kannustimet tietojen tarjoamiseen palveluille
  • Integroidaan datamarkkinat ja datan palveluekosysteemi eurooppalaiseksi terveystietojen keskukseksi (EHDS, European Health Data Space).

Me Turun ammattikorkeakoulussa tutkimme paikallisia ja globaaleja painoaggregointimalleja, jotka on laadittu differentiaalisen yksityisyyden tekniikoilla. Näin voidaan kehittää skaalautuvia, monikerroksisia ja turvallisia federoidun oppimisen järjestelmiä terveystietojen yksityisyyden säilyttämiseksi.

Tutkimme myös menetelmiä synteettisten lääketieteellisten kuvien arvioimiseksi kliinisen ja yksityisyyden näkökulmista. Käytämme myös mahdollisesti tilastollisia ja matemaattisia tekniikoita arvioimaan tekoälymallien generoimia synteettisiä tietoja yksityisyyden takuiden osalta FL- ja DP-malleissa.

Projektin nettisivut

Kuva: Jussi Salmi / tekoäly Copilot, 09/2024

projektin PHASE IV AI logo

Ota yhteyttä

  • Jussi Salmi

    Lehtori
    +358 50 911 2140
    jussi.salmi@turkuamk.fi
  • Elina Kontio

    Yliopettaja, Tutkimusvastaava
    +358 44 907 2088
    elina.kontio@turkuamk.fi

Kumppanit

  • Ainigma Technologies, Espanja
  • Centre Hospitalier Universitaire Vaudois, Sveitsi
  • Engineering – Ingegneria Informatica SPA, Italia
  • Fujitsu Technology Solutions SA N/V, Belgia
  • Fujitsu Technology Solutions SA, Luxemburg
  • Fundacio Eurecat, Espanja
  • Fundacio Hospital Universitari Vall D’Hebron – Institut de Recerca, Espanja
  • INESC TEC – Instituto de Engenhariade Sistemas e Computadores, Tecnologia e Ciensia, Portugali
  • Inpher SARL, Sveitsi
  • Katholieke Universiteit LEUVEN, Belgia
  • LeanXcale SL, Espanja
  • Nottingham University Hospitals NHS Trust, Iso-Britannia
  • Resilience Guard GMBH, Sveitsi
  • Sabanci Universitesi, Turkki
  • Teknologian tutkimuskeskus VTT
  • Turun yliopisto (koordinaattori)
  • Turun yliopistollinen keskussairaala Tyks
  • Universitat Wien, Itävalta
  • University Nottingham Trent University, Iso-Britannia

Tutustu tutkimusryhmään