Synteettinen data
Siirry navigaatioon
Siirry hakuun
Synteettinen data on aineistoa, joka on keinotekoisesti luotu, eikä sitä ole tuotettu todellisista ilmiöistä tai havainnoista.[1]. Synteettistä dataa luodaan tyypillisesti algoritmien avulla, ja sitä voidaan käyttää matemaattisten mallien toimivuuden varmistamiseen ja koneoppimismallien kouluttamiseen[1] Synteettistä dataa käytetään monilla eri aloilla tietojen suojaamiseen. Tämä on tarpeen, koska muutoin tietojen luottamuksellisuus vaarantuisi. Vaikka arkaluonteisia tietokokonaisuuksia on olemassa, niitä ei voida luovuttaa suurelle yleisölle tietosuojasyistä[2]. Tämänkaltaisia tietoja ovat mm. potilasrekisterit, pankkitiedot ja sotilastiedustelutiedot[2].
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b Yasar, Kinza & Laskowski, Nicole: What is synthetic data? - Definition SearchCIO. Viimeksi päivitetty maaliskuussa 2023. TechTarget. Arkistoitu 3.12.2023. Viitattu 27.2.2024. (englanniksi)
- ↑ a b Nikolenko, Sergey I.: Synthetic Data for Deep Learning. (Osa kirjasarjaa: Springer Optimization and Its Applications (SOIA), osa: 174) Springer, 2021. doi:10.1007/978-3-030-75178-4 ISBN 978-3-030-75177-7 Kustantajan verkkosivut (viitattu 27.2.2023). (englanniksi)