Molekyylien karsinogeenisuutta ennustavat neuroverkot
Tämän artikkelin tai sen osan viitteitä on pyydetty muotoiltavaksi. Voit auttaa Wikipediaa muotoilemalla viitteet ohjeen mukaisiksi, esimerkiksi siirtämällä linkit viitemallineille. Tarkennus: Viitteet tulisi siirtää niiden lauseiden/virkkeiden perään, joissa on käytetty kyseistä lähdettä. |
Molekyylien karsinogeenisuutta ennustava neuroverkko on neuroverkko, joka ottaa syötteenä jonkin molekyylin ja antaa tulosteena tiedon siitä, onko syötetty molekyyli karsinogeeni vai ei. Molekyylien karsinogeenisuutta ennustavan neuroverkon voi tehdä käyttäen monta eri neuroverkkotyyppiä. Eri neuroverkkotyyppejä, joita tutkimusaiheeseen on sovellettu, näkyvät seuraavasti: graafineuroverkko, metaluokitteluneuroverkko, kapselineuroverkko, laskuripropogaationeuroverkko ja konvolutionaalineuroverkko.[1][2][3][4][5][6][7]
Tieteelliset artikkelit
[muokkaa | muokkaa wikitekstiä]Keskeisiä tutkimusaiheen tieteellisiä julkaisuja ovat muun muassa CapsCarcino, CarcinoPred-EL ja DeepCarc. Näistä parhaan tarkkuuden (engl. accuracy) saavuttivat CapsCarcino (85.0 %) ja DeepCarc (90.9 %). Tarkkuus eli ACC on suure, jolla mitataan neuroverkkojen suoriutumista. Tarkkuuden määritelmä on oikeiden positiivien (engl. true positive) ja oikeiden negatiivien (engl. true negative) summan suhde oikeuden positiivien, oikeiden negatiivien, väärien negatiivien (engl. false negative) ja väärien positiivien (engl. false positive) summaan. Tarkkuus on keskiarvo kahdesta muusta suureesta, jotka ovat spesifisyys (engl. specificity, lyhenne SP) ja sensitiivisyys (engl. sensitivity, lyhenne SE). Spesifisyyden määritelmä on oikeiden negatiivien suhde väärien positiivien ja väärien negatiivien summaan. Taas sensitiivisyys tarkoittaa oikeiden negatiivien suhdetta oikeiden positiivien ja väärien negatiivien summaan.[1][2][3][4][5][6][7]
Molekyylien esitystavat
[muokkaa | muokkaa wikitekstiä]Jotta molekyylejä voidaan syöttää neuroverkon syötekerrokseen, on ne muutettava molekyylisormenjälkijärjestelmien esitysmuotoihin kuten MACCS-esitysmuotoihin.[1][2][3][4][5][6][7]
Aineistot
[muokkaa | muokkaa wikitekstiä]Yleisin lähde, josta tieteelliset artikkelit ovat noutaneet aineistonsa, on CPDB eli Carcinogen Potency Database. Yleisin aineistokoko tieteellisissä artikkeleissa on noin tuhat molekyyliä.[1][2][3][4][5][6][7]
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b c d CapsCarcino: A novel sparse data deep learning tool for predicting carcinogens Food Chem Toxicology.
- ↑ a b c d CarcinoPred-EL: Novel models for predicting the carcinogenicity of chemicals using molecular fingerprints and ensemble learning methods Nature.
- ↑ a b c d A graph neural network approach for molecule carcinogenicity prediction Bioinformatics.
- ↑ a b c d Quantitative and qualitative models for carcinogenicity prediction for non-congeneric chemicals using CP ANN method for regulatory uses Mol Divers.
- ↑ a b c d DCAMCP: A deep learning model based on capsule network and attention mechanism for molecular carcinogenicity prediction Cell Mol Med.
- ↑ a b c d DeepCarc: Deep Learning-Powered Carcinogenicity Prediction Using Model-Level Representation Frontier Artificial Intelligence.
- ↑ a b c d Predicting Chemical Carcinogens Using a Hybrid Neural Network Deep Learning Method Sensors (Basel).