Liukuluku

Wikipediasta
(Ohjattu sivulta IEEE 754)
Siirry navigaatioon Siirry hakuun

Liukuluku on tietokoneissa käytetty reaalilukujen likimääräinen sisäinen esitysmuoto. Liukulukumuoto on kompromissi tarvittavien bittien lukumäärän, luvun esitystarkkuuden ja peitettävän lukualueen välillä.

Liukulukulaskenta

[muokkaa | muokkaa wikitekstiä]

Liukulukuun kuuluu neljä osaa: etumerkki (), mantissa (), kantaluku () ja eksponentti (). Etumerkki kertoo, onko luku negatiivinen vai positiivinen. Mantissa kuvaa luvun merkitseviä numeroita. Kantaluku ja eksponentti määrittävät luvun suuruusluokan. Tällöin liukuluvun arvoksi saadaan:

Esitys ei kuitenkaan ole yksikäsitteinen lukunelikolle ellei lukualueita rajata tarkasti. Yksikäsitteisyys voidaan saavuttaa sopimalla tietty kantaluku , ja sen jälkeen vaatimalla, että ja . Tietokoneissa pätee yleensä , jolloin ja .

Liukulukulaskenta voidaan aina toteuttaa ohjelmallisesti mutta monet suorittimet pystyvät suoraan liukulukulaskentaan matematiikkasuorittimella. Käyttäjälle tämä näkyy vain nopeuserona, ei tulosten erona. Matematiikkasuoritin on ollut erillinen apusuoritin varsinaisen suorittimen rinnalla, mutta se on nykyään integroitu varsinaisen suorittimen kanssa samalle piirisirulle. Esimerkiksi IBM PC -yhteensopivissa käytetty vuonna 1989 julkaistu Intel i486 integroi matemaattisuorittimen samalle piisirulle.

Johdatteleva esimerkki

[muokkaa | muokkaa wikitekstiä]

Oletetaan kantaluvun olevan 10, mantissan kolminumeroinen ja eksponentissa olevan etumerkin ja yhden numeron.

Tällöin suurin esitettävissä oleva luku on . Alempana selitettävistä normaaleista luvuista pienin nollaa suurempi on , pienin epänormaali luku . Tarkkuus riippuu suuruusluokasta: välillä 1–10 luvut esitetään tuhannesosan tarkkuudella, välillä 10–100 sadasosan tarkkuudella ja niin edelleen.

Kullekin luvulle on kolme eri esitystapaa: esimerkiksi voidaan esittää , tai . Esitystavoista ensimmäinen on tarkin, ja tätä esitystapaa kutsutaan normaaliksi; siis normaalin luvun mantissa on aina vähintään ja enintään .

Normaalit luvut muodostavat näin nollaa kohti tihentyvän parven, jossa kuitenkin nollan ympärillä on aukko: Pienin positiivinen luku on tuhat kertaa suurempi kuin sen erotus toiseksi pienimpään positiiviseen lukuun. Epänormaalit luvut täyttävät tämän aukon: tarkkuus pienenee, mutta laskenta ei "romahda" äkillisesti nollaan.

IEEE 754 -liukulukustandardi

[muokkaa | muokkaa wikitekstiä]

IEEE 754 on yleisin tietokoneissa käytetty liukulukustandardi. Se olettaa kantaluvuksi . Etumerkki ilmoitetaan yhdellä bitillä. tarkoittaa positiivista lukua, ja tarkoittaa negatiivista. Mantissa ja eksponentti ovat etumerkittömiä bittijonoja. Standardi määrittelee neljä erilaista liukulukua:

  • Perustarkkuus ( on 23 bittiä ja on 8 bittiä)
  • Kaksoistarkkuus ( on 52 bittiä ja on 11 bittiä)
  • Laajennettu perustarkkuus ( on 31 bittiä ja on 11 bittiä)
  • Laajennettu kaksoistarkkuus ( on 63 bittiä ja on 15 bittiä)

Laajennettua kaksoistarkkuutta kutsutaan joskus 80-bittiseksi muodoksi, mutta laitetoteutukset eivät tyypillisesti käytä piilotettua bittiä ja se voidaan merkitä 79-bittiseksi.[1]

IEEE 754 standardin lisäksi on IEEE 854 -standardi, joka ei määrittele miten liukuluvut koodataan biteiksi, mutta se sallii sekä kymmen- että kaksikantaiset muodot.[1][2]

Normalisoidut luvut

[muokkaa | muokkaa wikitekstiä]

Kun , luku on normalisoitu. Tällöin yksikäsitteisyys saavutetaan sopimalla ja . Tällöin liukuluvun arvoksi saadaan:

Lukua nolla ei voi esittää suoraan johtuen määritelmästä, koska ylin bitti säädetään kiinteästi ykköseksi. Standardin mukaan luku on nolla kun . Tämän seurauksena luvun nolla esitys tietokoneen muistissa on kaikki bitit nollina, mikä nopeuttaa liukulukumuuttujien alustamista eräissä tietokonejärjestelmissä.

Normalisoidussa muodossa mantissan ensimmäinen luku on aina 1b, joten se jätetään pois ja siten saadaan käyttöön yksi numero enemmän tarkkuutta. Täten

Koska yksi eksponentin arvo on varattu nollalle, ei eksponentteja voi esittää suoraan, vaan eksponentti on IEEE-liukuluvuissa tallennettu muodossa jota kutsutaan nimillä offset binary tai biased exponent. Tämä , missä riippuu käytetystä tarkkuudesta. Perustarkkuudelle ja kaksoistarkkuudella . Eksponentti voi täten esittää suuremman määrän positiivisia arvoja kuin negatiivisia arvoja.

Ei-normalisoidut arvot

[muokkaa | muokkaa wikitekstiä]

Kun ja , luku ei ole normalisoitu. Tällöin ja , missä riippuu käytetystä tarkkuudesta. Perustarkkuudelle ja kaksoistarkkuudella .

Äärettömät: positiivinen ja negatiivinen

[muokkaa | muokkaa wikitekstiä]

IEEE-745 määrittelee myös positiivisen ja negatiivisen äärettömän. Käsitteellisesti ne eivät vastaa niinkään matemaattista äärettömyyttä vaan mitä tahansa lukua, joka ylittää tai alittaa esitettävissä olevien lukujen alueen. Äärettömilläkin voidaan osittain laskea, esimerkiksi mikä tahansa positiivinen normaali luku jaettuna positiivisella äärettömällä antaa tulokseksi positiivisen nollan.

Nollat: positiivinen ja negatiivinen

[muokkaa | muokkaa wikitekstiä]

Analogisesti äärettömien kanssa nollia on kaksi, positiivinen ja negatiivinen. Ne kuvaavat paitsi matemaattisen tarkkaa nollaa, myös lukuja joiden suuruus alittaa ei-normalisoitujen lukujenkin esitettävissä olevat arvot.

Epäluku ("Not-a-Number", NaN)

[muokkaa | muokkaa wikitekstiä]

Lopuksi standardi määrittelee tuloksen laskutoimitukselle, jolle ei ole mielekästä vastausta edes äärettömien tai nollien avulla esitettynä. Esimerkiksi positiivisen ja negatiivisen äärettömän summa on tällainen: taustalla on ajatus, jonka mukaan emme tiedä kumpi ääretön on suurempi, joten mikään vastaus ei kelpaa. Jokaisen luvun jokainen laskutoimitus epäluvun kanssa tuottaa epäluvun: esimerkiksi epäluku kertaa nolla ei ole nolla vaan epäluku.

Epälukujen ja osittain myös äärettömien ja nollien avulla pitkä laskenta voidaan tehdä loppuun ja vasta lopuksi tutkia miltä osin saatiin mielekkäitä tuloksia ja milloin esimerkiksi jokin laskukaava ei toiminut.

Laskutaulukot

[muokkaa | muokkaa wikitekstiä]

Seuraavassa "S" kuvaa suurta lukua, joka on lähes lukualueen ylärajalla, luku 3 on esimerkki tavallisesta luvusta, äärettömät on merkitty +inf ja −inf, nollat +0 ja −0, ja epäluku on NaN.

Yhteenlasku
+ 3 S +inf −inf +0 −0 NaN
3 6 S +inf −inf 3 3 NaN
S +inf +inf −inf S S NaN
+inf +inf NaN +inf +inf NaN
−inf −inf −inf −inf NaN
+0 +0 −0 NaN
−0 −0 NaN
NaN NaN

Ominaisuuksia

[muokkaa | muokkaa wikitekstiä]
  • Kahta normalisoitua IEEE-754 lukua voi verrata suoraan käyttämällä kahden komplementin lukujen vertailijaa.

Luvun esitys perustarkkuudella tarkoittaa lukua, jossa ja , eli heksadesimaalijonona: 3f80 0000. Sama luku kaksoistarkkuudella saa esitysmuodon: 3ff0 0000 0000 0000. Luvun esitysmuoto perus- ja kaksoistarkkuudella on bf80 0000 ja bff0 0000 0000 0000.

Muut liukulukumuodot

[muokkaa | muokkaa wikitekstiä]

binary16 on (puolitarkkuus, engl. half-precision) on binary32 muodosta typistetty 16-bittinen muoto, joka on suunnattu muun muassa vähävirtaisissa laitteissa käytettäväksi.[3] 16-bittistä muotoa käytetään myös "syvävärikuvien" (engl. Deep Color) tallentamiseen OpenEXR-muodossa.[4]

On myös julkaistu erilaisia epästandardeja liukulukumuotoja kuten Nvidian TensorFloat-32.[5]

16-bitin puolitarkkuutta käytetään esimerkiksi neuroverkkojen koulutuksessa.[6]

Epätarkkuuksia ja ongelmia

[muokkaa | muokkaa wikitekstiä]

Kuten murtoluvut voidaan esittää päättyvinä kymmenkantaisina desimaalilukuina vain jos nimittäjä on kymmenen potenssi, voidaan luku esittää tarkasti liukulukuna vain, jos vastaavan murtolukuesityksen nimittäjä on kahden potenssi. Siten esimerkiksi desimaalilukua 0,1 ei voi esittää tarkasti liukulukuna.[7]

Esimerkiksi JavaScriptin vertailu 0.1 + 0.2 === 0.3 on epätosi, koska sitä evaluoitaessa luvut on pyöristetty kolme kertaa ja summalausekkeen tulos on eri kuin luvun 0,3 muunnos liukuluvuksi.

JavaScriptissa, jossa kaikki luvut tallennetaan kaksoistarkkuuden 64-bittisinä IEEE-liukulukuina, suurin turvallisesti esitettävä kokonaisluku on 9007199254740992 (Number.MAX_SAFE_INTEGER+1). Esimerkiksi vertailu 9007199254740991 + 1 === 9007199254740991 + 2 palauttaa toden, vaikka on matemaattisesti epätosi.[8]

On huomattava että tietokoneiden käsittelemät liukuluvut on optimoitu teknis-tieteellisen laskennan tarkoituksiin. IEEE754-standardin suunnittelija William Kahan valitsi 53 bitin tarkkuuden liukuluvuille, jotta tieteellisessä laskennassa vältettäisiin vaativa virheanalyysin tarve. Standardin mukaiset liukuluvut eivät sovellu lainkaan finanssimatematiikan käyttöön, sillä useimpia yksinkertaisiakaan desimaalilukuja ei voi tarkasti ilmoittaa liukulukuina, mikä johtaa pyöristysvirheisiin. Lisäksi suurissa summissa arvoalue voi loppua kesken. Tätä varten on kehitetty ns. desimaaliset liukuluvut. Näiden käsittely tietokoneen laitteistolla sisältyy vain muutamiin mainframe-koneisiin, kuten IBM z-Series, joten laskenta tapahtuu yleensä ohjelmallisesti. Finanssimatematiikan luonteen vuoksi tämän hitaus ei yleensä ole ongelma.[9]

  1. a b David Goldberg: What Every Computer Scientist Should Know About Floating-Point Arithmetic maaliskuu 1991. Arkistoitu Viitattu 24.2.2023. (englanniksi)
  2. Michael F. Cowlishaw: Decimal Floating-Point: Algorism for Computers (PDF) speleotrove.com. Viitattu 24.2.2023. (englanniksi)
  3. A Transprecision Floating-Point Platform for Ultra-Low Power Computing arxiv.org. 28.11.2017. doi:10.23919/DATE.2018.8342167 Viitattu 22.1.2021. (englanniksi)
  4. Interpreting OpenEXR Deep Pixels openexr.com. Viitattu 23.3.2024. (englanniksi)
  5. TensorFloat-32 in the A100 GPU Accelerates AI Training, HPC up to 20x blogs.nvidia.com. 14.5.2020. Viitattu 22.1.2021. (englanniksi)
  6. Dylan Martin: Cerebras's supercomputer has more cores than world's fastest iron – with a big catch theregister.com. 15.11.2022. Viitattu 16.11.2022. (englanniksi)
  7. The simple math behind decimal-binary conversion algorithms blog.angularindepth.com.[vanhentunut linkki]
  8. Here is what you need to know about JavaScript’s Number type medium.com.
  9. http://lapiet.info/gnulinux/decfp/decfp.html

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]