Tiedostomuoto
Tähän artikkeliin tai osioon ei ole merkitty lähteitä, joten tiedot kannattaa tarkistaa muista tietolähteistä. Voit auttaa Wikipediaa lisäämällä artikkeliin tarkistettavissa olevia lähteitä ja merkitsemällä ne ohjeen mukaan. Tarkennus: pääosin lähteetön artikkeli |
Tiedostomuoto tai tiedostoformaatti ilmaisee tietokoneiden tallennusmedialle, esimerkiksi kiintolevylle talletetun tiedoston tallennusmuodon eli rakenteen. Monista tiedostomuodoista on olemassa julkinen määritelmä, jossa kuvataan miten tieto tulee koodata. Hyötynä on talletetun tiedon yhteensopivuus eri ohjelmien ja järjestelmien välillä sekä tallennustilan säästö.
Tiedostomuodon merkintä ja tunnistus
[muokkaa | muokkaa wikitekstiä]Tiedostomuodon tunnistamiseen on kehitetty useita eri tapoja. Unix ja Unixin kaltaiset käyttöjärjestelmät tunnistavat tiedostomuodon sen alussa olevasta merkkisarjasta. Esimerkiksi GIF-kuvatiedostot alkavat ASCII-merkeillä GIF87a
tai GIF89a
standardista riippuen ja käännetty Java-koodi heksaluvuilla 0xCAFEBABE[1]. Amiga OS tunnistaa tiedostot samalla menetelmällä ja esimerkiksi IFF -tiedostot alkavat merkkijonolla FORM
. Neljän merkin "Type ID" tunnistetta kutsutaan eri yhteyksissä eri tavoin: Mac OS-alustalla Type ID-koodia kutsutaan OSType:ksi ja Windows-alustalla FourCC:ksi. Uudempi macOS noudattaa BSD:n tavoin Unix-tapaa. Tiedostomuoto voidaan tällöin tunnistaa sen nimeämisestä riippumatta ja esimerkiksi komentoriviputken tai verkon yli välitetyn datavirran yhteydessä tiedostomuoto tunnistetaan ilman nimeä.
Eräs käytetty tapa on käyttää tiedostopäätteitä. Eräät tiedostonhallintaohjelmat kuten Windows Explorer tai Konqueror käyttävät tiedostopäätettä päätelläkseen tiedoston tiedostotyypin. Tiedostopääte on tiedoston nimessä viimeisen pisteen jälkeen tulevat merkit. Esimerkiksi HTML-dokumentit tunnistetaan .html
-tiedostopäätteestä.
Tiedostopäätteet näkyvät tiedostonimen loppuosassa pisteellä eroteltuna. Esimerkiksi tiedostonimessä foobar.txt
, pääteosa .txt
voi ilmaista tiedoston olevan yksinkertainen muotoilematon tekstitiedosto, jonka voi avata millä tahansa tekstitiedostoja lukevalla tekstieditorilla tai tekstinkäsittelyohjelmalla.
Eräs tapa ilmaista tiedostomuoto on MIME-tyypit. Ne ovat hallitseva tapa kuvata tiedostomuotoja Internetissä. MIME-muodot koostuvat standardoiduista tunnisteista, jossa tyyppi ja alatyyppi erotetaan vinoviivalla: esimerkiksi text/html
tai image/gif
. MIME-tyypit oli tarkoitettu alun perin kuvaamaan sähköpostin liitetiedostojen tiedostomuotoja alustariippumattomasti. Sama tekniikka on otettu WWW:n HTTP-tiedostosiirtoprotokollan käyttöön.
Tekniikka
[muokkaa | muokkaa wikitekstiä]Tiedostomuoto tarkoittaa välttämättömien valinnaisten tietojen säilömistä rakenteeseen, joka voidaan ohjelmallisesti käsitellä yhdessä tai useammassa eri ohjelmassa. Välttämättömiä tietoja voivat olla audiokanavien lukumäärä ja näytteenottotaajuus äänen oikean toiston varmistamiseksi. Valinnaisia tietoja voivat olla tekijän ja tiedoston luomiseen käytetyn ohjelman nimi sekä ajan hetki.
Esimerkiksi AIFF-tiedostomuoto koostuu lohkoista, joissa kerrotaan tietynlaisia metatietoja itse audiodatasta. Metatiedot kertovat montako bittiä yksittäinen ääninäyte on ja ohjelma sen mukaan voi jakaa datan eri kanaviin.[2] Käsittelevä ohjelma voi myös ohittaa lohkot joita se ei välttämättä tarvitse sillä hetkellä.
Säännönmukainen tiedostomuoto voi olla olennaista, jotta tietoa voidaan käsitellä luotettavasti eri ohjelmaversioiden ja eri ohjelmien välillä, osittain koska uudemmat versiot voivat lisätä tietoa jota aiemmat versiot eivät osaa käsitellä.
Tiedostomuotoja
[muokkaa | muokkaa wikitekstiä]Tiedostomuotoja on olemassa useita eri tarkoituksiin. Joihinkin tarkoituksiin on jopa useita kilpailevia muotoja. Osa tiedostomuodoista on suunniteltu vain yhtä tarkoitusta varten, kuten JPEG staattisten kuvien tallennusta varten. Osaa tiedostomuodoista voidaan käyttää useaan tarkoitukseen, kuten GIF-tiedostomuoto, jota voidaan käyttää kuvien ja animaatioiden tallentamiseen. Tiedostomuodot voidaan jakaa käyttötarkoituksensa perusteella seuraavasti:
Arkistotiedostomuodot
[muokkaa | muokkaa wikitekstiä]Arkistotiedostomuodot ("pakkausohjelmien" tiedostot) tiivistävät alkuperäisiä tiedostoja ja arkistoimalla säästetään muistitilaa tai pystytään siirtämään tiedostoja verkostossa vähäisemmällä määrällä tietoliikennettä.
Unixeissa käytetty tar-ohjelma ei itsessään pakkaa, mutta tukee ulkoisia pakkausohjelmia, kuten gzip, bzip2 ja xz, pakkaamiseen ja purkamiseen.
Pakettitiedostomuodot
[muokkaa | muokkaa wikitekstiä]Ohjelmien asennukseen käytettävät pakettitiedostomuodot kuten:
- APK
- deb
- RPM
Kuvatiedostomuodot
[muokkaa | muokkaa wikitekstiä]Kuvatiedostomuotoja käytetään kuvien tallentamiseen, säilyttämiseen ja katseluun. Kuvat voidaan jakaa bittisyvyytensä mukaan määrittyviin värisyvyyksiin.
- BMP, Microsoftin Windowsissa käytetty bittikarttagrafiikan muoto, pakkaamaton tiedostomuoto
- GIF, kehittäjä/patentin haltija Unisys/IBM
- JPEG, kehittäjä Joint Photographic Experts Group, häviöllinen pakkaus
- PNG, vapaa W3C-standardi, uusin standardiversio ISO/IEC 15948:2003, häviötön pakkaus
- RAW-tiedostomuodot ovat digitaalikameroiden muokkaamattomien raakakuvien tiedostomuotoja, mitkä digitaalikamera tallentaa sellaisenaan käsittelemättöminä.
- SVG, vektorigrafiikan tiedostomuoto
- TIFF, sivuntaitto-ohjelmien käyttämä kuvatiedostomuoto, häviötön
Ohjelmatiedostomuodot
[muokkaa | muokkaa wikitekstiä]- Pääartikkeli: Ohjelmatiedosto
Ohjelmatiedostomuotoja käytetään konekielisten ohjelmien tiedoille sekä objektitiedostoille.
- Executable and Linkable Format (ELF)
- EXE
- MZ
- Portable Executable (PE)
Teksti- ja dokumenttitiedostomuodot
[muokkaa | muokkaa wikitekstiä]Tekstitiedostomuotoja käytetään tekstien tallentamiseen ja esittämiseen. Dokumenttitiedostot voivat sisältää myös kuvia ja grafiikkaa sekä muotoilumäärittelyjä.
- tekstitiedosto, (toisinaan lyhennetty TXT), useita merkistöstä riippuvia muotoja
- Rich Text Format, "rikastettu" tekstitiedosto
- DOC, useita samaa nimeä käyttäviä tiedostomuotoja, mukaan lukien Microsoft Wordin käyttämä tiedostomuoto
- PostScript, sivunkuvauskieli ja dokumenttimuoto
- PDF, Adoben dokumenttimuoto
- EPUB, sähkökirjoissa käytetty muoto
- DjVu, skannatuille tiedoille suunnattu dokumenttimuoto
- DVI, TeX-ohjelmiston muoto
Videotiedostot
[muokkaa | muokkaa wikitekstiä]Yleisimmät videotiedostot ovat säiliömuotoja, jotka eivät pakota mitään tiettyä koodekkia videolle tai äänelle vaan voivat sisältää eri tavalla koodattua dataa.
Äänitiedostomuodot
[muokkaa | muokkaa wikitekstiä]Äänitiedostojen kuunteluohjeet
- AIFF, Applen suunnittelema tiedostomuoto, ei pakkausta (AIFF-C on pakkauksen sisältävä muoto)
- WAV tai WAVE, Microsoftin suunnittelema tiedostomuoto, ei pakkausta
- AU, Sun Microsystemsin suunnittelema tiedostomuoto, eri koodausmenetelmiä
- FLAC, vapaa standardi, häviötön pakkaus
- AAC, häviöllinen pakkaus, lisenssirajoitukset (patentit voimassa)
- MP3, häviöllinen pakkaus, lisenssirajoitukset (patentit vanhentuneet)
- Ogg, vapaa standardi, häviöllinen pakkaus
- MIDI, soitinäänet tallentava tiedostomuoto
Katso myös
[muokkaa | muokkaa wikitekstiä]Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ JSR-000202 JavaTM Class File Specification Update Evaluation 1.0 Final Release
- ↑ Audio Interchange File Format (AIFF) muratnkonar.com. Arkistoitu 18.4.2017. Viitattu 28.11.2017.
Aiheesta muualla
[muokkaa | muokkaa wikitekstiä]- FILExt – The File Extension Source (englanniksi)
- Wotsit (englanniksi)
- File extensions (englanniksi)
- FileExpert (englanniksi)
- http://www.fileinfo.net (englanniksi)
- Magic signature database – Standard file format information and FFID registry (Arkistoitu – Internet Archive)
- Format wars File formats for websites and print explained
- File signatures (aka magic numbers) found in files to indicate their file type
- PRONOM technical registry
- Library of Congress file format information
- Intoduction to Uniform Type Identifiers
- Game File Format Central – A large and expanding list of detailed descriptions of game-related file-formats (Arkistoitu – Internet Archive)
- BIEW Binary vIEW project