Heritrix

Wikipediasta
Siirry navigaatioon Siirry hakuun
Heritrixin logo

Heritrix on pääasiassa Internet Archiven kehittämä hakurobotti verkkoaineistojen keräämiseen. Kehitystyössä on mukana myös muita IIPC:n jäseniä eli pääasiassa kansalliskirjastoja. Hakurobotti on toteutettu Javalla ja sisältää laajan valikoiman asetuksia, joilla erilaisia keruutoimintoja voidaan toteuttaa. Keruurobottia on käytetty onnistuneesti useissa hyvin laajoissa verkkoaineistojen haravointiprojekteissa ja sen tekninen toteutus osaa kiertää monet yleisesti keräyksissä vastaantulevat tekniset ongelmat.

Heritrixiä käyttävät yleensä kansalliskirjastot tai muut toimijat, joiden tehtäviin kuuluu verkkoaineistojen kerääminen ja säilyttäminen jälkipolville. Heritrix:iä voidaan käyttää myös erilaisten vähemmän teknisten käyttöliittymien kautta kuten NetArchiveSuite tai Web Curator Tool.

Suomen Kansalliskirjasto kerää Suomea koskevia Internetin aineistoja kulttuuriaineistojen tallettamista ja säilyttämistä koskevan lain (28.12.2007/1433) mukaisesti. Myös muiden maiden kansalliskirjastojen toiminta perustuu samankaltaisiin lakeihin.

Heritrix on vapaata ohjelmistoa ja on julkaistu Apache License 2.0 -lisenssillä.

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]