22.11.2011. / 14:05

Autor: Nacional.hr

Harvestiranjem nacionalne domene prikupljeno 56 milijuna datoteka

S naročitom se pažnjom prikupljaju sadržaji koji postoje samo na webu i dokumentiraju sadašnji društveni trenutak, društvene trendove, popularna zbivanja, važne sportske, političke, kulturne i druge događaje

Harvestirane su i stranice Nacional.hr-aHarvestirane su i stranice Nacional.hr-aGlavna misija nacionalne knjižnice je da prikuplja, čuva, organizira i daje na korištenje našu intelektualnu i kulturnu baštinu. Tokom svoga postojanja, knjižnica je prihvaćala nove vrste građe i nove "nosače podataka". Devedesetih godina 20. stoljeća pojavljuje se novi medij, internet koji knjižnice trebaju uzeti u obzir ako žele u potpunosti obavljati svoju društvenu ulogu.

Danas na internetu (webu) učimo, kupujemo, pratimo dnevne događaje, objavljujemo svoje tekstove, fotografije, filmove, sadržaji se stalno mijenjaju i bez traga nestaju. Kakvu će sliku života početkom 21. stoljeća imati generacije za 50 godina, što će znati o našem načinu komuniciranja i razmišljanja, stavovima i odlukama koje smo donosili?

Prikupljanje "publikacija" s weba i čuvanje prošlosti weba velik je tehnički izazov za knjižnice općenito. Hrvatski arhiv weba (HAW) kojeg Nacionalna i sveučilišna knjižnica gradi u suradnji sa Sveučilišnim računskim centrom (Srce) bavi se upravo tim zahtjevnim zadatkom. HAW se temelji na programskoj podršci koju razvija i održava Srce, a u produkcijskom je radu od 2004. godine. U okviru HAW-a Nacionalna i sveučilišna knjižnica selektivno prikuplja sadržaje s interneta (weba). S naročitom se pažnjom prikupljaju sadržaji koji postoje samo na webu i dokumentiraju sadašnji društveni trenutak, društvene trendove, popularna zbivanja, važne sportske, političke, kulturne i druge događaje.

Kako bi se upotpunio opseg arhiviranih sadržaja i dobila što potpunija slika hrvatskog web-prostora, Knjižnica je u suradnji sa Srcem, po prvi put obavila cjelovito harvestiranje (prikupljanje) sadržaja objavljenih na nacionalnoj domeni hr.

Harvestiranjem nacionalne internetske domene prikupljeni su i arhivirani javno dostupni sadržaji sa svih aktivnih web-sjedišta u domenama .hr, .com.hr i .iz.hr. Harvestiranje je provedeno u vremenu od 18. srpnja 2011. do 18.kolovoza 2011. godine. Kao ishodišna točka korišten je popis aktivnih domena koji je Knjižnici dostavila CARNet-ova DNS služba.

Ukupno je prikupljeno i arhivirano više od 56 milijuna datoteka ukupne veličine od preko 3.1 TB. Arhiviranoj građi u prvo će vrijeme pristup biti omogućen samo unutar Nacionalne i sveučilišne knjižnice.

Harvestiranje je provedeno korištenjem programske podrške otvorenog koda uz uporabu računalnih resursa Srca.

Vezane vijesti

U Zagrebu prvi TeachMeet susret uživo

U Zagrebu prvi TeachMeet susret uživo

U Zagrebu će se 21. travnja 2012. u organizaciji udruge Samo jedan klik i CARNetove E-learning akademije održati prvi TeachMeet susret u Hrvatskoj… Više

Komentari

Ovaj članak nema komentara.

Nije moguće komentirati članke starije od tri mjeseca.

Najnovije

Izbor urednika