Samla in informationen regelbundet för att säkerställa bevarandet
För att innehållet på webbplatsen ska kunna bevaras och finnas tillgängligt även på lång sikt måste det samlas in och sparas ner från webbplatsen regelbundet. Denna riktlinje är en av fem som gäller arkivering, och berör framför allt myndigheter.
Rekommendationer för regelbunden insamlingLänk hit
- Kombinera olika insamlingsmetoder eftersom ingen metod är heltäckande
- Gör insamling så ofta att information som ska bevaras inte går förlorad mellan insamlingstillfällena.
Kombinera flera insamlingsmetoder, eftersom ingen metod är heltäckandeLänk hit
Allt som en gång publicerats på en myndighets webbplats är allmänna handlingar om det inte finns stöd för gallring (se R47, undvik oavsiktlig gallring vid ändringar och uppdateringar). Det gäller även sidor med dynamiskt innehåll som fristående databaser och registerinformation, avpublicerad information och sidor som kräver inloggning. En vanlig insamlingsmetod är att använda en så kallad webbcrawler men eftersom exempelvis dynamiskt innehåll inte kan fångas upp med en webbcrawler bör man alltid kombinera olika insamlingsmetoder för få en heltäckande insamling. Vilka metoder som ska användas och i vilken omfattning beror på hur webbplatsen är uppbyggd, vilken information den består av, vad som ska gallras och när.
Här rekommenderar vi en kombination av insamlingsmetoder, men varje myndighet måste själv planera och skapa rutiner för vilka metoder som ska tillämpas, vad som ska samlas in, hur ofta, och av vem. Alla beslut bör grunda sig på en utredning som myndigheten bör genomföra enligt riktlinje Planera för långsiktigt bevarande redan vid utveckling av webbplatsen (R45).
Rekommendationerna utgår från Riksarkivets föreskrifter om elektroniska handlingar, RA-FS 2009:1 och RA-FS 2009:2, som är bindande för statliga myndigheter. För kommuner och landsting gäller först och främst fullmäktiges arkivreglemente, men Riksarkivets föreskrifter kan fungera rådgivande.
Samla systematiskt
Använd en webbcrawler för att regelbundet samla in ögonblicksbilder av hela eller delar av webbplatsen. Samla inte in externa länkar, men dokumentera vart de ledde.
Konvertera dokument-, bild-, ljud- och videofiler till lämpliga bevarandeformat innan insamlingen med webbcrawlern startar. Dessa filer ska helst vara i bevarandeformat redan vid publicering (se Publicera i format som är lämpade för långsiktigt bevarande (R46)).
Samla in fristående databaser och register som är sökbara på webbplatsen, till exempel ett ärendehanteringssystem. Använd ett lämpligt bevarandeformat för databaser och register (RA-FS 2009:2, 3 kap, 1 §). Spara även databasens grafiska gränssnitt genom att samla in statiska versioner i lämpligt bevarandeformat för webbsidor (RA-FS 2009:2, 3 kap, 9 §). Dokumentera också relationen mellan det grafiska gränssnittet och den underliggande databasen.
Fånga upp de ändringar som ska bevaras. Det kan man göra genom att redan i samband med publiceringen av en sida, och varje ny version av sidan, spara ner en statisk version i lämpligt bevarandeformat för webbsidor (RA-FS 2009:2, 3 kap, 9 §) med tillhörande metadata. Det går att ordna med automatik så det inte tar tid i anspråk i den dagliga hanteringen. Information som ska gallras behöver inte samlas in (se Undvik oavsiktlig gallring vid ändringar och uppdateringar (R47)).
I insamlingen ingår att:
- Kontrollera att gallring inte kommer att ske vid insamlingen. Se Undvik oavsiktlig gallring vid ändringar och uppdateringar (R47)).
- Överför filer till ett system för bevarande (e-arkiv) eller bevarandeexemplar (RA-FS 2009:1).
- Kontrollera att den insamlade informationen i alla delar är dokumenterad (RA-FS 2009:1, 5 kap).
För- och nackdelar med en webbcrawler
En webbcrawler är ett verktyg som kan samla in och spara ner en statisk avbild av en webbplats. Insamlingen sker från användarens sida, klientsidan. En förutsättning för att insamlingen ska fungera är att webbplatsen följer standarder och att tilläggsprogram undviks så långt det är möjligt.
Fördelarna med en webbcrawler är att den ger en övergripande ögonblickbild av webbplatsen. Länkarna kommer fortfarande vara klickbara i den nedsparade versionen, och utseendet och strukturen kommer vara desamma som på den aktiva webbplatsen.
Nackdelen är att allt innehåll på en webbplats inte kan samlas in med en webbcrawler. Det är till exempel svårt eller omöjligt att samla in:
- Sidor med dynamiskt innehåll som fristående databaser och register. I den nedsparade versionen kommer det inte vara möjligt att söka i till exempel ett ärendehanteringssystem eller adressregister som lagts ut på webbplatsen.
- Avpublicerad information. Information som både hunnit publiceras och därefter avpublicerats mellan insamlingstillfällena, samlas inte in eftersom insamlingen sker från klientsidan.
- Sidor som kräver inloggning. För att de ska samlas in krävs att webbcrawlern får behörighet till sidorna, men eftersom det ofta är webbplatsägaren som gör insamlingen brukar det inte vara något problem.
FördjupningLänk hit
Riksarkivets föreskrifter
- Mer information om Riksarkivets generella och myndighetsspecifika föreskrifter, RA-FS och RA-MS, finns på Riksarkivets webbplats.
- RA-FS 2009:1 – Riksarkivets föreskrifter och allmänna råd om elektroniska handlingar
- RA-FS 2009:2 – Riksarkivets föreskrifter och allmänna råd om tekniska krav för elektroniska handlingar
Bevarande och insamlingsmetoder
- Brown, Adrian (2008), Archiving websites. A practical guide for information management professionals. Bodmin, Cornwall, Storbritannien.
- CODA-WEBB. Slutrapport 2009-05-05. LDB-centrum (pdf-fil, nytt fönster)
- Bevara webbplatser – information på Riksarkivets webbplats.
- Att tänka på vid IT-leveranser av webbsidor – Lathund för digitalt långtidsbevarande av webbsidor. Enheterna Elektroniska arkiv och Teknikberoende medier (2008-02-11), Riksarkivet.
- Rapport angående elektroniska arkiv (e-arkiv), bevarandeexemplar och system för bevarande. Rapport 2008-12-11, Riksarkivet, dnr RA 22-2007/3552 (pdf-fil, nytt fönster)
Gallring
- Om gallring – från utredning till beslut. Rapport 1999:1. Riksarkivet (pdf-fil, nytt fönster)
- Gallringsråd för kommuner och landsting finns på Samrådsgruppen för kommunala arkivfrågors webbplats.
Kommentarer till denna riktlinje
Kommentarer (7)
Länken till gallringsråden från Samrådsgruppen fungerar inte längre.
Tackar för det, det var flera länkar som slutat fungera och de ska vara uppdaterade nu.
Ser att informationen förefaller vara rättså gammal, vad i detta stämmer fortsatt?
Jag ska be Riksarkivets representant i referensgruppen att granska sidan.
Har någon från Riksarkivets referensgrupp granskat informationen på sidan sedan 2017?
Det står fortfarande att sidan är ”Senast uppdaterad: 2014-09-24”. Obra om det är meningen att det ska vara en vägledning till t.ex. oss kommunala diversearbetare.
Det här är nog ett ämne där vi inte sett något behov av att ändra i artikeln. Det är annat med mer teknikspecifika ämnen där utveckling hela tiden pågår. Det här är ett arbetssätt som är lika aktuellt i dag som det var för sju år sedan.
Skriv kommentar
Funktionen för att skriva kommentarer använder kakor. Läs mer om kakorna. Enbart förstapartskakor används. Vill du inte godkänna kakor så kan du ställa in din webbläsare att blockera dem. Funktionen går ändå att använda men den kommer då att ställa vissa frågor om och om igen, och kan inte förhandsvisa dina kommentarer.
För att kunna erbjuda denna funktion behöver vi lagra de uppgifter som du själv skriver in (namn, e-post, eventuell webbadress och själva kommentaren) samt IP-nummer. Den rättsliga grunden är samtycke och informationen ligger kvar så länge DIGG bedömer att den tillför förståelse för riktlinjen, eller tills du begär att den raderas. Läs mer om DIGGs behandling av personuppgifter.