Riktlinje nr 48 Prio 3

Samla in informationen regelbundet för att säkerställa bevarandet

För att innehållet på webbplatsen ska kunna bevaras och finnas tillgängligt även på lång sikt måste det samlas in och sparas ner från webbplatsen regelbundet. Denna riktlinje är en av fem som gäller arkivering, och berör framför allt myndigheter.


Rekommendationer för regelbunden insamlingLänk hit


Kombinera flera insamlingsmetoder, eftersom ingen metod är heltäckandeLänk hit

Allt som en gång publicerats på en myndighets webbplats är allmänna handlingar om det inte finns stöd för gallring (se R47, undvik oavsiktlig gallring vid ändringar och uppdateringar). Det gäller även sidor med dynamiskt innehåll som fristående databaser och registerinformation, avpublicerad information och sidor som kräver inloggning. En vanlig insamlingsmetod är att använda en så kallad webbcrawler men eftersom exempelvis dynamiskt innehåll inte kan fångas upp med en webbcrawler bör man alltid kombinera olika insamlingsmetoder för få en heltäckande insamling. Vilka metoder som ska användas och i vilken omfattning beror på hur webbplatsen är uppbyggd, vilken information den består av, vad som ska gallras och när.

Här rekommenderar vi en kombination av insamlingsmetoder, men varje myndighet måste själv planera och skapa rutiner för vilka metoder som ska tillämpas, vad som ska samlas in, hur ofta, och av vem. Alla beslut bör grunda sig på en utredning som myndigheten bör genomföra enligt riktlinje Planera för långsiktigt bevarande redan vid utveckling av webbplatsen (R45).

Rekommendationerna utgår från Riksarkivets föreskrifter om elektroniska handlingar, RA-FS 2009:1 och RA-FS 2009:2, som är bindande för statliga myndigheter. För kommuner och landsting gäller först och främst fullmäktiges arkivreglemente, men Riksarkivets föreskrifter kan fungera rådgivande.

Samla systematiskt

Använd en webbcrawler för att regelbundet samla in ögonblicksbilder av hela eller delar av webbplatsen. Samla inte in externa länkar, men dokumentera vart de ledde.

Konvertera dokument-, bild-, ljud- och videofiler till lämpliga bevarandeformat innan insamlingen med webbcrawlern startar. Dessa filer ska helst vara i bevarandeformat redan vid publicering (se Publicera i format som är lämpade för långsiktigt bevarande (R46)).

Samla in fristående databaser och register som är sökbara på webbplatsen, till exempel ett ärendehanteringssystem. Använd ett lämpligt bevarandeformat för databaser och register (RA-FS 2009:2, 3 kap, 1 §). Spara även databasens grafiska gränssnitt genom att samla in statiska versioner i lämpligt bevarandeformat för webbsidor (RA-FS 2009:2, 3 kap, 9 §). Dokumentera också relationen mellan det grafiska gränssnittet och den underliggande databasen.

Fånga upp de ändringar som ska bevaras. Det kan man göra genom att redan i samband med publiceringen av en sida, och varje ny version av sidan, spara ner en statisk version i lämpligt bevarandeformat för webbsidor (RA-FS 2009:2, 3 kap, 9 §) med tillhörande metadata. Det går att ordna med automatik så det inte tar tid i anspråk i den dagliga hanteringen. Information som ska gallras behöver inte samlas in (se Undvik oavsiktlig gallring vid ändringar och uppdateringar (R47)).

I insamlingen ingår att:

För- och nackdelar med en webbcrawler

En webbcrawler är ett verktyg som kan samla in och spara ner en statisk avbild av en webbplats. Insamlingen sker från användarens sida, klientsidan. En förutsättning för att insamlingen ska fungera är att webbplatsen följer standarder och att tilläggsprogram undviks så långt det är möjligt.

Fördelarna med en webbcrawler är att den ger en övergripande ögonblickbild av webbplatsen. Länkarna kommer fortfarande vara klickbara i den nedsparade versionen, och utseendet och strukturen kommer vara desamma som på den aktiva webbplatsen.

Nackdelen är att allt innehåll på en webbplats inte kan samlas in med en webbcrawler. Det är till exempel svårt eller omöjligt att samla in:

  1. Sidor med dynamiskt innehåll som fristående databaser och register. I den nedsparade versionen kommer det inte vara möjligt att söka i till exempel ett ärendehanteringssystem eller adressregister som lagts ut på webbplatsen.
  2. Avpublicerad information. Information som både hunnit publiceras och därefter avpublicerats mellan insamlingstillfällena, samlas inte in eftersom insamlingen sker från klientsidan.
  3. Sidor som kräver inloggning. För att de ska samlas in krävs att webbcrawlern får behörighet till sidorna, men eftersom det ofta är webbplatsägaren som gör insamlingen brukar det inte vara något problem.

FördjupningLänk hit

Riksarkivets föreskrifter

Bevarande och insamlingsmetoder

Gallring



Kommentarer (4)