Til kunder: slik bruker du Metadataredigering
Metadataredigering er et verktøy for å registrere og redigere metadata om de digitaliserte arkivenhetene. Metadataene brukes i Digitalarkivets søk og visninger.
Digitalarkivets søk og visninger er avhengig av gode metadata for å fungere optimalt. Kataloginformasjon som hentes automatisk fra Arkivportalen, er sentrale metadata, men kataloginformasjonen er ikke tilstrekkelig i alle sammenhenger. Derfor må supplerende metadata registreres i Metadataredigering, og enkelte felt er obligatoriske å fylle ut før publisering. For digitalisert arkivmateriale som ikke finnes i Arkivportalen, er det desto viktigere å legge inn metadata i Metadataredigering.
Kildesøk og arbeidslister
På hovedsiden i Metadataredigering finner man forhåndsdefinerte arbeidslister og kildesøk. Ei arbeidsliste er ei liste over kilder (arkivenheter) hvor det foreligger et behov for å redigere metadataene. Egendefinerte arbeidslister er opprettet av en koordinator, som har gitt én eller flere operatører tilgang til å jobbe med dem. I tillegg er det arbeidslister fra Arkivdigitalisering, som blir automatisk generert når en ny jobb opprettes i Arkivdigitalisering. På samme måte som med egendefinerte arbeidslister, er det en koordinator som må gi operatørene tilgang til å jobbe med arbeidslistene fra Arkivdigitalisering. En kilde (arkivenhet) kan inngå i flere arbeidslister.
Med kildesøket kan man søke fram kilder og opprette ad hoc arbeidslister for umiddelbare behov. I kildesøket kan man søke på Asta-sti, kildens tittel og kildeid (kildens sekssifrede id/løpenummer i Digitalarkivets database). Av disse er Asta-sti og kildens tittel mest relevant å søke på, men søk på kildens tittel forutsetter naturligvis at en tittel er registrert på forhånd.
Søk på Asta-sti fungerer som et BEGYNNER PÅ-søk. Det vil si at man ikke trenger å taste inn en fullstendig Asta-sti; et søk på RA/S-5 gir treff på Asta-stier som RA/S-5014/C/Ca/L0001 og RA/S-5892/K/L0043/0001. Søket er altså velegnet til å finne fram til alle kilder fra ett og samme arkiv eller fra én og samme arkivserie, i tillegg til at man kan søke fram én konkret kilde ved å søke på en fullstendig Asta-sti.
Søk på kildens tittel fungerer i utgangspunktet som et ELLER-søk. Prinsippene for søket er som følger:
- Søk på møteprotokoll skedsmo vil gi treff på alle kilder som inneholder møteprotokoll eller skedsmo.
- For å søke på en frase, kan man bruke hermetegn. Søk på "Nord-Gudbrandsdal sorenskriveri, Skjåk tinglag" gir bare treff på kilder som har akkurat denne frasen i metadataene.
- Spesialtegn ignoreres og blir behandlet som mellomrom, slik at søk på aurskog/høland vil gi treff på alle kilder som inneholder aurskog eller høland. Unntaket er spesialtegn som fungerer som operatorer, jf. påfølgende kulepunkter.
- Tegnet + (pluss) foran et ord indikerer at ordet må være med for å gi treff, dvs. at søket gjøres om til et OG-søk for de ordene som har en +. Søk på +møteprotokoll +skedsmo gir bare treff på kilder som inneholder både møteprotokoll og skedsmo.
- Tegnet - (minus) foran et ord indikerer at søket ikke gir treff på kilder som har ordet i Asta-sti eller tittel. Søk på skedsmo -lillestrøm gir treff på kilder som inneholder skedsmo, forutsatt at kildene ikke også inneholder lillestrøm. Vær oppmerksom på at søk på vest-agder vil ekskludere alle kilder som inneholder agder. Ønsker man å søke etter fylket Vest-Agder, vil det være best å søke med hermetegn: "vest-agder"
- Tegnene ( ) grupperer søkebegrep. Søk på +møteprotokoll +(skedsmo nittedal) vil gi treff på kilder som inneholder både møteprotokoller og enten skedsmo eller nittedal.
Søk på kildeid må alltid innledes med kid:, etterfulgt av ei kommaseparert liste (uten mellomrom) over kildeid-er eller sekvenser av kildeid-er. Noen eksempler:
- kid:105000
- kid:105000,105814,106712
- kid:105000-105008
- kid:105000,105814-105817,106712,106744-106748,106795
Alle søkeresultatene kan i tillegg filtreres med valgene som ligger bak knappen Filtrer. Man kan da bl.a. avgrense til kilder som er registrert med spesifikke emneord (emneknagger) og/eller kilder som er tilknyttet spesifikke kommuner, samt at man skille mellom publiserte og upubliserte kilder og mellom digitaliserte og ikke digitaliserte kilder. Ved å velge publiseringsstatus upublisert og filstatus til digitalisert i filteret, vil det straks gjennomføres et søk som finner alle ferdig digitaliserte kilder som ennå ikke er publiserte. Dette kan være nyttig for å unngå at ferdig digitaliserte kilder blir glemt og aldri publisert.
Når søket er gjennomført, kan man markere de ønskede kildene og klikke på Start redigering for å opprette ei ad hoc arbeidsliste.
Når en koordinator skal opprette ei egendefinert arbeidsliste, er det et tilsvarende kildesøk som gir anledning til å plukke ut hvilke kilder som skal være med i arbeidslista. Koordinatoren må gi arbeidslista et navn og gi seg selv og/eller andre operatører tilgang til å jobbe med arbeidslista. I det valgfrie feltet Beskrivelse av arbeid kan koordinatoren legge inn en instruks om hva slags metadataarbeid som ønskes utført, f.eks. "legg til emneord og 1947-kommuner". Koordinatoren har tilgang til å redigere eller slette ei arbeidsliste ved å klikke på de tre vertikalt ordnede prikkene til høyre for arbeidslistas navn.
Redigering av metadata
For å starte selve metadataredigeringa, åpner man ei egendefinert arbeidsliste eller ei arbeidsliste fra Arkivdigitalisering blant arbeidslistene som man har fått tildelt (valget Tildelt meg). Man kan se øvrige Tilgjengelige lister, men disse kan man ikke redigere uten å få dem tildelt av koordinator. Koordinator kan tildele arbeidslister og i tillegg opprette ad hoc arbeidslister.
Arbeidslista gir et kort sammendrag av kildene i lista. For å komme til redigeringsmodus, klikker man på blyanten til høyre. I redigeringsmodus kan man navigere mellom kildene i arbeidslista ("Kilde x av y" øverst til høyre) eller returnere til kildeoversikten (øverst til venstre). I det følgende gir vi anvisninger om hvordan de forskjellige metadatafeltene skal/bør fylles ut og hva de brukes til.
Kategori (kildekategori) er et obligatorisk metadatafelt som først og fremst benyttes i kildesøket Finn kilde. Kildekategori-systemet skriver seg tilbake til Digitalarkivets barndom, da innholdet i Digitalarkivet besto av kilder som enkelt lot seg kategorisere, som folketellinger, kirkebøker (ministerialbøker, klokkerbøker osv.), panteregistre og pantebøker. Over tid har kildekategori-systemet blitt nokså infløkt, og det har vist seg mer og mer uhensiktsmessig. På sikt er det intensjonen å fase det ut til fordel for det mer fleksible emneord-systemet (se nedenfor). Inntil videre er det imidlertid for mye funksjonalitet som er avhengig av at kildekategori er definert, og derfor kan ikke dette metadatafeltet enkelt fases ut. I stedet er det obligatorisk å fylle ut.
- Man må unngå å velge kategorier merket med kirkebøker, rettergang og straff, skiftemateriale og tinglysingsmateriale, da disse tilhører spesielle søkeinnganger forbeholdt Arkivverket. Bruk av disse kategoriene vil medføre feilmeldinger i enkelte søk og visninger.
- Kategorier merket folketellinger og manntall må kun benyttes dersom kildene er definert som folketellinger allerede ved oppretting av oppdrag i Arkivdigitalisering. Blant de sistnevnte er det sannsynligvis kategorien kommunale folketellinger som er relevant utenfor Arkivverket. Annen bruk av disse kategoriene vil medføre feilmeldinger i enkelte søk og visninger.
- Blant de øvrige kategoriene kan det velges fritt, men en del kategorier er tiltenkt arkivmateriale som i utgangspunktet er unikt for Arkivverket, som danske kanselli, norske innlegg og fogderegnskaper. Noen kategorier er forholdsvis intetsigende, som bok, dokument og protokoll, og disse anbefales ikke brukt. Arkivverket har selv i økende grad benyttet sekkekategorien annen kilde.
Geografisk tilhørighet pr. 1947 er et obligatorisk metadatafelt som benyttes i kildesøkene i både Finn kilde og spesialinngangen for skanna arkiver. Hensikten er å gi brukerne en mulighet til å søke etter kilder på grunnlag av hvilke geografiske områder kildene omfatter, uten at de trenger å kjenne til hvilket arkiv kildene tilhører. Kommuneinndelinga pr. 1947 er da valgt av flere årsaker:
- Pr. 1947 var antallet kommuner i Norge nær det høyeste gjennom tidene, og det geografiske søket blir derfor mest mulig finmasket og presist. Selv om mange av kommunene forsvant fra kommunekartet som følge av sammenslåinger på 1960-tallet og senere, tør kommunenavnene i de fleste tilfeller fremdeles være godt kjent som f.eks. bygdenavn. I nåværende Larvik kommune er de gamle kommunenavnene Tjølling, Brunlanes, Stavern, Hedrum og Lardal velkjente lokalt, og formodentlig kan også brukere fra andre deler av landet med interesse for Larvik-distriktet relatere seg til de gamle kommunenavnene.
- Skulle det geografiske søket vært basert på dagens kommuner, ville brukeren kunne få mange irrelevante treff. En bruker med interesse for Kråkerøy, ville måtte søke på Fredrikstad, noe som samtidig ville gi treff på kilder vedrørende Borge, Torsnes, Rolvsøy og Onsøy.
- Arkivmaterialet som er aktuelt for tilgjengeliggjøring i Digitalarkivet, er stort sett eldre enn 1947 og er derfor skapt i geografisk-administrative enheter som er vanligvis enkelt kan relateres til kommuneinndelinga pr. 1947.
Når man skal fylle ut geografisk tilhørighet pr. 1947, skal man se for seg det geografiske området som kilden dekker og spørre seg selv hvilke kommuner pr. 1947 som kildens geografiske område tilsvarer, helt eller delvis. Noen eksempler:
- En møteprotokoll for Oslo bystyre fra 1960 skal registreres med 0218 Aker og 0301 Oslo, ettersom 1947-kommunen Aker ble innlemmet i Oslo kommune i 1948.
- En møteprotokoll for Ullern arbeidersamfunn fra 1970 skal registreres med 0218 Aker, ettersom Ullern i 1947 var en del av Aker kommune. Det er altså ikke relevant at Ullern i 1970 tilhørte Oslo kommune.
- En møteprotokoll for Skedsmo formannskap fra 1890 skal registreres med 0230 Lørenskog, 0231 Skedsmo og 0232 Lillestrøm, fordi Lørenskog kommune og Lillestrøm kommune ble skilt ut fra Skedsmo kommune i 1908.
- Ei adressebok for Vestfold fylke skal registreres med samtlige kommuner i Vestfold pr. 1947, så sant det er grunn til å tro at alle kommuner er representerte.
- Dersom en kilde ikke kan relateres til én eller flere konkrete kommuner, skal valget 0000 Hele Norge benyttes. Dette kan f.eks. gjelde foreningsprotokoller på nasjonalt nivå.
- Hvorvidt man skal ta hensyn til grensereguleringer før 1947, må vurderes fra sak til sak. Det var for eksempel større grensereguleringer mellom Aker og Oslo i 1859 og 1878, slik at kilder som vedrører Aker kommune før 1878, også må sies å vedrøre 1947-kommunen Oslo. På den annen side kan det være hensiktsmessig å se bort fra mindre grensereguleringer, hvor bare noen få eiendommer har skiftet kommunetilhørighet.
Startår og sluttår samt tilhørende felt for måneder og dager benyttes i kildesøkene i både Finn kilde og spesialinngangen for skanna arkiver. Feltene fylles automatisk ved import fra Arkivportalen, dersom oppdraget er opprettet i Arkivdigitalisering med kobling til Arkivportalen. Feltene er likevel redigerbare. Der hvor startår og sluttår ikke er automatisk utfylt, bør feltene fylles ut, eventuelt med omtrentlige årstall dersom nøyaktige årstall ikke er kjent. Kilder uten registrert startår og/eller sluttår vil nemlig bli ekskludert fra kildesøk hvor startår og/eller sluttår er angitt av brukeren.
Tittel, samt tittel nynorsk og tittel engelsk er metadatafelt som benyttes i kildesøket Finn kilde. Tittel er obligatorisk å fylle ut, mens tittel nynorsk og tittel engelsk er valgfrie felt. Dersom disse feltene ikke er fylt ut for en kilde, og en bruker som har valgt nynorsk eller engelsk som språk på digitalarkivet.no får treff på denne kilden, vil innholdet i feltet tittel vises.
Det følger av dette at tittel som hovedregel skal være formulert på bokmål. Ettersom det ikke finnes tittelfelt for samisk, kan det imidlertid være relevant å inkludere enkelte samiske nøkkelord, f.eks. "Møteprotokoll for Sametinget / Sámediggi".
Hva bør inkluderes i en tittel? Kildens beskrivelse fra arkivkatalogen kan være et greit utgangspunkt, men da trefflista i Finn kilde ikke viser den konteksten som ligger i katalogbeskrivelsene på overordnede nivåer, kan det være hensikstmessig å inkludere hele eller deler av seriebeskrivelsen og eventuelt kildens nummer i serien. Man bør også inkludere kildens ytterår, slik at brukeren enkelt kan orientere seg blant mange kilder av samme type. IKA Kongsberg har laget forbilledlige titler for møtebøkene i arkivet Seljord formannskap.
Av praktiske årsaker er det en begrensning på 150 tegn for tittel-feltene.
Emneord er et valgfritt felt, men det bør fylles ut med ett eller flere relevante emneord (også kalt emneknagger). Hensikten er å gi brukerne en mulighet til å søke etter kilder på grunnlag av hvilke emner kildene omfatter, uten at de trenger å kjenne til hvilket arkiv kildene tilhører. Det foreligger et nokså omfattende utvalg av emneord, men ikke alle felt er dekket like godt, og i noen grad forekommer unødvendig overlapping. Det var derfor Arkivverkets ambisjon å foreta en full gjennomgang av emneordene i forkant av at Digitalarkivet ble lansert som selvbetjent publiseringsplattform, men det ble det ikke tid til. Da det ikke er ønskelig å revidere utvalget av emneord gjentatte ganger, håper Arkivverket innen ikke altfor lang tid å komme tilbake til en revisjon i samarbeid med brukerne av Digitalarkivet som selvbetjent publiseringsplattform.
Av hensyn til Digitalarkivets brukere er det viktig med en mest mulig enhetlig bruk av emneord. Vi skal her gi noen grunnleggende regler for bruk av emneord, men dette er ikke på langt nær et uttømmende regelsett.
- Alle kilder skal merkes med enten Statlige arkiver, Kommunale arkiver eller Privatarkiver.
- Kilder som merkes med emneordet Privatarkiver, skal i tillegg merkes med enten Personarkiver, Organisasjonsarkiver og foreningsarkiver eller Bedriftsarkiver.
- Det kan være relevant å ta med emneord som angir kildetype, f.eks. Adressebøker, Dagbøker, Kopibøker, Møteprotokoller, Journaler og Sakarkiv.
- Det kan være relevant å ta med emneord som angir samfunnssektor, f.eks.Helsevesen, Skolevesen, Landbruk, Politi og lensmenn og Formannskap og kommunestyre.
- Det finnes også emneord for en del næringer (f.eks. Kobberverk og Tekstilindustri) og yrkesgrupper (f.eks. Soldater og offiserer og Sjømenn og sjøfolk).
Arkivverket oppfordrer til å gjennomgå og bli kjent med utvalget av søkeord. Det vil også være nyttig å se på hvilke emneord som tidligere har blitt brukt om tilsvarende kilder. Dette kan man se på hver enkelt kildes informasjonsside, samt i kildeinformasjonsfeltene som er gjemt bak informasjonsikonet (i) i visningene, og som også vises på hver enkelt kilde innholdsside. Her er noen eksempler:
- Møtebøker for formannskap/kommunestyre: Kommunale arkiver, Møteprotokoller og Formannskap og kommunestyre
- Branntakstprotokoller: Branntakster, Forsikring og assuranse, Hus og bygninger og Eiendom, kombinert med enten Statlige arkiver, Kommunale arkiver eller Privatarkiver (og Bedriftsarkiver), eventuelt også kombinert med enten Politi og lensmenn, Magistrater eller Dommere og skrivere, avhengig av protokollens proveniens.
- Dekksdagbok fra båt/skip tilhørende et privat rederi: Privatarkiver, Bedriftsarkiver, Dagbøker, Sjøfart og Båter og skip.
Merknad som vises i kildeinformasjon er et valgfritt felt. Innholdet vises som merknad på hver enkelt kildes informasjonsside, samt i kildeinformasjonsfeltene som er gjemt bak informasjonsikonet (i) i visningene, og som også vises på hver enkelt kilde innholdsside.
Typiske merknader kan være praktisk informasjon om sider/oppslag som mangler, enten i arkivet eller i den digitale versjonen, feilinnbinding eller liknende, små anekdoter ("Protokollen ble funnet på loftet hos lensmannens enke i 1987.") og andre forhold som brukeren kan ha nytte av å vite.
Merknad som vises i treffliste på media.digitalarkivet.no er også et valgfritt felt. Innholdet vises i 4. kolonne i trefflista for skanna arkiver og er ment for kortfattet informasjon som skal gjøre det enklere for brukerne å finne fram til riktig kilde/arkivenhet. Dette vil ofte kunne være et utdrag av merknaden som vises i kildeinformasjonen. For Arkivverket har dette feltet bl.a. vært til nytte for vise hvilke gårdsnummer hvert enkelt panteregister i en større serie inneholder.
Masseredigering av metadata
Svært ofte vil metadataelementer være felles for flere kilder (arkivenheter). F.eks. vil en serie med møteprotokoller ha samme kildekategori, geografisk tilhørighet og emneord. Det er derfor laget funksjonalitet for å endre metadataelementer for mange kilder i én operasjon.
I ei arbeidsliste kan man markere én eller flere kilder. Da vil fem valg bli synlige i øvre del av skjermbildet:
- Med Avpubliser kan man avpublisere samtlige markerte kilder. Vi gjør oppmerksom på at vi generelt råder til å finne andre løsninger enn å avpublisere, da avpubliseringer vil medføre at "permanente lenker" til bildefilene vil gi feilmelding. Vi gjør spesielt oppmerksom på at det ikke er nødvendig å avpublisere, dersom man ønsker å gjøre endringer i metadata.
- Med Publiser kan man publisere samtlige markerte kilder.
- Med Endre status kan man endre metadatastatusen for samtlige markerte kilder. Kildene kan ha status "Ikke påbegynt", "Under arbeid", "Ventende" (på godkjenning) og "Behandlet" (ferdig). Metadatastatus kan være nyttig i tilfeller hvor metadataarbeidet er fordelt på flere personer, og der hvor koordinatoren vil godkjenne metadataarbeidet før publisering.
- Med Endre metadata kan man endre metadata i et utvalg av felt for samtlige markerte kilder. Man velger ført hvilke felt man ønsker å endre, og deretter fyller man ut feltene med ønsket tekst. Merk at denne teksten vil erstatte all tekst som måtte stå i feltene fra før. Unntaket er de to feltene geografisk tilhørighet og emneord, hvor man kan legge til og fjerne kommuner/emneord, uavhengig av hvilke kommuner/emneord som er registrert fra før.
- Med Søk og erstatt kan man skifte ut tekstfraser i de tre tittelfeltene og de to merknadsfeltene. Man velger først hvilke felt man vil bruke funksjonen på, og deretter lager man én eller flere "regler" for hvert enkelt felt. Til høyre for hver "regel" er det et søppelbøtteikon for å slette den og et plusstegn for å lage en ny "regel". Væ oppmeksom på at man bare kan søke og erstatte hele ord. Søk og erstatt gjennomføres med knappen "Gjennomfør endringer". Man kan eventuelt bruke knappen "Avbryt", hvis man likevel ikke vil gjøre endringer. Funksjonen kan f.eks. være nyttig for korrigere en gjennomgående skrivefeil, eller for å tilpasse metadataene til en revidert og endret katalog. På samme måte som når man benytter søk og erstatt i Word eller andre teksteditorer, må man være varsom med søkefrasen, slik at man ikke endrer mer enn man ønsker. Endringene kan ikke automatisk reverseres.
Spesielle forhold å være oppmerksom på
- NB angående folketellinger: Et par særegne metadatafelt for folketellinger er ikke tilgjengelige i Metadataredigering. Arkivverket er behjelpelig med å fylle ut disse feltene direkte i databasen. Ta kontakt.
- NB angående kilder som ikke finnes i Arkivportalen: For slike kilder må katalogmetadata registreres manuelt, noe det ikke er støtte for i Metadataredigering. Arkivverket er behjelpelig med dette. Ta kontakt.
Diskusjon og erfaringsutveksling
Arkivverket ser for seg at diskusjonsforumet for Digitalarkivet som nasjonal publiseringsplattform kan brukes til diskusjon og utveksling av erfaringer omkring metadataregistrering.