Dansk Data Arkiv

Kikkomiteen – møde 12-04-2016

Deltagere: Nanna Floor Clausen (NC) referent, John Gregers Hvidkjær (JGH) Begge fra Rigsarkivet, Odense. Jens Karl Rasmussen (JKR) og Ove Kühn (OK) - for indtasterne, Svend Erik Christiansen (SEC) KIP-grundlægger mm, Jens V. Olsen (JVO) KIIP-udvikler, Hans Jørgen Marker (HJM) KIP-grundlægger mm, Hans Chr. Johansen (HCJ) forsker, Jesper Skov (JS) DIS-Danmark
Desuden: Allan Vestergaard, Rigsarkivet, Kristin Brøgger, Rigsarkivet og observatør på mødet
Afbud: Michael Dupont (MD) DIS-Danmark

Dagsorden:

  • 1. Godkendelse af dagsorden
  • 2. Status fra Rigsarkivet Odense
  • 3. Status for FT1860 og FT1901
  • 4. Status for øvrige folketællinger
  • 5. Rettigheder til de indtastede data
  • 6. Forslag vedr. brug af DDD-databasen
  • 7. Status for KIIP (FT og KB)
  • 8. Samarbejdet med Danish Family Search
  • 9. Samarbejdet med Dis-Danmark / Kildeportalen
  • 10. Linkning af FT
  • 11. Næste møde
  • 12. Eventuelt

Ad 1 Godkendelse af dagsorden
Dagsordenen blev godkendt og tilpasset at JS først kunne komme kl. 11.30.

Ad 2 Status fra Rigsarkivet Odense

Vi modtager stadig data, og siden december er der indkommet godt 300.000 poster. I alt er der nu 18.3 mio poster. På sidste møde blev der fremsat forskellige ønsker, og de burde være iværksat alle sammen: ekstra link til DIS-kort over amter og til hjælpeteksterne og desuden er det blevet tydeligt, hvilke databaser der indgår i den fælles søgning på siden ’Andre databaser’.
NC har deltaget i konferencen ESSHC: European Social Science History Conference, der afholdes hvert andet år. NC bidrog med et paper i sessionen: ’Non-nuclear household’ om primært enker og deres husstande.
Projektet ’Multigenerationsregister’ skal her den 20. april holde et møde for en kommende ’sparringsgruppe’ for projektet. NC deltager som historiker og med baggrund i kendskabet til materialet. Projektet skal have indtastet data for 10 udvalgte sogne i perioden 1901 til 1950. Der er ved at blive udarbejdet et udbudsmateriale. I projektet er det meningen, at man vil benytte KIIP-programmerne til indtastning. Projektet vil aftale nærmere med JVO om en tilretning af programmerne. Det er meningen, at data også vil kunne indgå i DDD.
Et andet muligt kommende projekt, der vil involvere bl.a. vores FTdata er et projekt, der vil skabe et landsdækkende register for folketællinger, kirkebøger, sessionsdata og Rigshospitalets journaler, hvor alle data skal være fra 1700-tallet og frem. Desuden er der en ansøgning under vurdering om en udvidelse af arbejdet med data fra København og Madrid.
Der er leveret data fra Christianshavn til brug i AT-opgaver på Christianshavns Gymnasium. NC planlægger at annoncere mere på RA’s hjemmesiden om muligheden for at bruge FT data i undervisningen.
Den 15. april er der møde i det tidligere omtalte NAPP-projekt (North Atlantic Population Project), hvor fremtidigt samarbejde om især folketællingsdata skal diskuteres. NC er vært ved mødet, der afholdes på Slotsholmen.

Ad 3 Status for FT1860 og FT1901

NC har via Rigsarkivets Brugerside på Facebook udsendt en efterlysning efter frivillige til at indtaste gader i København. Henvendelsen blev læst af mange, men desværre har det endnu ikke udmøntet sig i flere afleveringer af Ft1860 siden sidste møde. Så hvordan kan vi få det sidste indtastet?
SEC omtalte nogle få sogne udenfor København for at høre status på dem. JGH oplyste, at Sankt Annæ Vester Kvarter snarest forventes færdigindtastet, og at samme indtaster vil fortsætte med andre kvarterer i København 1860.
OK havde set på kvaliteten af det indtastede, og mente at alt for lidt var korrekturlæst, og at der var for mange fejl i det indtastede. Det er et kendt problem, at antallet af korrekturlæsere er faldet i de senere år, og at det er svært at engagere folk til at få læst korrektur på deres indtastninger.
SEC vil gerne have udleveret Hjørring og Aalborg amt til brug for kontrol af, om alt er indtastet. NC sender materialet.

FT1901 vokser hurtigere, idet der i år er knap 4 % flere indtastede data, svarende til godt 28.000 poster. Ved mødetidspunktet er der indtastet 43,93 %.

Ad 4 Status for de øvrige FT

For de fleste FT er der kun små fremskridt, det er tydeligt at der er fokus på folketællinger fra perioden efter 1900. Fra i dag er også København 1940 kommet på AO.

Ad 7 Status for KIIP-programmerne

JVO oplyste, at den nye version, der inkluderer FT1940, nu er ’frosset’ og dermed en officiel version. Referencerne til billederne på AO blev diskuteret. Både JS og JVO brugte referencerne i deres programmer og vil gerne have dem vist i søgeresultaterne på DDD. NC ser på det og sender de nødvendige oplysninger videre og tilpasser visningerne på DDD.
Der blev rejst spørgsmålet til RA om der findes en konkordans mellem det gamle og det nye AO? I forbindelse med det nye AO blev der til Kildeportalen for FT1930 udarbejdet en sådan oversigt. Endnu et spørgsmål drejede sig om, hvordan man kan finde de ’gamle’ arkivregistraturer. De blev anvendt før indførelsen af Daisy. NC vil forsøge at undersøge det.
JS og JVO havde et ønske om at kunne gå fra det enkelte billedID (BID) til arkivregistraturoplysninger i Daisy. Dette ønske blev ligeledes omtalt på brugermøde i Viborg.

Ad 8 Samarbejdet med Danish Family Search

DFS har oprettet et administrationsmodul, hvortil JGH og NC har adgang. I dette system kan vi tildele kipnr og hente de færdige indtastninger af både kirkebøger og folketællinger. Systemet er helt nyt, men en kort test ser lovende ud. Der mangler mange indtastninger at blive overført.

Ad 9 Samarbejdet med Kildeportalen

JGH har dags dato hentet alle færdigindtastede landsogne og de er at finde på DDD. NC, JGH og JS finder en løsning på tilretning af indtastninger fra købstæder og København.

Ad 10 Linkning af FT

Siden sidste møde er der på DDDsiderne åbnet for muligheden for at linke personer sammen. Det kan ske både når en bruger ’tilfældigt’ genfinder personer eller det kan ske systematisk ved at udvælge et sogn i 2 eller tre årgange.
I samarbejde med SDU (Syddansk Universitet) har en initiativrig person iværksat en ’konkurrence’ om at finde projekter med mange data, hvortil studerende = gymnasielever kunne skrive et program, der kunne udnytte supercomputeren med mange data. NC bød ind med et projekt om linkning af folketællingsdata. 5 grupper meldte sig, hvoraf de tre gennemførte og en gruppe fik en andenplads og de to andre delte trediepladsen. Det er derpå hensigten/forhåbningen, at vores data kan blive kørt på supercomputeren og flest mulige blive linket. Det er NC’s plan, at de frivillige brugere dermed har en god basis for at tilføje alle de link, der ikke umiddelbart kunne linkes af programmet. Efter mødet har NC talt med initiativtageren og leveret de samlede data til brug for kørsel. Alle tre løsningsforslag vil blive kørt på de samme data og resultatet kan derefter sammenholdes.

Ad 5 Rettigheder til data

AV gennemgik den sag, der tog sit udgangspunkt i et brev fra Dan Nicolaysen i maj 2013 og som blev behandlet samme dag på et KIKmøde. Som bekendt dannede data fra DDD11-dvd’en et solidt grundlag for at etablere Danish Family Search. Efterfølgende har der været forespørgsler og klage over brugen af de data, og det har ført til, at RA har rådført sig med Kammeradvokaten. Kammeradvokaten er kommet med en udlægning af Loven om Ophavsret, der er en kompliceret lovgivning. Brevkorrespondancen er udleveret til alle mødedeltagere og refereres ikke her. Konklusionen på Kammeradvokatens udmelding var, at der ikke er ophavsret til indtastningerne, men nok til de Noter eller ’indtasterkommentarer’ en indtaster har tilføjet på basis af sin ekstra viden. På DDD’s hjemmeside under ’Juridiske forhold’ har der indtil for nylig været en tekst, der tog det nu forkerte udgangspunkt, at en indtaster havde ophavsret til sin indtastning. Den anden udmelding på hjemmesiden kan karakteriseres som et løfte, DDA har givet indtasterne, nemlig at data ikke kunne udleveres til en person/institution til videreformidling. Det sidste er en politisk beslutning.
HJM redegjorde for historikken, der afspejlede at Kildeindtastningsprojektet var placeret i DDA, der arbejdede med forskningsdata.
AV fortsatte redegørelsen med at konstatere, at i svaret til Dan Nicolaysen er det ikke tydeligt, at der kun gives tilladelse til at bruge data fra DDD11-udgivelsen. Pga. denne fodfejl er det ikke muligt for RA at forfølge DFS pga. de ekstra data, brugere har kunnet finde på DFS’s hjemmeside. RA finder det desuden ikke ønskeligt eller konstruktivt at forfølge DFS. I hverken forespørgslen fra Dan Nicolaysen eller i svaret er der nævnt noget om bannerreklamer eller anden kommerciel udnyttelse. Kravet fra RA var, at data skulle stilles frit og gratis til rådighed. Hverken RA eller indtasterne har rettighed til at forlange (sine) data fjernet. Det eneste man måske kan forlange fjernet, er noterne som DFS også publicerer.
AV mente endvidere, at det er ulogisk, at data indtastes hos DFS uden nogen begrænsning i brugen af data, men når data overføres til RA får indtasteren et brev, der indeholder et løfte til indtasteren, der medfører en begrænsning i brugen af data. RA og DFS samarbejder på den måde, at DFS gerne vil have alle sine data og databaser forankrede hos RA.
Komiteen stillede spørgsmål til, hvordan RA forholder sig til, at nogen tjener penge på de frivilliges arbejde.
AV svarede, at KIK i 2013 mente, at gratis adgang opfylder kravet om ikke-kommerciel brug. RA skal selvfølgelig stå fast ved løftet om ikke-kommerciel brug, men der er brug for at ændre løftet. Hvilket førte til det næste punkt.

Ad 6 Forslag om brug af DDD-databasen

AV havde før mødet udsendt et oplæg, der skulle danne baggrund for drøftelsen omkring kommende brug af de indtastede data i DDD. I dag er der to indtastningsprojekter i RA: Kildeindtastningsprojektet/DDD og RA’s CS-portalen (online indtastningsportal). På sigt vil det nok ikke være muligt at bevare to platforme. På CS-platformen har indtasterne afskrevet sig alle rettigheder, og der er online indtastning. Det er der ikke på DDD, og indtasterne er blevet lovet en restriktiv brug af deres indsats.
Der blev spurgt, hvorfor vi så ikke kunne nøjes med eksterne platforme?
Hertil svarede AV, at der skal være fri adgang til data, derfor skal de altid være hos RA. Data er blevet en handelsvare, og hvis data fra DDD var frit tilgængelige, kunne de indgå i forskellige byttehandler. Et eksempel kunne være med MyHeritage, der er rent kommercielt. Et andet eksempel er DFS, der gerne vil have en gensidig udveksling af data. I dag laver vi byttehandler med Mormonkirken om udveksling af billeder/scannede kilder.
Verden omkring os ændrer sig og i den sammenhæng er AO eller DDD ikke nogen konkurrent for de amerikanske slægtsforskerforeninger. De vil gerne samarbejde og udveksle data. RA vil gerne stå stærkere i denne byttehandel ved at kunne inddrage DDD.
Den kommende afløser for at finde data og arkivalier hos RA, kaldet ’Søg og Find’ er ikke planlagt til at kunne søge i DDD. Det vil RA gerne kunne, men det kan ikke lade sig gøre pga. løfterne til indtasterne.
Dette blev drøftet og drøftelsen endte med, at der var grund til at se på disse løfter, men der skal laves strategi for ophævelsen af løfterne.
Hertil svarede AV, at dette skulle ske i flere tempi. Teksten på DDD’s hjemmeside skal ændres, og der skal ændres i ordlyden til de breve, indtasterne modtager. Dernæst skal der ses på, hvordan og hvornår vi skal kontakte de indtastere, der allerede har afleveret data. AV vil gerne have KIK’s opbakning til henvendelsen til donorerne om ændringen.
Der var forståelse for ønsket, men komiteen mente også, at der er en kontrast mellem frivilligt arbejde og kommerciel udnyttelse. Pga. presset fra omverdenen kunne ændringen accepteres, men den ikke-kommercielle brug er vigtig.
AV fastslog, at RA vil overholde den aftale, der er indgået med indtasterne, og vil udarbejde en detaljeret plan for ændringen af rettighederne. En af mulighederne kan være, at ikke alle indtastere accepterer ændringen, og at alle data derfor ikke til sin tid vil indgå i den ’nye’ database.
Målet er for RA, at alle indtastere anvender den samme formulering som der nu er på CS-platformen.
Konklusionen var, at data skal være frit tilgængelige. Om en anden kommerciel portal anvender dem er underordnet, så længe de er tilgængelige hos RA. Ingen kommerciel monopolisering af de frivilliges indtastninger må finde sted.
Komiteen fremhævede, at det er vigtigt, at ændringen forklares tydeligt.
Løsningen for kontakten med de indtastere, der har modtaget brevet med løfterne, skal diskuteres på det næste KIKmøde.
Det blev igen påpeget, at det er vigtigt, at RA tilsikrer, at data altid er stillet frit og gratis til rådighed.

Ad 11 Næste møde

Mandag den 21. november 2016 kl. 10:15

Ad 11 Eventuelt

Intet