Digidaily på Bok och Biblioteksmässan och på UNESCO:s världskulturarvskonferens

Under Bok och Biblioteksmässan i Göteborg kommer KB att medverka i flera seminarier. Digidaily också!

På torsdag den 27 september 15.30 -15.50 samtalar Pär Nilsson och jag bland annat om Digidaily, tidningsdigitalisering generellt , tillgängliggörande och framtiden.
Från kl 16.00-17.00 finns vi i KB:s monter och svarar på frågor och diskuterar vidare med intresserade.

Och de som har vägarna förbi Vancouver kan höra Torsten Johansson från KB presentera projekt Digidaily på UNESCO:s världskulturarvskonferens med temat: The Memory of the World in the Digital Age: Digitization and Preservation. Konferensen är 26-28 september.

Välkomna!

//Heidi

Publicerat i Okategoriserade | Etiketter | Lämna en kommentar

Det osnygga slakteriet – Östgötaposten 1902-09-19

Vi på Kungliga biblioteket är nu med Digidaily inne på vårt tredje digitaliseringsprojekt när det gäller dagstidningar. De två tidigare har gällt dels de äldsta svenska dagstidningarna mellan 1645 och 1721, dels en rätt blandad skara dagstidningar från olika århundraden. Det äldsta materialet är tyvärr otillgängligt, men det senare projektets resultat finns att titta på och söka i på magasin.kb.se.

Vi kommer att här i bloggen presentera lite exempel på digitaliserat tidningsmaterial som är tillgängligt redan idag, medan vi arbetar på att kunna visa upp Digidailys resultat. Den som vill kan också följa KB på Twitter, där vi nästa varje dag publicerar små tidningsnotiser från förr. Det går också att söka efter de senaste notiserna på Twitter med en så kallad hashtagg: #KBdigtid

Dagens tidning för 110 år sen

Dagens lilla notis med citat från en myndighetsinspektion känns nästan modern genom den granskande tonen den har. Slakteriägaren har tydligen bedrivit lobbyverksamhet för att framstå i bättre dager, men den ursprungliga inspektionen har fått förnyat stöd och artikeln slutar i en förhoppning om bättring.

Läs hela tidningsnumret här: http://bit.ly/ostgotaposten19020919

Publicerat i Okategoriserade | Etiketter | Lämna en kommentar

Läs ett nummer av Nerikes Nya Allehanda

Projektet går framåt och vi har nu börjat arbetet med att segmentera och OCR-tolka de inskannade sidorna. Ett första försök på OCR-tolkning av fraktur har gjorts och resultatet kan ni ladda ner nedan. Vi är riktigt nöjda över resultatet av vårt första försök!

Observera att orginalbilderna är av mycket bättre kvalitet. Bilderna ni kan ladda ner här på bloggen är komprimerade.

Nerikes Nya Allehanda 1858-01-06

Nerikes Nya Allehanda 1858-01-09

Dagligt Allehanda Bihang 1820-01-20

Trevlig läsning och sökning i texten önskar Heidi

Publicerat i Okategoriserade | 4 kommentarer

Digidaily på släktforskardagarna

Riksarkivet och KB var i år med på Släktforskardagarna i Gävle den 24-26 augusti. Tack alla för ett engagerat bemötande!
Inlägget nedan är skrivet av Annelie på MKC/Riksarkivet, vår samarbetspartner i projekt Digidaily.

Tack alla ni som kom och lyssnade på vårt föredrag på Släktforskardagarna och som besökte Riksarkivets monter och var intresserade av Digidailyprojektet.
Vi som arbetar med Digidaily hade aldrig tidigare varit med under dagarna och vi blev alla glatt överraskade, vi träffade massor med engagerad Släktforskare som var intresserade av vårt projekt och som tyckte som vi att digitaliserade dagstidningar är en demokratifråga och att digitaliseringen skulle underlätta för såväl forskare, skola och allmänhet.
På vårt föredrag var det fullsatt och i sanningens namn ska sägas att alla föredrag var så gott som fullsatta, det var många som inte kom in på de föredrag som de ville gå på.
Ämnet var ” Släktforska i digitala historiska dagstidningar” och Torsten Johansson var föredragshållare, han möttes av ett stort engagemang och fick många bra frågor från er som var med.
Än en gång fick vi det bekräftat, det finns ett enormt intresse för digitaliserade historiska dagstidningar och vi är många som hoppas att Sverige är moget  för att vilja satsa medel för att göra Digidaily till en verklighet.
Publicerat i Okategoriserade | Etiketter , | Lämna en kommentar

Önskelista på digitaliserade tidningar

Vilka tidningar skulle just du vilja ha digitaliserade?

Vi som arbetar med tidningsdigitalisering här på KB vill gärna ha in förslag och synpunkter på vilka tidningar som våra användare skulle vilja ha digitaliserade.
Då det finns runt 122 miljoner sidor i våra samlingar är det inte realistiskt att alla dessa kommer att kunna digitaliseras, därför behöver vi göra ett urval.
I KB:s urvalskriterier ingår bland annat tidningens skick och volym, om texten är i antikva eller fraktur, om tidningen redan finns mikrofilmad och sist men inte minst efterfrågan bland KB:s användare.

Vi är därför intresserade av vad just du tycker! Skriv ett inlägg med
förslag och motivera gärna dina val. Vi kan inte lova att just ditt önskemål kommer att kunna digitaliseras, men ser vi ett mönster, att en viss tidning efterfrågas ofta, tar vi så klart det i beaktande!

Publicerat i Okategoriserade | Etiketter , , | 73 kommentarer

Miljongränsen sprängd!

Nu har projekt Digidaily digitaliserat 1 miljon tidningssidor!

Nu har vi passerat en vårt första delmål, en miljon tidningssidor. Nu tar vi sikte på resten. Totalt blir det runt 2,8 miljoner tidningssidor av Aftonbladet och SvD som ska digitaliseras innan projektet avslutas i mars 2013. Under hösten planerar MKC stora insatser på segmenteringsområdet och OCR-tolkning av materialet. KB kommer efter semestrarna fortsätta arbetet med ett visningsgränssnitt.

Publicerat i Okategoriserade | Etiketter , , | 14 kommentarer

Digidaily till UNESCO-konferens om digitalisering av kulturarv

Jag kan med glädje berätta att projekt Digidaily har blivit antaget till inte mindre än tre internationella konferenser om digitalisering.

Archiving 2012 som arrangeras av The Society for Imaging Science and Technology.
I år hålls konferensen i Köpenhamn den 12-15 juni.

The Society for Imaging Science and Technology is an international non-profit organization whose goal is to keep members aware of the latest scientific and technological developments in the field of imaging through conferences, journals and other publications.
http://www.imaging.org

IFLA 2012
IFLA 2012 preconference, ”The Electronic Re-evolution – News Media in the Digital Age” som hålls i Mikkeli, Finland, 7-9 augusti.

The preconference will deal with the impact of the electronic re-evolution in the newspaper field at large including e-delivery, crowd-sourcing, digital environment, and copyright issues
http://www.ifla2012mikkeli.com/

Och sist men inte minst

UNESCO- The Memory of the World in the Digital Age: Digitization and Preservation
Konferansen hålls den 26-28 September 2012 i Vancouver, British Columbia, Kanada

The Digital Heritage
Digital documentary heritage is important for humanity as digital technology has become the primary means of knowledge creation and expression. All areas of life produce digital documents, which need to remain technologically stable and accessible in their authentic manifestation by current and future generations.
The Digitized Heritage
Apart from digitally created new documents, digital surrogates of traditional documents, prepared to enable democratic access to hitherto hidden information and knowledge, have also become an ever growing part of the digital heritage. However, guidelines based on research and best practices are needed to ensure the adequate conversion of analogue contents to digital, and long term preservation of the digital heritage.

Memory-of-the-world/The Memory of the World in the Digital age: Digitization and Preservation

Memory-of-the-world/homepage

Publicerat i Okategoriserade | Etiketter , , | 3 kommentarer

Statusrapport Digidaily april 2012

Vad har Digidaily hittills i siffror producerat?

KB har hittills preparerat och levererat 1 625 000 sidor.
MKC har preparerat 1 551 445 sidor och skannat 513 433 sidor.

Läs mer nedan hur vi arbetar med att förbereda och skanna tidningssidorna.

KB
I tidningsdepån i Bålsta plockas materialet fram och rengörs. Sedan gås tidningarna igenom på utgåvenivå.
Är tidningarna inbundna bläddras varje utgåva fram för att skapa en överblick över materialet när det gäller skick, bilagor, delar och editioner.
Hittas en alltför trasigt utgåva kan ett kompletteringsexemplar sökas fram.
Allt arbete och information om tidningen registreras i KB:s tidningsdatabas för att sedan exporteras till MKC:s produktionsstöd. Produktionsstödet är det sammanhållande verktyg som stöder och styr produktion och processer inom Digidaily och har utvecklats av MKC. Materialet hämtas sedan i Bålsta av MKC.

Preparering av SvD i Bålsta

MKC

På MKC prepareras sedan materialet inför skanning. Operatören bläddrar igenom bunten utgåva för utgåva, sida för sida, och gör t.ex. följande bedömningar:

  • I vilken kondition sidan befinner sig (KB kommer via produktionsstödet att få ut rapporter om reklamationsnivåerna och kan då göra efterforskningar om bättre förlaga finns.)
  • Vilken sorts skanner kan användas
  • Stämmer av förregistrerade uppgifter typ datum, antal sidor mm
  • Operatören kompletterar med t.ex. uppgifter om bilagans och sektionens namn, bilagans ämnesområde, vilken genre delen tillhör – Bilaga, löpsedel eller sektion, vilken edition utgåvan har, vilket nummer utgåvan har.

Efter bunten är genomgången bedöms om det är lämplig att ta isär bunten till lösblad vilket medger en snabbare skanningsprocess.

Preparering på MKC

Sedan går de preparerade sidorna till skanning. De bundna volymerna skannas med planskanner. Lösblad i gott skick skannas med rullbäddskanner.



Därefter tar OCR-processen vid, men mer om den och andra processer i digitaliseringskedjan i en senare artikel.

Publicerat i Okategoriserade | Etiketter , , | 4 kommentarer

Digidaily flyttar in i klassrummet

Digitaliserade dagstidningar skulle kunna användas till att underlätta skolarbeten. I skolan jobbar vi mycket med att hitta information som vi använder som grundfakta till olika arbeten, man vill ha snabb och korrekt information och då är KB:s tidningsarkiv perfekta att gräva i! Det vore dock smidigare för bland annat skolklasser om man kan leta i dessa arkiv på internet i de digitaliserade tidningarna på skolan istället för att boka mikrofilmsläsesalen!
Det känns inte optimalt att sitta framför en mikrofilmsläsare då tekniken för förbättring finns inom räckhåll! Det vore istället mycket optimalare med datafiler som man tillexempel kan OCR läsa och specificera sin sökning och få upp resultaten på en gång vilket bidrar till en mycket god sökbarhet. Detta underlättar för stressade studenter som jobbar under tidspress. Med en PDF har man allt i ett, bild och även text för att förenkla arbetet!
Budgeten är tajt och pengarna räcker inte till för att kunna genomgå detta treåriga projekt än, men förhoppningarna är stora och viljan ännu större! Det är inte bara KB:s anställda och alla de företag som investerat i detta projekt som är förväntansfulla. Jag har pratat med flera gymnasieelever om Digidaily och responsen har varit positiv! Många tror på detta som ett utmärkt studiemedel och väldigt många gymnasieskolor använder sig av datorer hellre än skolböcker, något som gör materialet ännu mer tillgängligt för oss som studerar.  Många ser fram emot att få utnyttja digidailys alla förutsättningar.
Personligen tycker jag att projektet låter toppen då vi tillexempel kan får en skoluppgift att skriva om ett ämne som det kan ha skrivits om i media. Då kan man enkelt kolla i dagstidningarna och den direkta källan istället för hemsidor på nätet som förmodligen inte är lika trovärdiga. Av egen erfarenhet är detta en ganska vanlig problematik i skolan, det är lätt hänt att ty sig till fel källor och grunda en uppsats på felaktig information. Alltså, det är väldigt viktigt för oss att snabbt och enkelt få fram så bra och lättläst information som möjligt för att underlätta vårt arbete.

Foto: Emma Sundberg

Emma Sundberg går på Thoren Business School i Stockholm och praktiserade två veckor hos oss på KB. Tack Emma för all hjälp!

Publicerat i Okategoriserade | Etiketter , | Lämna en kommentar

En alltför lång paus…

Måste börja med att be om ursäkt för det långa uppehållet på Digidaily bloggen.
Verkligheten kommer ibland i fatt en i form av sjuka barn, influensa, ledigheter och alltför mycket att göra. För vi har i projekt Digidaily inte legat på latsidan, utan tvärtom!

Förutom att jobba praktiskt med preparering och skanning av tidningarna har vi bland annat arbetat om våra kravspecifikationer gällande metadata, jpeg2000, namngivning mm. Vi har arbetat med att gå från segmentering på sidnivå till att segmentering på artikelnivå. Vi har skrivit abstract och blivit antagna till inte mindre än tre internationella konferenser med digitalisering som huvudtema. Vi har haft ett halvtidsseminariuim med inbjudna digitaliseringsexperter från England och Holland. Vi har även börjat titta på ett användargränssnitt. Och sist men inte minst har vi enträget jobbat med fortsatt finansiering, för att kunna fortsätta tidningsdigitaliseringen efter projektets slut i mars 2013. Men mer om allt detta i kommande artiklar.

Publicerat i Okategoriserade | Etiketter | Lämna en kommentar