# Databehandling og -analyse med Python og OpenRefine 
En praktisk innføring for humanister og samfunnsvitere 

## Velkommen!
**Laget av David Massey, Michael Preminger, og Camilla Holm Soelseth / Publisert som [JupyterBook](https://jupyterbook.org/en/stable)**

Denne websiden er en *Open Access* digital lærebok utformet som en praktisk og interaktiv guide til det å jobbe med data i kultur- og informasjonsforvaltning, og humanistisk og samfunnsvitenskaplig forskning. Boken en introduksjon til programmeringsspråket *Python* (og noen utvalgte databehandlingspakker) samt databehandlingsprogrammet *OpenRefine*. Læreboka er særlig rettet mot studenter og forskere i humaniora og samfunnsvitenskap som jobber med data fra nettet, eller data fra arkiv, bibliotek, museer og andre lignende samlinger.   

Boka tar deg med fra A – Å i det å innhente, behandle og analysere data. Boken egner seg særlig for de som ønsker å studere kultur (i bred forstand) og digitale eller digitaliserte materialer (som eksisterer som data).

Ved bruk av *Python* vil du her lære å samle, lese, lagre og behandle data. Ved bruk av *OpenRefine* vil du lære å vaske data og gjøre klart datasett for videre analyser. Videre vil du lære å analysere datasett med bruk av databehandlingspakken *Pandas*. Til sist vil du lære å ta i bruk databehandlingspakken *Plotly* for å visualisere. Med unntak av *OpenRefine* vil alt skje i det populære brukergrensesnittet *Jupyter Notebooks*.


## Oppbygning
Del I gir en kort introduksjon til hvordan installere og ta i bruk det du trenger. Del II av boken lærer deg det grunnleggende om programmeringsspråket *Python*, mens del III går nærmere inn på hvordan behandle kultur og informasjon som data og datasett. Her får du en innføring i det å forholde deg til og jobbe med det datasett for å gjøre enkle deskriptive analyser og visualiseringer, samt det å foreta utvalg og lage nye datasett for mer spesifikke analyser.

> Del IV vil ta for seg innhenting og scraping av data og vil være ferdig høsten 2024. 

### Kontakt oss
Kontaktpunkt er Camilla Holm Soelseth, som kan kontaktes på: camil @ oslomet.no 

### Hvordan sitere denne boka
*Massey, D., Preminger, M., & Soelseth, C. H. (2024). Databehandling og -analyse med Python og OpenRefine (1.0). Zenodo. https://doi.org/10.5281/zenodo.13329396*

## Del 5: Call for Chapters
> Her vil det komme informasjon om del V av boken, høsten 2024. Del 5 vil bestå av mer spesifikke og avanserte analysemetoder, og vi vil oppfordre interesserte til å sende inn bidrag gjennom en call for chapters i september 2024. 

## Takk
Versjon 1.0 har vært testet av professor *Nina Lager Vestberg, informatiker Trym Bremnes, informasjonsviter Karoline Kornkveen Hoff, og humanist Andrea Dale Wefring*. Vi takker enormt mye for tilbakemeldingene dere ga oss, som vi ha inkorporert på best mulig måte for å gjøre denne læreboka så bra som mulig! 