Workshop at University of Copenhagen, 2018-09-21 and 2018-09-28

Notes from the workshop at University of Copenhagen, September 21. and 28. (room 4A-1-15.).

The first day is an introduction to Jupyter Notebook and how to work with data. The second day we will do an exploration of data in a topic of your choice.

Links to further studies

NB: Python 3 vs 2.

Urls for sample text

Fortunes:
https://raw.githubusercontent.com/JKirchartz/fortunes/master/artists
https://raw.githubusercontent.com/JKirchartz/fortunes/master/chuckfacts
http://fortunes.cat-v.org/freebsd/
https://raw.githubusercontent.com/JKirchartz/fortunes/master/godin
https://raw.githubusercontent.com/JKirchartz/fortunes/master/jung
(see https://github.com/JKirchartz/fortunes for more)

Gutenberg:
Hamlet: https://www.gutenberg.org/files/1524/1524-0.txt
Tao te king: http://www.gutenberg.org/cache/epub/216/pg216.txt
Aesop: http://www.gutenberg.org/cache/epub/11339/pg11339.txt
find more on http://www.gutenberg.org/ and use url of plain text version.

Random text-file examples:
http://www.catb.org/jargon/oldversions/jarg2912.txt
http://google.com/humans.txt http://google.com/robots.txt

Announcement

Workshop for INF-studerende – bliv klædt på til at ’lege professionelt med data’
Er du nysgerrig efter at vide hvordan data kan bruges til indsigt, inspiration og formidling?
Så kom til workshop for INF-studerende d. 21. og 28. September.

Du vil få en smagsprøve på:

  • “Jupyter Notebook”, – et af de mest brugte værktøj, når man arbejder med data, både indenfor den akademiske verden, og i erhvervslivet.
  • hvad data, og strukturerede data er, herunder “JSON”, som du sikkert vil støde på enten senere i studiet eller dit professionelle liv.
  • hvordan du ‘fortæller’ computeren hvad den skal gøre med data (ved hjælp sproget “Python”).
  • at hente data fra forskellige online datakilder, og at gå på opdagelse i data.
  • visualisering af data til inspiration og formidling.
  • hvordan du kommer videre, hvis du eksempelvis vil lege med data i projekter senere hen.

Deltagelse i workshoppen kræver ingen forudsætninger, udover nysgerrighed og at du medbringer en computer med en webbrowser.Workshoppen forløber over to dage. Første del er en introduktion til de forskellige værktøj og hvad man kan bruge data til. I anden del dykker vi mere ned i konkrete case-studier.Vi tager udgangspunkt i deltagernes interesser, – så hvis der er et emne, du synes kunne være en interessant case, så send gerne en mail til:
rasmuserik@solsort.com
På workshoppen i foråret endte vi bl.a. med at gå på opdagelse i data om hip-hop-kunstnere, men det kan være hvad som
helst: renaissance malerier, biblioteker, afrikanske stammer, … Undervisningsmateriale kommer online https://data-science-workshop.com

Workshop for BF d. 20/4

Eftermiddagsworkshop for BF agenda:

  • Intro
    • Velkomst, plan, deltagerrunde.
    • Hvorfor? Hvad er Data Science? (Maskine til den mentale muskel)
    • Hvad er Jupyter Notebook / Python? (Kommunikation i et fremmed land: fagter vs. sprog, peg-og-klik vs. programmering)
  • I gang med Jupyter / Python. – Data Science på biblioteksdata. – Leg med data, eksempelvis live coding af emneords-sky eller forfatter-sky.
  • Opsamling/konklusion. Links til videre selvstudier: Thinking in PythonCode CombatData CampCode Academy, EdX

Guides og kodeeksempler

Beskrivelse fra BFs hjemmeside:

Gå-hjem møde: Kom godt i gang med Jupyter notebooks

Jupyter notebooksJupyter Notebooks er en Open Source web applikation. Med Jupyter har du mulighed for at skabe og dele dokumenter, der indeholder både tekst, visualiseringer og kode.

Du kan bruge Jupyter til at rense dine data, modeller dine data, visualisere dine data og meget mere. Introduktionen til Jupyter er for begyndere, og den handler om glæden ved at lege med data! 🙂

Vi starter med en introduktion til data science og Jupyter – hvad er de? Hvorfor burde man beskæftiger sig med sådan noget? Hvad kan de?

Derefter dykker vi ned i nogle real-world data science eksempler, hvor det er muligt selv at lege og eksperimentere med data. Disse viser, hvordan lånerdata fra bibliotekerne kan bruges til litterær inspiration, udforskning af genre, og forbedring af metadata.

Instruktør: RasmusErik Voel Jensen, Independent computer scientist and software developer. Læs mere på solsort.com.

Forplejning: Naturligvis byder vi på sandwich og noget at drikke. Ved tilmeldingen, skriv gerne om du er vegetar, eller der er andre kostvaner vi skal tage hensyn til.

Deltagergebyr:

  • Gratis for medlemmer af Data Science Faggruppen
  • For andre medlemmer af BF: koster det 150 kr for ikke medlemmer

Der er plads til 20 deltagere.

Arrangør: Data Science Faggruppen under Bibliotekarforbundet.

Workshop 23/2 + 16/3 for KU

Announcement

Workshop for INF-studerende på 6.semester – bliv klædt på til at ’lege professionelt med data’

D. 23/2 og 16/3 (begge dage fra 9-16) afholdes en dataworkshop henvendt til alle studerende på 6.semester. Den gennemgående underviser begge dage er Rasmus Erik Voel Jensen (solsort.com), og der vil undervejs være gæsteundervisere (se mere om program nedenfor). Af hensyn til den praktiske planlægning skal tilmelding ske til Johanne Maibohm (jom@hum.ku.dk) senest d. 20/2.

Deltagelse kræver ingen forudsætninger ud over interesse i at:

  • Lære hvordan man kan bruge data til indsigt, inspiration og formidling
  • Finde ud af hvad der menes med datahøstning og hvordan man gør
  • Vide mere om hvilke værktøjer man kan benytte og afprøve dem
  • Forstå og få ideer til hvordan man kan arbejde med større datamængder
  • Forstå og få ideer til hvordan man kan udtrække og anvende data i forskellige sammenhænge og til forskellige formål. Der arbejdes med forskellige cases og emner efter eget valg
  • Få indblik i og afprøve visualisering af større datamængder

Workshoppen har til formål at gøre dig fortrolig med at arbejde med data vha. af forskellige værktøjer og opdage nye anvendelsesmuligheder. Workshoppen veksler mellem oplæg og øvelser, hvor du bliver guidet undervejs.

Stikord til workshops

Workshop del 1 (23/2)

  • Introduktion til Jupyter Notebook(Python) som dataværktøj
  • Hvad er strukturerede data(JSON), og hvordan man bruge dem
  • Udtræk/høstning af data fra forskellige kilder (Wikipedia, bibliotekerne, YouTube(OGP), WordPress, …)
  • Introduktion til databehandling og visualisering med hands-on øvelser med Jupyter/Python
  • Introduktion til visualiseringsværktøjet Tableau Software og hands-on

Workshop del 2 (16/3)

  • Databehandling og visualisering med Jupyter/Python, gennem eksempler og cases.

Program og materiale til workshoppen bliver løbende blive opdateret på data-science-workshop.solsort.com

Vel mødt!