Wikiprojekti:Oodi/14. helmikuuta 2019
Siirry navigaatioon
Siirry hakuun
Oodi-wikiprojektissa on tarkoitus pitää wikitapaamisia Helsingin keskustakirjasto Oodissa. Päämääränä tapaamisilla on opintopiirin tapaan esitellä Wikipediaan liittyviä projekteja ja tekniikoita. Samalla se toimii paikkana, johon aloittelevatkin wikipedistit voivat tulla muokkaamaan avointa tietosanakirjaa yhdessä muiden kanssa.
Kolmannen tapaamiskerran päämääränä on käydä läpi sitä miten luettelomuodossa olevia sisältöjä saadaan tallennettua OpenRefine 3 -työkalulla Wikidataan. Tapaamispaikkana on Oodin 2. kerroksen ryhmätila 5 kl 19.00-22.00.
OpenRefine 3
[muokkaa | muokkaa wikitekstiä]- OpenRefine 3.x:lla, katso http://openrefine.org/
- Ohjeita
Valmistauduthan jo etukäteen
[muokkaa | muokkaa wikitekstiä]- Katso, että olet luonut Wikipedian käyttäjätunnuksen
- Lataa ja asenna OpenRefine 3.1 - http://openrefine.org/download.html
Mitä käymme läpi?
[muokkaa | muokkaa wikitekstiä]- Taulukkomuotoisen datan tuominen OpenRefineen eri muodoissa. Voit ottaa mukaan tai etsiä verkosta sopivan datasetin. Katso, että datasettisi kohteet sopivat Wikidataan merkittävyydeltään ja että datasetissä on korkeintaan muutamakymmentä riviä. Sopiva datasetti on sellainen, jonka rivi on tai voisi olla Wikipedia-artikkeli.
- Wikidatan tekijänoikeuden lisensointimalli on CC0. Tekijänoikeuslain mukaisesti datasetistä voi kopioida vähäpätöisen otoksen ilman tekijänoikeuden rajoituksia. Jos haluat siirtää kokonaisen datasetin, sen on oltava tekijänoikeuksista vapaata, joko Public Domain tai CC0.
- Miten dataa siivotaan? Datasetissäsi sama nimi voi olla esimerkiksi kirjoitettu usealla eri tavalla. Ehkä etu- ja sukunimi tarvitsee laittaa eri järjestykseen tai tiedot on sullottu yhteen kenttään. OpenRefinessa on erilaisia työkaluja, joilla dataa työstetään yhä yhdenmukaisemmaksi ja valmiimmaksi vietäväksi Wikidataan.
- Osa tiedoista voi olla jo ennestään Wikidatassa ja osalle voi olla ristiriitaista tietoa. Merkittävä osa työstä kohdistuu yhteneväisten kohteiden tunnistamiseen ja yhdistämiseen. Tätä kutsutaan rekonsilioinniksi. Rekonsilioinnissa auttaa, jos datasettisi kohteilla on auktoriteettitunnus, kuten ISBN, VIAF-tunnus, YSO-tunnus tai vastaava.
- Kaikille lisättäville tiedoille on muistettava luoda korkealaatuiset lähdeviitteet. Viite voi olla Wikidataan talletettu kohde (julkaisu, tietokanta tms.) tai verkosta löytyvä resurssi (julkaisu, verkkosivu, tietokanta tms.). Varmista, että sinulla on nämä tiedot.
- Kun tiedot on yhdenmukaistettu, muotoiltu ja olemassaolevat kohteet on tunnistettu, tiedot voi viedä Wikidataan.
OpenRefine video walkthrough
[muokkaa | muokkaa wikitekstiä]- osa 1 - Tietojen lataus OpenRefineen CSV-tiedostosta. Ladattujen tietojen linkitys Wikidatakohteisiin.
- Osa 2 - Ladattuje tietojen siivous OpenRefine -työkalussa.
- Osa 3 - Siivottujen tietojen vienti OpenRefinestä Wikidataan.
OpenRefine esimerkki
[muokkaa | muokkaa wikitekstiä]Wikidata | Henkilön nimi | Familyname | First name 1 | First name 2 |
---|---|---|---|---|
Q4115189 | Ilmo Hassinen | Hassinen | Ilmo | Ensio |
Second Wikidata sandbox | Gunnar Myllylä | Myllylä | Johan | Gunnar |
Third sandbox | Kalevi Lönnqvist | Lönnqvist | Jouko | Kalevi |
Ensimmäinen esimerkki
[muokkaa | muokkaa wikitekstiä]Ohjeessa muokataan Wikidatan hiekkalaatikkoa johon voi tehdä kokeilumuokkauksia.
- Asenna OpenRefine 3
- Kopioi ylläoleva taulukko leikepöydälle
- Avaa OpenRefine 3
- Valitse Clipboard
- Liitä teksti leikepöydältä Paste data from clipboard here -laatikkoon
- Klikkaa Next
- Vaihda project name kenttään projektiksi "Esimerkki"
- Klikkaa Create project'
- Valitse otsikosta
Wikidata
Reconcile -> Start reconciling - Valitse Serviceksi
Wikidata (en)
- Valitse kenttään Reconcile each cell to an entity of one of these types arvo
Wikipedian
- Klikkaa Start reconciling
- Valitse otsikosta
Familyname
Reconcile -> Start reconciling - Valitse
Wikidata (en)
- Valitse kenttään Reconcile each cell to an entity of one of these types arvo
family name
- Klikkaa Start reconciling
- Klikkaan niille joille ei löytynyt tulosta Choose new match
- Valitse otsikosta
First name 1
Reconcile -> Start reconciling - Valitse
Wikidata (en)
- Valitse kenttään Reconcile each cell to an entity of one of these types arvo
male given name
- Klikkaa Start reconciling
- Valitse niille joille löytyi monta tulosta oikea klikkaamalla oikeaa riviä (klikkaamalla tekstiä saa lisätietoa boksin)
- Klikkaa otsikkoriviltä Extensions: Wikidata -> Edit Wikidata schema
- Klikkaa Add item
- Raahaa otsikko Wikidata kohtaan type item or drag reconciled column here
- Klikkaa Add term
- Valitse ensimmäiseen terms-kentän sarakkeeseen Description
- Kirjoita toiseen terms-kentän sarakkeeseen fi ja valitse Suomi avautuvasta valikosta
- Kirjoita kolmanteen sarakkeeseen "Esimerkki"
- Klikkaa Add statement
- Kirjoita ensimmäiseen kenttään Family name (ja valitse se aukeavasta valikosta)
- Raahaa toiseen kenttään Family name
- Klikkaa Add statement
- Kirjoita ensimmäiseen kenttään Given name (ja valitse se aukeavasta valikosta)
- Raahaa toiseen kenttään First name 1
- Ylärivillä olevasta Issues -välilehdestä näkee varoitukset ja virheilmoitukset. Tässä tapauksessa siinä pitäisi olla 6 varoitusta siitä, että lähteitä ei ole merkittynä lisätyille tiedoille.
- Ylärivillä olevasta Preview -välilehdestä näkee mitä OpenRefine olisi kirjoittamassa Wikidataan
- Kirjoittaaksesi muutokset Wikidataan
- valitse Extensions: Wikidata -valikosta ensin Manage Wikidata account ja aseta tiedot millä tunnuksella muokkaukset tehdään.
- valitse Extensions: Wikidata -valikosta Upload edits to Wikidata (ohjeessa muokataan Wikidatan hiekkalaatikkoa)
Katso myös
[muokkaa | muokkaa wikitekstiä]- Wikiprojekti:Oodi/28. tammikuuta 2019
- d:Wikidata:Recoin
- Cradle - työkalu jolla voi luoda uuden Wikidatakohteen lomakkeella.