Scunthorpe-ongelma

Wikipediasta
Siirry navigaatioon Siirry hakuun
Esimerkki Scunthorpe-ongelmasta. Wikipedia on estänyt käyttäjänimen ”ScunthorpeM181” luonnin.
Scunthorpen lisäksi esimerkiksi brittiläisen Penistonen kaupungin nimi voi Scunthorpe-ongelman vuoksi joutua sensuroiduksi.

Scunthorpe-ongelma tarkoittaa sellaisten harmittomien internet-viestien, kommenttien ja käyttäjänimien automaattista ja tahatonta sensurointia tai estämistä, joilla on sopimaton kaksoismerkitys tai joissa on sana, joka sisältää sopimattoman merkkijonon. Ilmiö on nimetty vuonna 1996 brittiläisen Scunthorpen kaupungin mukaan, kun AOL esti kaupungin asukkaita rekisteröimästä käyttäjätilejä kaupungin nimen sisältämän kirosanan cunt vuoksi.[1] Se on esimerkki tahattomien seurausten laista.

Scunthorpe-ongelman aiheuttaa yleensä se, että roskapostisuodattimilla ja muilla vastaavilla järjestelmillä ei tekoälyn ja koneoppimisen kehityksestä huolimatta ole riittävää kykyä analysoida sanoja osana kontekstia, ja niinpä harmittomia sanoja estetään syyttä. Kaupunkien lisäksi Scunthorpe-ongelman vuoksi on sensuroitu esimerkiksi sukunimiä ja estetty parlamentin jäseniä vastaanottamasta seksuaalirikoslakia käsitteleviä sähköposteja.[2]

Alkuperä ja nimeäminen

[muokkaa | muokkaa wikitekstiä]

Ilmiö sai nimensä vuonna 1996, kun AOL:n automaattinen kirosanasuodatin esti Scunthorpen kaupungin asukkaita luomasta AOL-käyttäjätilejä kaupungin nimen sisältämän merkkijonon cunt vuoksi.[1] Suodattimen korjaamisen sijaan AOL ohjeisti kaupungin asukkaita kirjoittamaan kaupungin nimen muodossa ”Sconthorpe” ongelman kiertämiseksi.[2] Samaa ongelmaa tavattiin vielä vuonna 2004, kun Googlen SafeSearch-hakusuodatin esti käyttäjiltään pääsyn verkkosivuille, joiden osoite sisälsi Scunthorpen kaupungin nimen.[3]

Estetyt verkko-osoitteet ja käyttäjänimet

[muokkaa | muokkaa wikitekstiä]
  • Yhdysvaltalainen Jeff Gold ei huhtikuussa 1998 saanut rekisteröityä siitakesieniin viittaavaa verkko-osoitetta ”shitakemushrooms.com” sen sisältämän merkkijonon shit vuoksi.[4]
  • Vuonna 2000 Kanadassa huomattiin, että asiattoman sisällön suodattimet estivät pääsyn Communauté urbaine de Montréalin kotisivuille (www.cum.qc.ca), sillä cum on englanninkielinen slangisana siemennesteelle.[5]
  • Skotlantilainen ohjelmoija Craig Cockburn kertoi helmikuussa 2004, että Hotmailin ja Yahoon roskapostisuodattimet estivät häntä käyttämästä sukunimeään sähköpostiosoitteissa sen sisältämän merkkijonon cock vuoksi. Lisäksi hänen tittelinsä ”specialist” estettiin, koska se sisälsi roskapostittajien usein käyttämän Cialis-erektiohäiriölääkkeen nimen.[6] Vastaavasti vuonna 2010, kun hän yritti rekisteröityä BBC:n sivuille, sivusto esti häntä käyttämästä oikeaa nimeään.[7]
  • Linda Callahan ei helmikuussa 2006 saanut rekisteröityä sähköpostiosoitetta omalla nimellään, koska Yahoon suodattimet estivät merkkijonon allah sisältäneet käyttäjänimet.[8]
  • Heinäkuussa 2008 Herman I. Libshitz ei saanut luotua Verizon-sähköpostiosoitetta omalla nimellään, koska suodattimet estivät nimen sen sisältämän merkkijonon shit vuoksi.[9]
  • Toimittaja Natalie Weiner jakoi elokuussa 2018 Twitterissä kuvan sivustosta, joka esti häntä luomasta käyttäjätunnusta hänen sukunimensä kaksoismerkityksen vuoksi (weiner on englanninkielinen slangitermi siittimelle). Weinerin julkaisu sai sosiaalisessa mediassa runsaasti huomiota, ja monet kertoivat kärsivänsä samankaltaisista vaikeuksista, heidän joukossaan Arun Dikshit, Matt Cummings ja Clark Aycock.[2]
  • Suomessa jotkin suodattimet ovat estäneet pääsyn Pornaisten kunnan internet-sivuille kunnan nimen sisältämän sanan porn vuoksi. [10]

Estetyt hakutermit

[muokkaa | muokkaa wikitekstiä]
  • Koululaisille suunnatun RomansInSussex.com-opetussivuston huomattiin vuonna 2004 olevan monissa kirjastoissa ja oppilaitoksissa estettynä verkko-osoitteessa olevan sex-merkkijonon vuoksi.[3]
  • Uusiseelantilaisen Whakatanen kaupungin ilmaisen WLAN-yhteyden kirosanasuodatin esti vuonna 2008 kaupunkiin itseensä liittyvät verkkohaut, sillä suodattimen foneettinen analyysitoiminto totesi maorinkielisen nimen alkuosan kuulostavan englanninkieliseltä kirosanalta fuck.[11]
  • Google-haun ääniohjaustoiminto sensuroi vuonna 2010 hakutermejä kuten lolita ja whorehouse, myös osana teosten nimiä, kuten Vladimir Nabokovin Lolita ja musikaali The Best Little Whorehouse in Texas. Sen sijaan esimerkiksi eläimiin sekaantumista tarkoittavaa sanaa bestiality ei ollut sensuroitu.[12]
  • Heinäkuussa 2011 Jiang-nimen sisältäneet internet-haut estettiin Kiinassa, kun Sina Weibo -sivustolla alkoi levitä huhuja entisen presidentti Jiang Zeminin kuolemasta. Koska jokea tarkoittava nimi Jiang kirjoitetaan samalla 江-merkillä kuin sana joki, eston seurauksena esimerkiksi Jangtse-jokea koskevat hakutulokset estettiin.[13]
  • Google Shopping -palvelu esti helmikuussa 2018 muun muassa liimapyssyihin, Guns N’ Rosesiin ja burgundy-viiniin liittyvät haut Googlen yritettyä estää aseisiin (gun) liittyvät hakutulokset.[14]

Estetyt sähköpostit

[muokkaa | muokkaa wikitekstiä]
  • Sähköpostipalvelu Yahoo! Mail muutteli vuonna 2001 virheellisesti sanoja ja sanojen osia. Tarkoituksena oli korvata JavaScriptissä esiintyviä sanoja synonyymeillään JavaScript-virusten levittämisen estämiseksi. Esimerkiksi sanasta eval tuli review, sanasta mocha tuli espresso ja sanasta expression tuli statement. Samat muutokset kuitenkin tehtiin myös samojen merkkijonojen ollessa osana muita sanoja. Esimerkiksi keskiaikaista tarkoittavasta sanasta medieval tuli Yahoo! Mailin kautta lähetetyissä sähköposteissa medireview.[15]
  • Uusi roskapostisuodatin esti helmikuussa 2003 brittiläisiä parlamentin jäseniä keskustelemasta sähköpostitse käsittelyssä olleesta uudesta seksuaalirikoslaista.[16] Sama suodatin esti myös kymrinkielisiä sähköposteja, koska ei tunnistanut kieltä.[17]
  • Lontoossa sijaitsevalle Horniman-museolle lähetettyjä sähköposteja estettiin lokakuussa 2004, koska roskapostisuodattimet tulkitsivat museon nimen tarkoittavan samaa kuin ’horny man’, himokas mies.[18]
  • Rochdalen hallintopiirille Manchesterissa toukokuussa 2006 lähetetyt kaavoitushakemusta vastustaneet sähköpostit eivät tulleet perille ajoissa, koska roskapostisuodatin esti ne niissä esiintyneen sanan erection vuoksi. Sanalla on kaksoismerkitys: se tarkoittaa erektion lisäksi myös pystyttämistä.[19]
  1. a b Raphael, JR: The “Scunthorpe Problem” – unfortunate names subject to Web censorship 11.12.2008. IT Business. Viitattu 12.4.2020. (englanniksi)
  2. a b c Oberhaus, Daniel: Life on the Internet Is Hard When Your Last Name is 'Butts' 29.8.2018. Vice. Viitattu 12.4.2020. (englanniksi)
  3. a b McCullagh, Declan: Google's chastity belt too tight 23.4.2004. CNET News. Arkistoitu 16.6.2011. Viitattu 12.4.2020. (englanniksi)
  4. Festa, Paul: Food domain found "obscene" 27.4.1998. CNET. Viitattu 12.4.2020. (englanniksi)
  5. Foire aux Questions Branché. Arkistoitu 21.10.2012. Viitattu 12.4.2020. (ranskaksi)
  6. Barker, Garry: How Mr C0ckburn fought spam 26.2.2004. The Sydney Morning Herald. Arkistoitu 3.9.2009. Viitattu 12.4.2020. (englanniksi)
  7. Cockburn, Craig: BBC fail - my correct name is not permitted 9.3.2010. Silicon Glen. Viitattu 12.4.2020. (englanniksi)
  8. Reagan, Sean: 'Allah' in name foils email tag 17.2.2006. Daily Hampshire Gazette. Arkistoitu 14.1.2016. Viitattu 12.4.2020. (englanniksi)
  9. Rubin, Daniel: When your name gets turned against you 30.7.2008. Philly.com. Arkistoitu 5.8.2008. Viitattu 12.4.2020. (englanniksi)
  10. Nettisuodatin ei korvaa aikuista kasvattajaa 27.11.2017. Helsingin Sanomat. Viitattu 18.10.2020.
  11. O’Brien, Terrence: F-Word Town's Name Gets Censored By Internet Filter 1.8.2008. Switched. Arkistoitu 1.12.2008. Viitattu 12.4.2020. (englanniksi)
  12. Matyszczyk, Chris: Google censors 'Lolita,' but not 'bestiality' 31.1.2010. CNET. Viitattu 12.4.2020. (englanniksi)
  13. Chin, Josh: Following Jiang Death Rumors, China’s Rivers Go Missing 6.7.2011. The Wall Street Journal. Viitattu 12.4.2020. (englanniksi)
  14. Molloy, Mark: Wine lovers cannot buy Burgundy tipple on Google as internet giant cracks down on 'gun' searches 27.2.2018. The Telegraph. Viitattu 12.4.2020. (englanniksi)
  15. Yahoo admits mangling e-mail 19.7.2002. BBC. Viitattu 13.4.2020. (englanniksi)
  16. E-mail vetting blocks MPs' sex debate 4.2.2003. BBC. Viitattu 13.4.2020. (englanniksi)
  17. Software blocks MPs' Welsh e-mail 5.2.2003. BBC. Viitattu 13.4.2020. (englanniksi)
  18. Kwintner, Adrian: Name of museum is confused with porn 5.10.2004. News Shopper. Viitattu 13.4.2020. (englanniksi)
  19. E-mail filter blocks 'erection' 30.5.2006. BBC. Viitattu 13.4.2020. (englanniksi)