Hoppa till huvudinnehåll

Utrikes

Facebook fattar inte finska – dokumentläcka visar att företaget inte kan stoppa hatretorik

Uppdaterad 18.12.2021 10:05.
Facebookin tunnus ja Suomen lippu näytöllä, jonka lasi on rikki. Näytön päällä on vihainen emoji. Kuvituskuva.
Bildtext Dokument som visselblåsaren Frances Haugen lämnat över till tillsynsmyndigheten SEC visar att Facebooks moderering primärt är utvecklat för innehåll på engelska. Inget av de automatiska övervakningsverktygena fungerar på finska.
Bild: Joonas Haverinen / Yle

Facebook skryter om sitt effektiva automatiska modereringssystem. Interna handlingar som Yle har kommit över visar ändå att systemen inte är till stor hjälp på små språkområden.

Facebook är inte så bra som man har låtit förstå på att känna igen den hatretorik som frodas på plattformen. På små språkområden som i Finland når innehållsmodereringen ofta bara halvvägs. Det framkommer i en läcka med tusentals dokument som Yle Uutiset har kommit över.

På basis av dokumenten har Facebook inte utvecklat sina automatiska modereringsverktyg så att de fungerar på finska. Algoritmerna känner bland annat igen hatretorik och våldsamt eller naket innehåll.

Facebook har hittills inte varit öppna med hur innehållet modereras. Företaget avslöjar till exempel inte hur många anställda som granskar innehåll på olika språk. Facebook uppger inte heller för vilka språk det har utvecklats automatiska modereringssystem.

Yle har i två repriser bett Facebook redogöra noggrannare för hur modereringen på finska sköts, men företaget har inte svarat på frågorna.

Det är känt att innehåll som publiceras på Facebook globalt granskas av omkring 15 000 innehållsgranskare. De är för det mesta anställda via underleverantörer. Enligt Facebook granskar de innehåll på över 70 olika språk.

Man vet också att det finns ett tiotal finländska moderatorer och att de arbetar utanför Finland, till exempel i Berlin.

Hatretoriken på Facebook filtreras i rätten

Facebooks så kallade communityregler definierar hurdant innehåll som är godtagbart. Enligt reglerna bör moderatorerna ingripa mot bland annat våld och hatpropaganda.

Facebook definierar hatpropaganda som direkta angrepp på människor baserat på exempelvis ras, etnicitet, nationalitet eller sexuell läggning. Att kalla en människogrupp mindre värd eller att uppmana till våld kan vara ett angrepp.

Sådana skriverier borde snabbt försvinna från Facebook, men i verkligheten är det ändå inte så.

Den svaga modereringen syns i rätten i Finland. Under de senaste åren har tingsrätter på olika håll i Finland gett tiotals domar för inlägg som publicerats på Facebook.

En fällande dom i en domstol innebär förstås inte automatiskt att modereringen skulle ha misslyckats. Ett beslut om att inte väcka åtal visar heller inte att modereringen har fungerat.

Antalet rättsfall visar ändå att Facebook släpper igenom hatretorik som bryter mot Finlands lagar. Och det är bara de grövsta fallen som når rättssalarna.

- Det är tydligt att det på Facebook finns uppvigling till våld och stämplande skriverier om minoriteter som man inte gör nånting åt, säger Aleksi Knuutila, forskare i politisk kultur och kommunikation.

Finland är inte prioriterat

De läckta dokumenten visar att modereringen av Facebook inte riktigt funkar på något språk alls. På grund av problemen har företaget fokuserat nästan enbart på de stora språkområdena.

Facebook skapar automatiska system i första hand för de språk som det görs mest innehåll på. Prioriteringen påverkas också av hur stort hot om våld det finns i de länder där språket talas.

Bland högriskländer toppas listan av redan våldsdrabbade stater. Men om Facebook anser det vara svårt att skapa automatiska system för språkområdet tas det inte alls med på listan.

Språk som prioriteras för automatisk igenkänning av hatprat

Språkprioritering på Facebook

1. prioritet

  • engelska, franska, amhariska, oromo, urdu, bengali, hindi, burmesiska, arabiska

2. prioritet

  • tyska, spanska, portugisiska, italienska, indonesiska, thailändska, ryska, tagalog

Språkprioritering på Instagram

1. prioritet

  • engelska, spanska, arabiska, indonesiska

2. prioritet

  • ryska, franska, portugisiska, tyska

Det har sitt pris att hamna på prioriteringslistan. I ett av de läckta dokumenten påpekas det att det tar resurser från den mänskliga granskningen då man tränar upp algoritmer. På krisområden är granskarna redan nu överarbetade.

Algoritmerna fungerar i Finland, men inte på finska

Facebook tränar algoritmer på några tiotal språk, beroende på ämne. Till exempel sållar Facebooks artificiella intelligens coronarelaterat innehåll på 17 olika språk, medan den algoritm som följer samhälleliga ämnen har tränats att fungera på 31 språk.

Även om algoritmerna enligt dokumenten inte har utvecklats för finska så går de igenom innehåll som publicerats i Finland på andra språk.

Enligt Facebooks egen forskning känner algoritmen för samhälleliga ämnen igen omkring en femtedel av den samhälleliga diskussionen i Finland.

Algoritmen ifråga är tränad att förutom engelska förstå åtminstone svenska, ryska och arabiska. Man kan dra slutsatsen att omkring en femtedel av det samhälleliga innehållet på Facebook är skrivet på något av dessa språk i Finland.

Det lämnar mycket att granska åt ett fåtal finländska moderatorer.

Å andra sidan skulle algoritmerna kanske inte hjälpa så mycket som Facebook har låtit förstå.

Facebook är selektivt med att ge ut siffror

I och med coronapandemin har Facebook i allt högre grad tvingats ta till automatiska verktyg. Att moderera känsligt innehåll är inte ett jobb som kan göras hemifrån, så AI får göra det jobbet.

Då den nya arbetsfördelningen togs i bruk erkände Facebook att algoritmerna till en början kan ha svårt att skilja på godtagbart och förbjudet innehåll.

Efter förändringen steg antalet träffar för hatpropaganda från 9,6 miljoner till 22,5 miljoner under ett kvartal. Enligt företaget berodde ökningen på de avancerade algoritmerna och att automatiken togs i bruk på spanska, arabiska och indonesiska.

I sin rapport skröt Facebook om att algoritmerna känner igen 95 procent av all hatretorik redan innan någon användare har hunnit anmäla innehållet.

Det här betyder inte att algoritmerna känner igen 95 procent av alla hatinlägg som publiceras på plattformen. Facebooks mätare för "prediktiv observation" innebär att ett innehåll som märks av algoritmen med 95 procents säkerhet är hatretorik.

Med andra ord leder felaktiga igenkänningar till sämre noggrannhet, men hatretorik som inte upptäcks påverkar inte mätaren överhuvudtaget.

"Sådan sållning löser inte problemen med hatretorik", skriver en anonym datavetare på Facebooks interna plattform.

En anställd som lämnade bolaget i slutet av fjolåret påpekar i sin avskedsanmälan att Facebook enligt sina siffror borde ha modererat mångdubbelt mer för att göra skillnad i mängden hatretorik.

I verkligheten åtgärdar Facebook enligt dokumenten bara några procent av all hatretorik som dyker upp på plattformen. Med bolagets nuvarande strategi är det mycket svårt att på kort sikt höja den andelen över 20 procent.

Det här är en översättning av Yle Uutisets artikel Facebook ei ymmärrä suomea – Ylen tutkimat vuotoasiakirjat paljastavat, ettei yhtiö pysty hillitsemään vihapuhetta skriven av Teemu Hallamaa. Översättning och bearbetning: Linus Lång.