Slik bestemmer du om dine data kan brukes til AI-trening

Den siste tiden har det vært mye debatt om at Meta vil bruke den offentlige informasjonen vår på sine plattformer til å trene sine AI-modeller. Dessverre har det blitt en storm i et vannglass, som i liten grad er bygget på sakens realiteter. Sannheten er at flere av techgigantene gjør det samme, og at du selv enkelt kan bestemme hvilke av dine data de kan bruke til å trene sine AI-systemer. Her får du vite hvordan.

– Jeg tenker at nå må vi gi Meta fingeren, fordi Meta gir oss fingeren. Nå sletter jeg Facebook-profilen min før 26. juni, sa Inga Strümke til TV 2 på lørdag.

Utbruddet kom etter at Meta sendte ut en epost til sine brukere om at de endrer sine retningslinjer for personvern til også å inkludere at de kan bruke offentlig informasjon på sine plattformer til å trene sine AI-modeller. I praksis betyr det at de kan bruke tekst og bilder du og jeg deler på Facebook og Instagram til å trene sine AI-modeller.

Det er viktig å understreke at det kun er offentlig tilgjengelig informasjon de vil bruke. Poster og meldinger du deler bare med venner eller i en lukket gruppe vil ikke bli brukt. Den teksten og de bildene som blir brukt til å trene AI-modellene er den samme informasjonen som hvem som helst kan se, også utenfor Facebook og Instagram.

Det er også viktig å være klar over at flere av techgigantene gjør det samme som Meta. Googles personvernregler har nesten identisk tekst som Metas, og og plattformer som Snapchat og X beskriver at de bruker dine data «til å utvikle våre tjenester», uten så angi spesifikt om det innebærer å trene AI på din tekst og dine bilder. Har du informasjon som er åpent tilgjengelig på andre plattformer enn Facebook og Instagram, er det mulig at denne informasjonen også blir brukt til å trene AI.

Alle de store AI-aktørene trener sine modeller på informasjon som er åpent tilgjengelig på internett, så det er sannsynlig at den samme informasjonen allerede er brukt til å trene andre AI-modeller, uten at du vet det. Det samme gjelder all annen informasjon du har delt på internett. Har du en blogg, en nettside eller bruker andre sosiale medier, er sannsynligheten stor for at teksten og bildene dine allerede er brukt til å trene AI-modeller.

Hvorfor gjør Meta dette?

Meta begrunner endringen med at de, i forbindelse med at de lanserer sine AI-tjeneste i Europa, trenger å trene modellene på europeiske språk. De vil med andre ord bruke norske Facebook-poster til å lære Meta AI norsk.

Det er et kjent problem for techgigantene å finne nok data når de skal trene de store generative modellene sine. Det er et ekstra stort problem når det gjelder små språk, som norsk. Selv om ChatGPT forstår og skriver bra norsk, er den mye dårligere på norsk, enn på store språk, som engelsk. Det er fordi norske tekster utgjør en forsvinnende liten del av dataene den er trent på.

På Island har myndighetene inngått et samarbeid med OpenAI, for å gjøre ChatGPT bedre i stand til å lese og skrive islandsk.

Her i Norge har NTNU-organisasjonen NorwAI utviklet språkmodellen NorLLM, som er trent på store mengder norske tekster.

Denne utfordringen ønsker Meta å løse ved å bruke offentlige poster fra brukere i Norge og andre europeiske land til å trene sine modeller på de lokale språkene.

Har Meta lov til å bruke dataene dine?

Meta mener at de har lov til å bruke dataene på plattformen fordi Meta AI vil være en integrert del av tjenesten de tilbyr. Derfor har de valgt «legitim interesse» som behandlingsgrunnlag for å bruke informasjonen vår.

Om det er juridisk holdbart i henhold til GDPR, vil helt sikkert bli vurdert av EUs jurister. Den prosessen vil imidlertid ta en stund, så inntil videre må vil forholde oss til at Meta bruker den offentlige informasjonen vår som de har beskrevet.

Hva bør du gjøre?

Først og fremst er det viktig at du bruker personvernfunksjonene på alle sosiale plattformer, og har et bevisst forhold til hvem som kan se informasjonen din. Det er viktig uavhengig av denne saken.

Hvis du ikke er komfortabel med at ukjente ser det du deler i sosiale medier, bør du endre synligheten til å bare gjelde de du er vener med. På Metas plattformer kan du gjøre det på hver enkelt post, eller på alle poster samtidig i personvernsenteret.

Hvis postene dine ikke er offentlig tilgjengelig for alle, vil de heller ikke brukes til å trene Metas AI-modeller, eller andre AI-modeller.

Facebook kan du endre synligheten på en post ved å klikke på symbolet under navnet ditt på posten. Hvis symbolet er en globus, er posten offentlig tilgjengelig for alle. Klikk på globusen og velg ‘Venner’ eller et av de andre valgene, så vil ikke posten bli brukt til å trene AI. Facebook lar deg også endre synligheten på alle postene dine med et enkelt klikk. Gå på menyen og velg Innstillinger og personvern. Klikk på Personvernsjekk, og velg ‘Hvem kan se det du deler’. Etter å ha gått gjennom noen innstillinger, kommer det opp et valg som heter ‘Begrens tidligere innlegg’. Velger du det, vil alle innleggene dine settes til ‘Venner’ eller ‘Nære venner’.

Poster på bedriftssider på Facebook har ikke mulighet til å endre synlighet. De er offentlige som standard, og kan ikke endres.

Instagram har du litt færre muligheter. Du kan bestemmer publikum når du deler en poste, men ikke endre det etterpå. Du kan imidlertid arkivere innlegg. Da blir det ikke slettet, men fjernes fra innleggene på profilen din. For å arkivere et innlegg åpner du innlegget fra profilen din, klikker på de tre prikkene oppe til høyre og velger ‘Arkiver’. Et annet alternativ er å sette hele profilen din til ‘Privat’, så bare de som følger deg kan se innleggene dine. Da vil de heller ikke bli brukt til å trene AI.

Det er også mulig å be Meta om et generelt unntak fra at dine data kan brukes til å trene AI-modellene deres. Det kan du gjøre ved å fylle ut skjemaet du finner her. Å fylle ut skjemaet forhindrer imidlertid ikke at andre aktører trener sine AI-modeller på dine Facebook- og Instagram-data som er åpent tilgjengelig på nettet.

Det er selvfølgelig også mulig å slette kontoen sin på både Facebook og Instagram. Min personlige mening er imidlertid at det er en beslutning du eventuelt bør ta uavhengig av denne saken. Når vi bruker sosiale medier, kan andre se informasjonen vår. Det er noe av poenget med sosiale medier.

Slik er det også med internett generelt. Åpen informasjon på internett er tilgjengelig for andre, også for techgiganter som trener store AI-modeller.

Et lite hjertesukk til slutt:

Mange har klaget på Metas dårlige kommunikasjon. De har min fulle støtte. Både Meta og de andre techgigantene er notorisk dårlige til å kommunisere med sine brukere. Mye av denne og andre debatter kunne ha vært unngått med bedre kommunikasjon.

Mye av den norske kommunikasjonen bære preg av å være oversatt av AI-modeller som ikke skriver veldig godt norsk. Kanskje kan det bli bedre med trening på norske Facebook-poster?

Aldri så galt at det ikke er godt for noe.


You may also like...

1 Response

  1. 10. juni 2024

    […] Jeg har skrevet en egen bloggpost om hvordan du kan beskytte innholdet ditt. […]

Skriv en kommentar

Dette nettstedet bruker Akismet for å redusere spam. Lær om hvordan dine kommentar-data prosesseres.