El 5% de les notícies a la Viquipèdia ja són generades amb intel·ligència artificial

L'augment del contingut generat per IA en fonts d'informació populars planteja importants preocupacions sobre la responsabilitat, la precisió i l'amplificació del biaix. Més enllà de l'impacte directe en els consumidors, la presència generalitzada d'aquest contingut planteja preguntes sobre la viabilitat a llarg termini de l'entrenament de models lingüístics en grans escombrades d'Internet.

Més IA en anglès que en llengües llatines

Un estudi recent de Creston Brooks, experts en computació i llenguatge, ho han analitzat a través de GPTZero, un detector d'IA propietari, i Binoculars, una alternativa de codi obert, per establir límits inferiors sobre la presència de contingut generat per IA en pàgines de la Viquipèdia creades recentment. Ambdós detectors revelen un augment marcat del contingut generat per IA en pàgines recents en comparació amb les d'abans del llançament de GPT-3.5. Amb llindars calibrats per aconseguir una taxa de falsos positius de l'1% en articles anteriors a la GPT-3.5, els detectors marquen més del 5% dels articles de la Viquipèdia en anglès de nova creació com a generats per IA, amb percentatges més baixos per als articles en alemany, francès i italià. Els articles de la Viquipèdia marcats solen ser de menor qualitat i sovint són autopromocionals o parcials cap a un punt de vista específic sobre temes controvertits.

Així doncs, la IA es pot considerar un ajudant d'escriptura. I, fins i tot, han dissenyat un flux de treball LLM basat en la recuperació per escriure articles semblants a la Viquipèdia i han recopilat perspectives d'editors experimentats de la Viquipèdia sobre el seu ús. A més, la traducció habilitada per LLM pot reduir les barreres lingüístiques en els dominis de l'intercanvi d'informació. No obstant això, la facilitat creixent amb què és possible generar contingut a escala per sobrerepresentar una perspectiva particular té conseqüències previsibles i perilloses. Les persones són més propenses a creure afirmacions que es repeteixen amb freqüència, ja que la familiaritat es confon fàcilment amb la validesa. La confiança del consumidor és un determinant clau de la fortalesa econòmica, i la confiança en l'economia es basa en part en la fortalesa que els individus perceben la confiança dels altres. En la mesura que els resultats generats per IA mostren menys variabilitat que els textos generats per humans, podem esperar que els pics de polarització continuïn augmentant.

La Viquipèdia no nega l'evidència

D'altra banda, la mateixa plataforma no nega l'evidència del seu ús: "La intel·ligència artificial (IA) s'utilitza en diversos projectes de la Viquipèdia i Wikimedia. Pot estar directament relacionada amb la creació de contingut textual o en funcions de suport relacionades amb l'avaluació de la qualitat dels articles, l'addició de metadades o la generació d'imatges. Com passa amb qualsevol contingut generat per màquina, cal anar amb compte a l'hora d'utilitzar la IA a gran escala o a l'hora d'aplicar-la on el consens de la comunitat és tenir més precaució". I afegeixen: "Quan s'exploren tècniques i sistemes d'IA, el consens de la comunitat és preferir les decisions humanes als resultats generats per màquines fins que se'n comprenguin millor les implicacions".

L'explosió d'interès per ChatGPT des del 2022 ha provocat una major curiositat per l'ús de la IA generativa per ajudar a compondre articles de la Viquipèdia. L'estat del text generat per màquina a partir d'eines com ChatGPT s'accepta generalment com a domini públic, de manera que els problemes de drets d'autor no són un obstacle per a l'ús del text generat des d'un punt de vista legal.

El 5% de les notícies a la Viquipèdia ja són generades amb intel·ligència artificial

Els detectors marquen més del 5% dels articles de la Viquipèdia en anglès de nova creació com a generats per IA

Més IA en anglès que en llengües llatines

La Viquipèdia no nega l'evidència