Studiu: Lucrările de examen rezolvate de AI, nedetectate în 94% dintre cazuri
Autorii studiului au declarat că descoperirea a fost „extrem de îngrijorătoare" .
Articol de Ana-Maria Anitoiu, Publicat: 09 Iulie 2024, 15:50 • Actualizat: 09 Iulie 2024, 15:50
Lucrările de examen rezolvate de inteligența artificială (AI) au rămas nedetectate în 94% dintre cazuri și au primit, în medie, note mai mari decât cele rezolvate de studenți în cadrul unui studiu realizat de cercetători de la Universitatea din Reading, din Regatul Unit al Marii Britanii și al Irlandei de Nord.
Conform rezultatelor studiului, aproape toate lucrările generate de inteligența artificială (AI) au rămas nedetectate în cadrul unui test recent al sistemelor de examinare ale universităților britanice.
De asemenea, cercetătorii de la Universitatea Reading au constatat că lucrările generate de AI au primit, în medie, note mai mari decât cele scrise de studenți reali. Aceștia și-au publicat concluziile în revista cu acces liber PLOS ONE, potrivit euronews.com.
Inteligența artificială a demonstrat deja că poate trece examenele, ceea ce a determinat unele școli și universități să le interzică studenților să utilizeze instrumentele AI disponibile, cum ar fi ChatGPT.
Cu toate acestea, aplicarea acestei reguli s-a dovedit a fi o provocare, conform noului studiu. Cercetătorii au prezentat examene rezolvate de AI pentru cinci cursuri diferite pentru o diplomă de licență în psihologie.
„Testul Turing”, trecut cu brio de AI
Ei au constatat că 94% dintre aceste examene nu au fost detectate în ceea ce au numit un studiu de caz de tipul „testul Turing". Numit după matematicianul și informaticianul britanic Alan Turing în 1950, acest test măsoară capacitatea unei mașini de a manifesta un comportament inteligent asemănător cu cel al unui om.
Autorii studiului au declarat că descoperirea a fost „extrem de îngrijorătoare" . „Conținutul răspunsurilor generate de AI nu a fost modificat de echipa de cercetători”, au precizat ei.
„În general, rata noastră de detectare de 6% supraestimează probabil capacitatea noastră de a depista utilizarea în lumea reală a AI pentru a trișa la examene", au menționat aceștia în studiu, adăugând că ar fi mai plauzibil ca studenții să modifice rezultatul AI pentru a-l face mai puțin detectabil.
În plus, în 83,4% din cazuri, subiectele generate de inteligența artificială au obținut note mai mari în comparație cu un grup ales aleatoriu din același număr de examene de la studenți reali.
O excepție a fost un modul care presupunea un raționament mai abstract, un aspect pe care inteligența artificială îl poate gestiona cu greu în comparație cu studenții reali.
„Rezultatele Testului Turing al examenelor invită sectorul educațional global să accepte o nouă normalitate, iar acest lucru este exact ceea ce facem noi la Universitatea din Reading.
Noile politici și sfaturi pentru personalul și studenții noștri recunosc atât riscurile, cât și oportunitățile oferite de instrumentele care utilizează inteligența artificială", au declarat autorii studiului.
Cercetătorii și-au exprimat îngrijorarea cu privire la integritatea academică în lumina acestor constatări și au sugerat că examenele supravegheate, în persoană, ar putea atenua problema.
Cu toate acestea, pe măsură ce instrumentele de inteligență artificială continuă să evolueze și să devină predominante în mediile profesionale, universitățile ar putea fi nevoite să exploreze modalități de a integra inteligența artificială în educație ca parte a „noii normalități”.
Citește și: Inteligenţa Artificială Generativă, utilizată de 22% dintre companiile globale