< Tornar

LA INTEL·LIGÈNCIA ARTIFICIAL COM A EINA DE SUPORT A L’EDUCACIÓ A ANDALUSIA

30 de juny de 2023
Autor/a: Francisco Silveira
Biografia de l'autor/a:

Enginyer Informàtic. Treballant en el desenvolupament de Sistemes d’Informació i programari per a la gestió educativa durant més de vint-i-quatre anys i Cap del Servei de Sistemes d’Informació i Sistemes d’Informació i Sistemes Digitals durant més de catorze anys a la Conselleria d’Educació de la Junta d’Andalusia.

@pacosilve

Categoría: En perspectiva
Resum: Aquest document proporciona una perspectiva real dels casos d'ús per a l'aplicació de la IA en l'administració educativa. El context, un únic sistema d'informació que engloba totes les fonts d'informació sobre els diferents aspectes de l'educació a Andalusia des de fa 20 anys, que ha estat el Sistema d'Informació Sèneca, és el millor germen per aplicar tècniques de Machine Learning amb la finalitat de poder sondejar tendències, comportaments, predir recursos per a l'administració educativa i proporcionar a la comunitat docent eines de suport pedagògic a l'alumnat. Tot l'anterior amb un sobre de compliment de la normativa de protecció de dades. Aquesta va ser l'essència del projecte Hipàtia, nascut el 2019 a la Conselleria d'Educació de la Junta d'Andalusia.

La intel·ligència artificial (IA) és una tecnologia que està transformant molts aspectes de la societat, inclosa l’educació. [1] els avenços en IA estan permetent una major interacció entre professors i estudiants, i estan millorant la capacitat dels professors per personalitzar l’ensenyament i proporcionar un aprenentatge més eficaç. En els últims mesos, estem vivint una autèntica explosió mediàtica de la intel·ligència artificial amb l’aparició de múltiples eines basades en la intel·ligència artificial generativa (GAI), un camp del Machine Learning modern que dona lloc a sistemes capaços de generar qualsevol mena de contingut com àudio, imatges, text, objectes 3D, vídeos i molt més.

Diferents empreses i organitzacions han implementat eines basades en aquesta tecnologia, ja sigui per a la generació d’imatges com Dall-E o Stable-Difussion [2 i 3] o per a la generació de textos com el conegut ChatGPT [4]. Tots ells són sistemes dissenyats per generar dades que s’assemblin a les dades d’entrenament que se’ls proporciona. És a dir, els GAIs són capaços de crear noves dades que semblen haver estat produïdes per humans o per alguna altra font, a partir de patrons trobats en dades d’entrenament [5]. Tot i que aquestes IA s’estan popularitzant molt, també hi ha molts altres tipus diferents d’intel·ligència artificial, a part de les generatives, com les Xarxes Neuronals, l’Aprenentatge per Reforç, l’Aprenentatge Supervisat, l’Aprenentatge No Supervisat o el Processament del Llenguatge Natural (PNL).

Arribats a aquest punt, ens centrarem en l’Aprenentatge Supervisat, que és un tipus d’aprenentatge automàtic o Machine Learning (ML) en el qual l’algoritme s’entrena amb un conjunt de dades etiquetades [6]. S’utilitza per a tasques com la classificació i la regressió.

En l’àmbit educatiu, l’analítica predictiva basada en l’aprenentatge supervisat es pot fer servir com a eina per ajudar els professors a millorar l’ensenyament dels estudiants. Per exemple, els sistemes d’AI d’aprenentatge supervisat poden analitzar els resultats de l’avaluació i proporcionar als professors informació sobre els punts forts i febles de cada estudiant, cosa que els permet personalitzar l’ensenyament per satisfer les necessitats individuals de cada estudiant.

D’altra banda, l’aprenentatge automàtic no supervisat es pot usar per ajudar els professors a identificar patrons en el comportament dels estudiants i predir el seu rendiment. Això pot ajudar els professors a prendre decisions informades sobre com millorar l’ensenyament i intervenir de manera oportuna si cal.

1. La mina d’or de dades en l’educació andalusa: Sèneca.

En el context que l’analítica predictiva és una poderosa eina que ajuda a prendre decisions informades, basades en patrons i tendències històriques, la qualitat de les dades és un dels factors més influents. Una bona base de dades històrica i la normalització, estandardització i categorització de dades són essencials perquè la IA analítica predictiva tingui èxit. Si les dades són incompletes, inexactes o desactualitzades, els resultats de l’analítica predictiva poden ser inexactes o fins i tot enganyosos. A més, les dades de baixa qualitat poden conduir a decisions equivocades, la qual cosa pot tenir greus conseqüències per a una agència en la seva presa de decisions.

Per contra, una bona base de dades històrica permet als analistes i científics de dades identificar patrons i tendències que es poden utilitzar per predir el comportament futur, i d’altra banda, pot ajudar a identificar i corregir errors en les dades, fins i tot abans que afectin les decisions educatives. Aquests errors també poden donar-se en el món de l’educació quan s’analitzen sèries històriques i les formes d’avaluar els estudiants es veuen afectades pels canvis en les lleis educatives. Aquí és on el sistema d’informació de Sèneca esdevé essencial [7].

En el marc de referència de la Comunitat Autònoma d’Andalusia, el Sistema d’Informació Sèneca del Ministeri de Desenvolupament Educatiu i Formació Professional, és una plataforma que té més de vint anys d’antiguitat. Es caracteritza per tenir una base de dades centralitzada i única d’informació educativa, altament normalitzada i que abasta multitud d’aspectes de la gestió escolar i estudiantil: des del vessant acadèmic, seguit d’altres aspectes de seguiment educatiu com l’absentisme, l’abandonament escolar, l’orientació educativa i altres factors de participació, beques i ajuts o la convivència escolar. Sèneca va començar la seva implantació l’any 2002 i des de 2004 ja es va establir com a eina de gestió en totes les escoles que imparteixen docència des del parvulari fins al batxillerat, per la qual cosa és una font d’informació altament fiable per a l’anàlisi predictiva de qualsevol paràmetre o aspecte educatiu. A tall d’il·lustració, Sèneca té tota la informació acadèmica sobre més de 3,9 milions d’estudiants que estan o han estat en el sistema educatiu en aquests vint anys, la taula de qualificacions d’estudiants té 825 milions de registres i la taula d’absències d’estudiants té uns 711 milions de registres. Amb aquests volums de dades i amb aquestes sèries històriques, els científics de dades consideren que aquesta informació és una autèntica mina d’or de dades per poder realitzar multitud d’anàlisis predictives.

senece logo

Fuente de la imagen: Autor del artículo

2. El projecte Hypatia. Analítica Predictiva en l’Administració Educativa Andalusa.

En el context de tot l’anterior, el 2019 el Ministeri d’Educació va iniciar un projecte per al disseny i construcció d’una infraestructura de govern de dades amb la implementació d’un “llac de dades grans educatives” i la instal·lació de plataformes i eines que faciliten l’ús de tecnologies d’anàlisi predictiva. Aquest projecte, anomenat “Hypatia – Information Predictive and Analysis and Data Processing Tool with Artificial Intelligence” i cofinançat amb Fons FEDER i adjudicat a dues empreses andaluses, Ayesa AT i Datrik Intelligence per a la part d’IA i NTT-Data for Infrastructure and Data Governance, va començar amb un estudi pilot anonimitzat d’abandonament i després amb una anàlisi i plantejament de diferents casos d’ús per a la seva posterior implementació.

El pilot d’abandonament ja va obrir la llum a una primera experiència en la qual es van establir els objectius bàsics de l’estudi (incloent-hi identificar els factors que correlacionen amb l’abandonament escolar i conèixer les variables que mantenen els estudiants compromesos amb l’aprenentatge), es va dur a terme una fase de recollida de variables inicials i d’ampliació de variables, i finalment, es va dur a terme una “Anàlisi exploratòria de dades” i, en conseqüència, es va dur a terme la “Implementació de models d’aprenentatge automàtic”. Amb tot això, es van contrastar els resultats dels diferents models i com a producte, es va desenvolupar una eina d’anàlisi d’abandonament.

D’aquestes fases, cal destacar que al voltant de 150 variables es van obtenir d’una població d’uns 370.000 alumnes matriculats en un curs d’ESO, amb la traçabilitat disponible per a ells des que van començar primer de primària.

Després de la selecció de l’univers i de les variables d’estudi, es va realitzar un filtratge de les mateixes i una anàlisi exploratòria de les dades. Durant aquest procés es van generar variables addicionals a partir de les 150 variables inicials, arribant a un total de 430. Aquestes noves variables es van construir a partir de la reelaboració de la informació existent, ja sigui mitjançant contrast amb informació de domini públic (extreta de fonts de l’Institut d’Estadística i Cartografia d’Andalusia) o com a resultat de relacions entre les variables inicials.

Després d’aquest pas, es van implementar diversos models analítics avançats per predir l’abandonament, i es van comparar els seus resultats. Un cop seleccionat el millor model predictiu, es va desenvolupar un model de generació de dades d’abandonament escolar, que permet generar prediccions sobre qualsevol alumne pertanyent al sistema educatiu andalús.

Com a conclusió d’aquest projecte pilot, s’ha avaluat l’alt valor que una eina capacitada com aquesta pot aportar al sistema educatiu, sempre que s’implementin prèviament totes les mesures requerides pel GDPR, especialment la “Avaluació d’Impacte de Protecció de Dades”. Com a curiositat del model predictiu, es va destacar quin és el còctel de variables més influents en l’abandonament escolar per part d’un alumne, que actualment són: l’edat dels tutors legals en la franja de 25 a 30 anys, el nombre d’alumnes suspesos en el curs actual o passat i la repetició de la no assistència, obtenint habilitats predictives properes al 93% d’èxit per als alumnes de 4t curs d’ESO.

Després del projecte pilot, s’ha desenvolupat una consultoria per a casos d’ús reals que es poden aplicar al sistema educatiu, dels quals s’han explotat una sèrie de projectes, aprofitant que ja es disposa d’una infraestructura preparada per a noves analítiques predictives. Tots aquests casos desenvolupats fins ara s’han basat en la tesi inicial de dades absolutament anonimitzades perquè som conscients de la importància del GDPR i de tots els requisits exigits per aquesta normativa per a l’ús de dades personals, tal com s’explica al final d’aquest article. Aquesta ha estat una premissa essencial per al desenvolupament d’aquests casos d’ús.

D’aquesta manera, a partir d’aquest projecte pilot, posteriorment es van iniciar altres projectes. El primer va ser el “Estudi del comportament de la promoció/repetició d’alumnes per a cada nivell de cada escola per predir les unitats necessàries per al curs següent”. En aquest projecte es va poder desenvolupar un model de predicció de l’evolució acadèmica dels estudiants en cadascun dels cursos, amb l’objectiu d’obtenir, per a un estudiant matriculat en un ensenyament i curs escolar determinats, un model capaç de donar una probabilitat associada a cadascuna de les opcions d’evolució d’aquest alumne per al curs següent, que varien en funció de l’ensenyament. Amb aquestes probabilitats a escala d’estudiant, juntament amb els seus intervals de confiança, el que es pretén en última instància és estimar, per a cada centre, el nombre d’alumnes que s’inscriuran en cadascun dels cursos oferts en el curs següent, la qual cosa serviria per planificar fàcilment el nombre d’unitats necessàries en cada centre.El segon projecte que s’ha desenvolupat ha estat “Anàlisi i predicció de la plantilla de funcionament més precisa de cada escola per a un curs determinat”.

Aquest projecte formava part de la creació d’un model de predicció qualitativa i quantitativa del professorat per al curs vinent per als centres de secundària i C.P.I.F.P. És a dir, era interessant predir el nombre de professors de cada especialitat (un total d’uns 400 possibles) que prestaran els seus serveis l’any següent a cada centre d’ESO, Batxillerat i FP. L’objectiu principal és que el resultat de la predicció serveixi com a plantilla de partida que s’iterarà més endavant a les escoles i delegacions provincials al juny.

El tercer projecte, que està en fase de finalització, ha estat “Anàlisi i predicció de l’Escolarització en Cicles Formatius”. L’objectiu, en aquest cas, ha estat obtenir models per a tres grans grups diferenciats: 1r curs de cicles formatius de grau mitjà i superior, oferta presencial completa de Formació Professional Bàsica i processos d’escolarització amb una única convocatòria i premi. En funció del període d’escolarització, es pretén, en un futur, proporcionar informació a l’estudiant en forma de probabilitat d’admissió per a cada oferta disponible, ajudant-lo així a crear una llista de sol·licituds i a decidir si es matricula d’aquesta oferta o reserva plaça i espera la següent adjudicació, oferint les possibilitats d’admissió per a cadascuna de les opcions de l’estudiant.

Cal destacar que aquest model ja està implantat a Extremadura des de fa diversos anys, oferint als estudiants, a l’hora de presentar la seva sol·licitud d’admissió o reserva de plaça, consells predictius sobre les possibilitats d’obtenir plaça.

Independentment d’aquests projectes, hi ha altres projectes sorgits de l’anàlisi inicial de consultoria d’Hipàtia que han estat classificats com a possibles propostes de futur i que són susceptibles de ser desenvolupats com a eina per a la millora de la gestió educativa, entre ells “Auxiliar de Suport al Professor per a l’Acció Tutorial”, un sistema de recomanació per suggerir quins estudis cal seguir després de l’educació obligatòria.

3. Normativa d’IA i protecció de dades.

A més de ser una eina valuosa per a l’ensenyament, és important tenir en compte que l’ús de la IA en l’educació també comporta responsabilitats i preocupacions legals. A la Unió Europea, la regulació determinant en aquest context és el Reglament General de Protecció de Dades (RGPD) i a nivell estatal, la transposició d’aquesta normativa a la Llei Orgànica de Protecció de Dades i Garantia dels Drets Digitals (LOPDGDD)L’article 22 del RGPD estableix el consentiment explícit dels interessats o dels seus tutors legals, per al tractament automatitzat i l’elaboració de perfils.

També sota aquest marc normatiu, el concepte de tractament i la seva catalogació apareix en el Registre d’Activitats de Tractament, que inclou totes les activitats objecte de tractament de dades, els responsables i responsables d’aquest tractament, finalitats i altra informació obligatòria, com la cessió d’aquestes dades. Aquest Registre pel que fa a la Junta d’Andalusia es publica a internet [8].

De la mateixa manera, i en compliment d’aquesta normativa, el Ministeri compta amb la figura organitzativa del Delegat de Protecció de Dades d’Educació per a tots els centres educatius, que és la persona responsable de proporcionar assessorament i informació sobre protecció de dades al responsable o al responsable del tractament, supervisar el compliment del RGPD i assessorar en relació amb les Avaluacions d’Impacte, en el context de l’administració educativa i en els centres educatius.

Tenint en compte l’enfocament purament normatiu, el GDPR incorpora l’obligació per als responsables del tractament: avaluar l’impacte de les operacions de tractament en la protecció de dades personals, quan el tractament sigui susceptible de suposar un risc significatiu per als drets i llibertats de les persones, tenint en compte la naturalesa, l’abast, el context i les finalitats d’aquest tractament.

L’Avaluació d’Impacte de Protecció de Dades (EIPD) [9] és un procediment que busca identificar i controlar els riscos i, en definitiva, les dades personals que s’exposen i estan sota la seva responsabilitat. En el cas educatiu, les activitats de tractament consisteixen principalment en l’extracció, transformació i ús de dades personals, tant de l’alumnat com del professorat dels centres i serveis educatius dependents de la Conselleria, amb un objectiu específic, com pot ser la planificació de plantilles o unitats, o una previsió de la millor opció a l’hora de sol·licitar un cicle formatiuL’EIPD ha d’analitzar el cicle de vida de la informació i el flux de dades específic del tractament, identificant les activitats específiques dutes a terme en cada fase del tractament, les dades tractades, els implicats en el procés, així com les tecnologies implicades. A més, s’ha de determinar la necessitat i proporcionalitat del tractament i identificar els riscos associats a aquest. De tot això, ha de sorgir un pla d’acció amb una sèrie de mesures que és necessari implementar per reduir el risc actual i poder demostrar que els drets i llibertats de les persones i la seguretat de les dades estan garantits en el curs normal de l’activitat.

Cal destacar sempre que el risc zero no existeix, de manera que les mesures de control proposades en l’EIPD tenen com a objectiu minimitzar el risc associat al tractament fins a un nivell acceptable de risc.

En qualsevol cas, cal destacar que l’EIPD és un procés continu que no acaba amb l’elaboració d’aquest document, ja que, tal com estableix el RGPD en el seu article 35.11, s’ha de revisar que el tractament segueix sent conforme a l’EIPD i, en tot cas, s’ha de revisar de nou quan es produeixi un canvi substancial en alguna de les operacions de tractament.

Finalment, en aquest context normatiu, cal destacar que el Consell de la Unió Europea avança en una proposta de Reglament d’Intel·ligència Artificial destinada a garantir que els sistemes d’intel·ligència artificial (IA) introduïts al mercat comunitari i utilitzats a la Unió siguin segurs i respectin la legislació vigent en matèria de drets fonamentals, així com els valors de la Unió [10].

4. Conclusions

En conclusió, la intel·ligència artificial pot ser una eina valuosa per ajudar els docents a millorar l’ensenyament dels seus alumnes, pot ser útil a les mateixes administracions educatives per avaluar l’impacte de les seves polítiques, i pot predir el comportament de les famílies davant futures mesures educatives. No obstant això, des del punt de vista de la professió docent, és important utilitzar la prospecció de manera responsable i conjuntament amb altres estratègies pedagògiques i organitzatives efectives per garantir una educació de qualitat per a tots els estudiants.

L’ús de la IA a l’aula pot ser un element de suport per millorar l’ensenyament, però és important garantir que es compleixi la normativa de protecció de dades i que es respecti la privacitat i els drets dels estudiants. El professorat i l’administració educativa han de ser conscients d’aquestes responsabilitats i prendre les mesures necessàries per garantir un ús ètic i respectuós de les dades personals dels alumnes.

Un altre factor important perquè la IA arribi a l’aula quotidiana i s’integri en les eines que utilitzen habitualment els professors, com Sèneca, és el grau de maduresa de l’organització, que implica suplir el dèficit de cultura de dades entre els seus gestors i les seves unitats organitzatives i la necessitat d’un procés de gestió del canvi en l’organització enfocat a mostrar el potencial, a través de la IA, de predir o prospectar tendències, comportaments o desenvolupaments educatius i la importància del GDPR com a garant d’aquestes tecnologies. davant l’individu sobre el qual el es realitza el tractament, en el nostre cas els alumnes o el professorat.

En aquest context, la Junta d’Andalusia va crear el 2021 una nova entitat anomenada Agència Digital d’Andalusia (ADA), que defineix en els seus estatuts de creació com una de les seves finalitats: “La coordinació i execució de la planificació estratègica en matèria d’intel·ligència artificial i altres tecnologies facilitadores per a la transformació digital” [11]. Ja en 2022, amb la participació directa de l’ADA, es va aprovar la formulació de l’Estratègia d’Intel·ligència Artificial 2022 a 2025, que fixa entre els seus propòsits “Promoure capacitats competitives i pròpies en l’àmbit de la IA per a l’Educació a tots els nivells: Primària, Secundària, Formació Professional, Universitat i Ciutadania” o “Utilitzar la IA andalusa com a palanca de canvi en l’administració pública, que millorarà la competitivitat en la gestió de recursos, la presa de decisions, i l’agilització i millora dels serveis als ciutadans” [12] i això esperem donarà fruits més aviat que tard. Alineada també amb aquesta iniciativa i promoguda també per l’ADA, el setembre de 2022, es va aprovar la formulació de l’Estratègia Andalusa d’Administració Digital centrada en les persones 2023-2030 [13], els propòsits inclouen “Aconseguir una Administració Pública digital personalitzada, proactiva, útil, simplificada, interoperable, fàcil d’utilitzar, àgil i segura, que s’anticipi a les necessitats dels ciutadans i que els faciliti informació sense necessitat de sol·licitar-la, gràcies, entre altres, a l’aplicació de tecnologies com l’automatització i la mineria de processos, Big Data o intel·ligència artificial”.

NOTA: El Ministeri amb les competències en Educació a Andalusia es denomina actualment Ministeri de Desenvolupament Educatiu i Formació Professional.

Bibliografia i enllaços relacionats

[1] Zhai, X., Chu, X., Chai, C. S., Jong, M. S. Y., Istenic, A., Spector, M., … & Li, Y. (2021). A Review of Artificial Intelligence (AI) in Education from 2010 to 2020. Complexity, 2021, 1-18.
[2] Mansimov, E., Parisotto, E., Ba, J. L., & Salakhutdinov, R. (2015). Generating images from captions with attention. arXiv preprint arXiv:1511.02793.
[3] Ramesh, A., Pavlov, M., Goh, G., Gray, S., Voss, C., Radford, A., … & Sutskever, I. (2021, July). Zero-shot text-to-image generation. In International Conference on Machine Learning (pp. 8821-8831). PMLR
[4] Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … & Amodei, D.
(2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.
[5] Stiennon, N., Ouyang, L., Wu, J., Ziegler, D., Lowe, R., Voss, C., … & Christiano, P. F. (2020).Learning to summarize with human feedback. Advances in Neural Information Processing Systems, 33, 3008-3021.
[6] Kühl, N., Goutier, M., Hirt, R., & Satzger, G. (2020). Machine learning in artificial intelligence: Towards a common understanding. arXiv preprint arXiv:2004.04686.
[7] Séneca. Sistema de Información de Gestión de todos los Centros Docentes de la Comunidad Autónoma Andaluza. https://seneca.juntadeandalucia.es/
[8] Registro de Actividades de Tratamiento de la Junta de Andalucía. https://juntadeandalucia.es/protecciondedatos/buscador.html y https://www.juntadeandalucia.es/protecciondedatos/detalle/390103.html
[9] La evaluación de impacto relativa a la protección de datos (EIPD): https://www.aepd.es/es/guias-y-herramientas/herramientas/gestiona-eipd
[10] Futuro Reglamento de Inteligencia Artificial: https://www.consilium.europa.eu/es/press/press-releases/2022/12/06/artificial-intelligence-act-council-calls-for-promoting-safe-ai-that-respects-fundamental-rights/
[11] Agencia Digital de Andalucía: https://juntadeandalucia.es/boja/2021/65/43
[12] Estrategia Andaluza de Inteligencia Artificial: https://juntadeandalucia.es/boja/2022/28/2
[13] Estrategia Andaluza de Administración Digital centrada en las personas: https://www.juntadeandalucia.es/boja/2022/184/1

Share This