Tema treball de fi de Màster: Educational Data Mining

En aquest apunt, exposaré el tema, així com els objectius, del meu treball de fi de Màster SIC de la UOC.

La temàtica del treball està relacionada amb la mineria de dades d’àmbit educatiu.

Definició de la temàtica

La mineria de dades d’àmbit educatiu és una disciplina emergent que tracta de desenvolupar mètodes per tal d’explorar dades provinents de l’àmbit educatiu, i emprar-los després amb l’objectiu de comprendre millor als estudiants així com el seu procés d’aprenentatge.

Actualment, és possible obtenir grans quantitats de dades a partir de l’ús que fan els estudiants d’eines digitals, d’entorns col·laboratius en línia, de repositoris d’informació i documentació, així com de les mateixes eines administratives que posseeixen les escoles i universitats.

Respecte a la mineria de dades recordar que es tracta d'”un procés no trivial d’identificació vàlida, nova, potencialment útil i entendible de patrons comprensibles que es troben ocults en les dades (Fayyad i altres, 1996).

Sota el nom de mineria de dades s’engloba tot un conjunt de tècniques encaminades a l’extracció de coneixement processable, implícit en les bases de dades. Està íntimament lligat a la supervisió de processos industrials ja que resulta molt útil per aprofitar les dades emmagatzemades a les bases de dades.“. (Text extret literalment de la corresponent entrada de la Viquipèdia catalana).

Entorn tecnològic concret

L’entorn tecnològic en concret a estudiar serà un repositori documental basat amb el programa DSpace.

Extret altra vegada de la Viquipèdia en català:

DSpace és un sistema de dipòsit electrònic on s’emmagatzema, s’indexa, es preserva i es distribueix el material digital de recerca. Així, a part de poder trobar i emmagatzemar documents digitals més fàcilment, també es pot canviar el format d’un d’ells a un de més actual si aquest queda obsolet. Va ser desenvolupat pel Massachusetts Institute of Technology (MIT) i l’empresa Hewlett-Packard (HP).

Aquest sistema, que es pot utilitzar des del 2002, es pot adquirir en un paquet de programari lliure i normalment l’utilitzen centres de recerca i universitats.

Planificació del treball

Hem planificat el treball en dues fases:

– La primera consistirà en elaborar i conèixer el model de dades que disposem a partir del mateix DSpace, així com de l’entorn en el que està ubicat (per exemple, el servidor d’aplicacions o el mateix servidor web). Més clarament: Conèixer quins rastres deixen els estudiants en el seu pas pel repositori i conèixer de quines dades disposem per a posterior anàlisi.

– La segona part consistirà en l’aplicació de mètodes estadístics específics de mineria de dades a partir de les dades definides en el punt anterior.

Haig de dir que aquesta segona part és la que, ara mateix, doncs veig més fosca i és que no veig gens clara quin tipus d’informació resultant i conclusions puc obtenir encara que… de fet… això és precisament treballar en mineria de dades en un projecte de recerca no  😉 ?

Gerard

Gerard Farràs i Ballabriga.