Aquest sistema l’ha desenvolupat el doctorand Mohammed Jabreel, sota la supervisió d’Antonio Moreno, per a l’edició 2018 de la principal competició internacional sobre sistemes computacionals d’anàlisi semàntic de textos, SemEval.
Investigadors de la Universitat Rovira i Virgili (URV) han creat un sistema que detecta els tipus d’emocions i la seva intensitat en les xarxes socials mitjançant l’anàlisi semàntica.
El grup de recerca ITAKA (Intelligent Technologies for Advance Knowledge Acquisition) ha desenvolupat el sistema Emotion Intensity (EiTAKA), que permet determinar de quin tipus són i quina intensitat tenen les emocions expressades en les xarxes socials.
La competició consisteix a determinar la intensitat de les emocions i els sentiments en els textos publicats a Twitter, identificant si expressen disgust, por, alegria o tristesa.
Per això, el sistema EiTAKA processa primer els textos perquè “el llenguatge a Twitter és informal, amb enllaços o mencions, i també és comú utilitzar abreviatures i argot”, explica Jabreel.
Un cop depurat el “tweet” el converteix en un vector que el representa i, finalment, s’aplica la unitat de predicció.
Aquesta tercera unitat conté dos models: xarxes convolucionals per analitzar seqüències de paraules i regressors XGBoost, que permeten fer regressions i classificacions.
Com a resultat, donen unes prediccions que els investigadors s’agrupen per obtenir la predicció final.
“Aquest sistema es pot utilitzar per a diverses aplicacions en comerç, salut pública i benestar social, entre d’altres”, apunta Jabreel.
Així, pot aportar informació valuosa sobre com se senten els usuaris sobre un determinat producte o servei.
El doctorand de la URV ha quedat en la primera i segona posició en quatre de les cinc tasques proposades en àrab, i entre la cinquena i la onzena posició en quatre de les cinc funcions proposades en anglès.
Jabreel ja va quedar en les primeres posicions de la competició la passada edició i, ara, treballa en una nova versió del sistema que permeti resoldre la cinquena funció.