Lo sguardo rappresenta un indicatore osservabile e affidabile dell’attenzione umana: quando eseguiamo una qualsiasi attività, dalla guida in macchina alla scelta di un prodotto sullo scaffale di un supermercato, sapere dove puntano e come si muovono i nostri occhi è in grado di trasmettere informazioni cruciali sui processi cognitivi e sulle nostre intenzioni. In altre parole, su quello che ci passa per la testa, e sulle decisioni che stiamo per prendere. I ricercatori usano i sistemi di tracciamento oculare (o eye tracking), in associazione a modelli di machine learning, in vari contesti, per esempio per rilevare cambiamenti nello stato di attenzione, oppure variazioni dello stato emotivo, o per aiutare l’utente a concentrarsi su passaggi rilevanti di un testo.
Fino a pochi anni fa, ottenere un tracciamento oculare accurato era possibile solo tramite hardware e dispositivi sofisticati e costosi, utilizzabili prevalentemente solo per esperimenti in laboratorio. Grazie a recenti progressi tecnologici, questi sistemi stanno diventando sempre più scalabili e accessibili. Oggi esistono sistemi di eye-tracking in grado di registrare con precisione i movimenti oculari su larga scala direttamente tramite il web, utilizzando fotocamere frontali su dispositivi mobili comuni come smartphone e laptop, senza alcun hardware aggiuntivo o calibrazione esplicita. WebGazer e SearchGazer sono esempi di applicazioni sviluppate per scopi di ricerca, ma poi utilizzati anche da privati e imprese, che usano la telecamera del computer per fare il tracciamento oculare dei visitatori di un sito web. È dunque solo questione di tempo prima che anche l’utente comune inizi a interagire quotidianamente con sistemi di eye-tracking dal proprio dispositivo mobile, e che questa tecnologia diventi uno strumento pervasivo nella vita di tutti i giorni, con le potenzialità ma anche i rischi che ciò comporta.
Il nostro lavoro “Predicting choice behaviour in economic games using gaze data encoded as scanpath images”, appena pubblicato sulla rivista Scientific Reports, è un esempio delle opportunità, ma anche dei rischi che questi sistemi comportano. Abbiamo utilizzato i dati raccolti durante un esperimento in cui i partecipanti giocano contro un avversario rappresentato da un computer, un tipo di gioco utilizzato comunemente in economia per studiare le interazioni strategiche. I giocatori sanno di trovarsi di fronte a un computer che fa sempre la scelta ottimale e razionale, quella orientata al profitto, e si suppone che anche il giocatore debba fare altrettanto.
I dati di tracciamento oculare registrati durante questo esperimento sono stati raccolti con un hardware altamente accurato e poi analizzati tramite scanpaths, ovvero mappe colorate che consentono di tracciare l’intera sequenza spazio-temporale dei movimenti oculari. Utilizzando gli scanpaths, dimostriamo che alcuni algoritmi di deep learning sono in grado di identificare con precisione le mosse dei partecipanti prima che questi prendano una decisione. Mostrando all’algoritmo solo una parte del totale dei movimenti oculari fatti dal giocatore per compiere la sua scelta, siamo stati in grado di prevedere correttamente (e quindi di anticipare) la scelta selezionata dal giocatore e il tipo di strategia tra le tre opzioni disponibili nel gioco, superando in performance metodi più tradizionali in grado di compiere questo tipo di analisi. Ad esempio, i movimenti oculari dei primi 15 secondi di una partita sono sufficienti perché l’algoritmo riesca a prevedere se il giocatore sceglierà la strategia di equilibrio, fornendo una previsione corretta 77 volte su 100.
L’esperimento ci mostra che, con l’ausilio dell’intelligenza artificiale, i movimenti oculari registrati in tempo reale potrebbero essere applicati per anticipare le scelte di un utente in un’ampia gamma di contesti strategici. Ciò porterebbe vantaggi ai consumatori, ad esempio fornendo feedback in tempo reale per evitare di fare scelte sbagliate in contesti online strategici. Ma, situazione forse ancora più plausibile, potrebbe creare una pericolosa asimmetria informativa a favore del sistema automatizzato e di chi controlla la tecnologia.
In linea di principio, nel contesto specifico, un algoritmo potrebbe essere in grado di utilizzare queste informazioni in tempo reale per anticipare la futura scelta di un giocatore. Inoltre, avendo incluso nello studio anche giochi caratterizzati da diverse strutture strategiche, possiamo dimostrare che il nostro approccio potrebbe rilevare la scelta di un individuo anche in contesti strategici mai visti prima dall’algoritmo.
I nostri risultati ci suggeriscono dunque che i dati di tracciamento oculare hanno il potenziale per favorire coloro che hanno i mezzi economici per raccogliere ed elaborare i dati con l’AI. Considerando tendenze come la crescente popolarità dei sistemi di realtà virtuale, la crescente partecipazione alla gig economy tramite app per smartphone e lo sviluppo di dispositivi che registrano il movimento degli occhi con elevata precisione in una varietà di condizioni tramite smartphone e laptop, la tecnologia di tracciamento oculare potrebbe diventare uno strumento vantaggioso per i consumatori. Perché non si trasformi però nell’ennesimo strumento a favore di interessi organizzati, le autorità pubbliche e i responsabili politici dovrebbero vigilare e regolare in modo efficiente questa nuova tecnologia.