Multitask Unified Model, o semplicemente Google MUM è la nuova tecnologia multitasking mille volte più potente di BERT. MUM ha ottenuto risultati stupefacenti quando è stato applicato alla ricerca. Quando il sistema è stato applicato alle ricerche di Google per le query relative alle informazioni sui vaccini anti-Covid, i risultati sono stati davvero eccezionali.
Il problema posto è la traduzione dei nomi dei vaccini in oltre 800 varianti. AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e molti altri ancora, in ogni paese presentano un nome diverso. Di conseguenza un utente che effettua una ricerca su Google relativa alle informazioni sui vaccini, può usare un nome, piuttosto che un altro (come ad esempio: “Coronavaccin Pfizer”, “mRNA-1273”, “CoVaccine”, ecc…). Google deve essere in grado di capire qual è il vaccino al quale l’utente fa riferimento, per fornire le informazioni corrette e aggiornate. Quindi è necessario che sia in grado di identificare le diverse terminologie utilizzate dai vari utenti nel mondo. Ed è proprio qui che entra in scena Google MUM. Il sistema riesce ad individuare, in pochi secondi, oltre 800 varianti di nomi di vaccini in più di 50 lingue!
Google MUM: caratteristiche e funzioni
Google MUM base il suo funzionamento su un’architettura di tipo transformer. Il sistema è in grado di compiere contemporaneamente diverse operazioni: comprendere e generare il linguaggio (in ben 75 lingue diverse) e agire in multimodalità, così da apprendere il maggior numero di informazioni da fonti diverse e in forme differenti.
MUM è in grado di trasferire le conoscenze acquisite in una lingua, a tutte le altre, senza aver bisogno di apprendere nuove funzionalità. Questa caratteristica è possibile perché MUM richiede molti meno input di dati rispetto ai sistemi precedenti. L’ambiguità del significato delle parole non riguarda solo l’esempio delle query dei vaccini. Infatti molte parole in una lingua hanno lo stesso significato. In italiano, ad esempio, questo accade con parole come lapis o matita, oppure penna e biro. La stessa cosa avviene anche nelle altre lingue e questo dipende dalle caratteristiche della lingua di riferimento, oppure da tendenze e sfumature culturali.
Quando è scoppiata la pandemia, Google ha dovuto affrontare la sfida che lo voleva protagonista nelle ricerche che gli utenti di tutto il mondo stavano facendo in molteplici lingue e con terminologie diverse, per cercare informazioni affidabili sulla diffusione del nuovo virus. A distanza di un anno circa si trova ad affrontare un problema similare riguardo ai diversi vaccini. Questa volta però ha dalla sua parte la tecnologia Multitask Unified Model (MUM), mille volte più potente di BERT.