Errori di battitura: i misspelling che aiutano Google
Google ha introdotto ed utilizza da oltre 20 anni un sistema di controllo ortografico. L’algoritmo del motore di ricerca è in continua evoluzione e si adegua ai nuovi modi di scrivere e ai relativi errori ortografici. È strutturato in modo tale da sapere cosa sta cercando l’utente, nonostante gli eventuali errori ortografici commessi nella digitazione della query. Questo meccanismo si è reso indispensabile alla luce del fatto che almeno una query su dieci, contiene evidenti errori ortografici. In pratica si è reso necessario elaborare un algoritmo in grado di decifrare gli errori ortografici e grammaticali. Si tratta di un algoritmo ad elevata capacità di comprensione e correzione ortografica, così efficiente da riuscire a fornire comunque un risultato corretto ad una query contenente errori di battitura, in meno di 3 millisecondi.
Google grazie a questo algoritmo riesce a capire meglio il contesto delle parole che contengono errori di battitura e riesce a fornire suggerimenti appropriati agli utenti.
Errori di battitura: come funziona l’algoritmo di Google
La prima cosa che fa Google quando si imbatte in quella che sa essere una parola contenente errori di battitura, è classificarla. L’errore individuato è classificato come:
errore concettuale – si tratta degli errori compiuti quando non si sa bene come si scrive una parola e si tenta di indovinarla con la migliore ipotesi possibile
errore di slittamento del dito – (slip-of-finger) in questo caso rientrano nella casistica tutte le parole di cui si sa perfettamente l’ortografia, ma nonostante questo viene comunque scritta male
In passato l’algoritmo di Googlecorreggeva gli errori ortografici basandosi sul design delle tastiere inglesi. In pratica il motore di ricerca quando individuava una parola scritta in modo errato, per capire il vero intento di ricerca dell’utente, provava a sostituire la lettera che sbagliata con quelle immediatamente vicine. La sostituzione continuava con le lettere sempre più distanti da quella digitata, fino a quando la soluzione non veniva trovata (cioè fino a quando non veniva trovata una lettera per comporre una parola corretta).
Deep Learning: la nuova soluzione agli errori ortografici
Da qualche mese a questa parte Google ha però trovato un modo migliore per comprendere l’ortografia. Il deep learning ha fatto passi da gigante e finalmente è stata sviluppato un nuovo algoritmo di spelling che utilizza una rete neurale profonda che meglio modella e impara da errori di ortografia meno comuni e unici.
Adesso per Google è possibile eseguire un modello di oltre 680 milioni di parametri in meno di due millisecondi. In questo modo le ricerche degli utenti non sono interrotte dai loro stessi errori ortografici. Un sistema che consente ricerche precise e più veloci del battito di ali di un colibrì.
Il nuovo algoritmo, per capire cosa stia effettivamente cercando l’utente, utilizza il contesto nel quale è inserita la parole scritta ortograficamente in modo errato. È un sistema che funziona meglio perché adesso Google riesce a capire cosa vuole l’utente anche se l’errore di battitura che commette è nuovo e unico. L’algoritmo analizza infatti una ricerca nel suo contesto, vale a dire la relazione che le singole lettere e le parole composte hanno nella query.
In pratica il nuovo algoritmo di Google:
controlla e valuta l’intera query e non solo la singola parola errata
ricerca parole sostitutive che si adattino alla query digitata
Fornisce i risultati della ricerca in base alla “migliore corrispondenza”
Come gli errori influenzano Google
Gli errori di battitura, siano essi di concetto, piuttosto che di slittamento del dito, aiutano e influenzano Google. Il motore di ricerca infatti utilizza gli errori commessi dagli utenti per continuare a far evolvere la propria IA (Intelligenza Artificiale). Quindi anche un semplice e banale errore ortografico, in realtà serve a Google per migliorare nella comprensione dell’intento di ricerca dell’utente.