EST. CABINA DEL TELEFONO – NOTTE
Terminator prende il telefono dalla mano di John Connor. La voce di Janelle filtra attraverso il ricevitore.
T-1000
(con la voce di Janelle) Tesoro, tu stai bene?
TERMINATOR
(con la voce di John Connor)
Si, sta tranquilla, sto bene!
(rivolto a John, sottovoce e con la propria voce naturale)
Come si chiama il cane?
JOHN
Max
TERMINATOR
(rivolto a Janelle con la voce di John Connor)
Ehi Janelle che succede a Bobby, lo sento abbaiare? È tutto ok?
T-1000
(con la voce di Janelle)
Bobby sta bene tesoro, sta benissimo, ma tu dove sei?
Terminator attacca il ricevitore e si rivolge a John.
TERMINATOR
(con la propria voce naturale)
I tuoi tutori sono morti
Ok, come incipit per un articolo sul voice cloning è un po’ forte, ma è il modo migliore per far arrivare il nostro messaggio per riflettere su come la fantascienza, nelle sue forme letterarie e cinematografiche, sia sempre riuscita a misurare il tempo del progresso tecnologico.
La clonazione della voce umana, che oltre 20 anni fa era soltanto un effetto speciale, oggi è reale. Abbiamo lanciato il primissimo progetto di clonazione di un personaggio pubblico senese lo scorso Giugno 2022, realizzando il primo digital twin con aspetto e voce di una persona reale.
Precursore di molti altri che stiamo realizzando, un modo innovativo di rendere un brand ancora più vicino alle persone.
Voice cloning: la voce del tuo brand in digitale
In Questit abbiamo sviluppato un modello proprietario che permette ai nostri Artificial Human di replicare perfettamente la voce di una persona in carne e ossa e applicarla alla sua rappresentazione digitale.
Questo modello è in grado di generare fedelmente la cadenza, il tono di voce, l’accento di un individuo, riuscendo parallelamente a ridurre ai minimi termini tutto ciò che di metallico e sintetico di solito sentiamo nelle voci artificiali.
Specifiche tecniche:
Abbiamo stilato un documento di circa 60 frasi della lunghezza di un rigo, massimo un rigo e mezzo ciascuna, in modo tale che la registrazione della voce sia compresa in un intervallo di tempo tra i 4 e i 10 secondi. In totale all’incirca 20 minuti di registrazione.
Come realizzare il Voice Cloning con Algho?
Le frasi da leggere sono di carattere generale. Riguardano i contenuti che normalmente un utente chiede quando si rivolge a un servizio di customer care:
- Orario
- Contatti
- Prezzi
- Pre-vendita e Post vendita
- Pagamenti
- Date
Ma non mancano semplici frasi anche di cultura generale il cui intento è quello semplicemente di poter “catturare” il tono e la cadenza.
Infine, è stato necessario concentrarsi su alcuni termini specifici, non “naturali”, come prestiti linguistici o altre parole che sono entrate nel lessico quotidiano recentemente e che un sistema informatico non è ancora addestrato per poterli pronunciare correttamente.
L’aspetto più interessante è che una volta terminata la lettura di questo elenco di proposizioni non è necessario procedere ad ulteriori registrazioni.
Qualunque contenuto inseriremo all’interno dell’avatar, quindi anche termini o concetti non pronunciati o registrati precedentemente, il modello di voice cloning sviluppato sarà in grado di prenderli in automatico, generarli e pronunciarli con la voce autentica della persona scelta.
Perchè usare il Voice Cloning?
A che cosa serve clonare una voce? Semplice, a comunicare meglio. Tutte le aziende, chi prima chi dopo, hanno adottato e adotteranno all’interno dei propri sistemi tecnologie di AI che serviranno in primis a velocizzare i processi interni.
Per fare questo si rischia di rendere l’esperienza del consumatore/cliente fredda, distaccata e approssimativa…potremmo dire artificiale. Il voice cloning si inserisce proprio all’interno di questo “bias”: ovvero andare verso l’artificiale per poi tornare umani rendendo l’interazione più empatica e vicina agli utenti.
La voce di uno stilista, di un inventore ma anche di un CEO o di un testimonial renderà le tue pubblicità, i tuoi contenuti e il tuo servizio di customer care ancora più d’impatto e immediatamente riconoscibile, aumentando così la fidelizzazione.
Vuoi distinguerti dalla concorrenza? Fai come Terme Antica Querciolaia che ha realizzato un avatar che rappresenta uno dei volti noti della struttura, che ne riproduce sembianza e voce. I clienti si possono rivolgere al digital twin dialogando sul sito web o chiamando al centralino telefonico e persino chattando su messenger.
Voice Cloning: pericolo etico?
La questione etica dell’IA è al centro dell’attenzione e non può essere messa da parte soprattutto quando ci si trova dinanzi a tecnologie come questa.
Il voice cloning può “sottrarre alla morte” perché rende perpetua la voce di una persona ma questo non è un risvolto negativo.
Una voce, infatti, recita poesie, una voce racconta una storia, una voce ci tiene compagnia. La voce è lo strumento più importante per veicolare informazioni in modo semplice, la voce è qualcosa che rimane.
N.B. Algho è una soluzione 100% privacy by design e GDPR compliant, tutelare la privacy dei nostri clienti e degli utenti è per noi una prerogativa fondamentale.