Se ti sei mai chiesto come suonino migliaia di voci umane reali — età, accenti e lingue diversi — esiste un dataset per questo. Si chiama Mozilla Common Voice ed è una delle più grandi raccolte aperte di parlato registrato al mondo.
Persone da ogni parte leggono volontariamente frasi ad alta voce e donano le proprie registrazioni. Il risultato è una libreria enorme e multilingue di voci reali — liberamente disponibile per chiunque.
C’è solo un problema: esplorarla davvero è difficile.
Il dataset è enorme, gli strumenti no
Common Voice contiene milioni di clip audio in decine di lingue. Per scorrerlo, di solito dovresti scaricare gigabyte di dati, scrivere script per analizzare i file di metadati e allestire la tua catena di riproduzione. Va bene se sei uno sviluppatore, ma esclude tutti gli altri — ricercatori, linguisti, team di prodotto, persone curiose che vogliono semplicemente sentire come suonano i dati.
Ci è sembrata un’occasione mancata.
Così abbiamo costruito Common Voice Explorer
Common Voice Explorer è un semplice strumento web che ti permette di sfogliare il dataset direttamente nel browser. Nessun download, nessuno script, nessuna configurazione.

Ecco cosa puoi fare:
- Cerca per frase — digita una parola o un’espressione e trova all’istante le clip che la contengono
- Filtra per parlante — restringi i risultati per genere, fascia d’età o lingua
- Filtra per durata — trova frasi brevi o lunghe, a seconda di ciò che ti serve
- Ascolta subito — clicca su una clip e ascoltala con una forma d’onda visiva, regola la velocità di riproduzione, vai avanti o indietro
- Scarica le clip — salva singole registrazioni per consultarle offline
È pensato per dare la sensazione di sfogliare una libreria musicale, solo che invece di canzoni esplori parlato reale di persone reali in tutto il mondo.
Per chi è?
Onestamente — per chiunque sia curioso dei dati vocali.
- Ricercatori che studiano schemi vocali, accenti o diversità linguistica
- Team di prodotto che valutano se Common Voice si adatti alle loro esigenze prima di impegnarsi
- Linguisti ed educatori alla ricerca di esempi parlati autentici
- Chi costruisce AI vocali e vuole verificare rapidamente la qualità dei dati
- Chiunque trovi semplicemente affascinante sentire come persone diverse pronunciano la stessa frase
Non serve essere tecnici per usarlo. Se sai usare una barra di ricerca e cliccare play, sei a posto.
Perché è importante per noi
In WaveKat stiamo costruendo strumenti di AI vocale per le piccole imprese. Quel lavoro dipende da dati vocali di alta qualità. Common Voice è una delle risorse aperte più importanti in questo ambito e crediamo che renderlo più accessibile vada a vantaggio di tutti — non solo degli ingegneri.
I dati aperti hanno valore solo se le persone possono davvero esplorarli. È questo il divario che volevamo colmare.
Provalo
Common Voice Explorer è online su commonvoice-explorer.wavekat.com. Accedi con GitHub, accetta i termini d’uso e inizia a esplorare.
C’è anche una breve demo su YouTube se vuoi prima vederlo in azione.