wavekat
voz docs blog
← volver al blog

Common Voice Explorer — Escuche las voces del mundo

· Eason Guo
#herramientas #datos-abiertos #voz-ia

Si alguna vez se ha preguntado cómo suenan miles de voces humanas reales —distintas edades, acentos, idiomas—, existe un conjunto de datos para ello. Se llama Mozilla Common Voice y es una de las mayores colecciones abiertas de habla grabada del mundo.

Personas de todas partes leen frases en voz alta de forma voluntaria y donan sus grabaciones. El resultado es una enorme biblioteca multilingüe de voces reales, de libre disposición para cualquiera que quiera usarla.

Solo hay un problema: explorarla de verdad es difícil.

El conjunto de datos es enorme; las herramientas, no

Common Voice contiene millones de clips de audio en docenas de idiomas. Para examinarlo, normalmente habría que descargar gigabytes de datos, escribir scripts para analizar los archivos de metadatos y montar su propio sistema de reproducción. Eso está bien si usted es desarrollador, pero deja fuera a todos los demás: investigadores, lingüistas, equipos de producto y personas curiosas que solo quieren oír cómo suenan los datos.

Nos pareció una oportunidad desaprovechada.

Por eso creamos Common Voice Explorer

Common Voice Explorer es una sencilla herramienta web que le permite explorar el conjunto de datos directamente en su navegador. Sin descargas, sin scripts, sin configuración.

Common Voice Explorer — busque, filtre y escuche clips directamente en el navegador

Esto es lo que puede hacer:

Está diseñado para sentirse como navegar por una biblioteca musical, salvo que, en lugar de canciones, usted explora habla real de personas reales de todo el mundo.

¿Para quién es esto?

Sinceramente, para cualquiera que sienta curiosidad por los datos de voz.

No hace falta tener conocimientos técnicos para usarlo. Si sabe usar una barra de búsqueda y hacer clic en reproducir, está listo.

Por qué nos importa

En WaveKat estamos construyendo herramientas de IA de voz para pequeñas empresas. Ese trabajo depende de datos de voz de alta calidad. Common Voice es uno de los recursos abiertos más importantes en este ámbito, y creemos que hacerlo más accesible beneficia a todos, no solo a los ingenieros.

Los datos abiertos solo tienen valor si las personas pueden explorarlos de verdad. Esa es la brecha que quisimos cerrar.

Pruébelo

Common Voice Explorer está disponible en commonvoice-explorer.wavekat.com. Inicie sesión con GitHub, acepte los términos de uso y empiece a explorar.

También hay una breve demostración en YouTube por si primero quiere verlo en acción.

← volver al blog