Creamos WaveKat partiendo de una convicción sencilla:
Toda pequeña empresa merece tener la voz de una grande.
Las pequeñas empresas pierden llamadas. No pueden costear una recepción ni un servicio de atención telefónica 24/7. Mientras tanto, las grandes empresas despliegan sofisticadas soluciones de IA de voz que gestionan miles de llamadas al día. Esa brecha no debería existir.
Qué estamos construyendo
WaveKat construye herramientas para la IA de voz en tiempo real. Empezamos con un conjunto de bibliotecas de código abierto:
- wavekat-core — primitivas de audio compartidas, como
AudioFramey la conversión de formatos de muestra - wavekat-vad — detección de actividad de voz con múltiples backends (WebRTC, Silero y más)
- wavekat-turn — detección de turnos, que sabe cuándo un hablante ha terminado de hablar
- wavekat-lab — un panel interactivo para probar y comparar backends de audio
Sobre estas bibliotecas construimos wavekat-voice, un sistema de atención telefónica con IA que se conecta a la infraestructura estándar SIP/RTP. Descuelga el teléfono, mantiene una conversación real y gestiona la llamada, para que el dueño del negocio no tenga que hacerlo.
¿Por qué empezar con el código abierto?
Creemos que la tecnología fundamental —VAD, detección de turnos, procesamiento de audio— debería ser abierta, auditable y de libre uso para construir sobre ella. Estos componentes básicos no deberían quedar encerrados tras contratos empresariales.
Qué viene después
Estamos enfocados de lleno en construir. Síganos en GitHub o vuelva por aquí: escribiremos sobre la ingeniería detrás de la voz en tiempo real, las decisiones de compromiso que tomamos y lo que aprendemos por el camino.