Nous avons fondé WaveKat avec une conviction simple :
Chaque petite entreprise mérite la voix d’une grande.
Les petites entreprises manquent des appels. Elles ne peuvent pas se permettre un accueil ni un service de réponse disponible 24/7. Pendant ce temps, les grands groupes déploient des IA vocales sophistiquées qui gèrent des milliers d’appels par jour. Ce fossé ne devrait pas exister.
Ce que nous construisons
WaveKat développe des outils pour l’IA vocale en temps réel. Nous commençons par un ensemble de bibliothèques open source :
- wavekat-core — des primitives audio partagées comme
AudioFrameet la conversion de format d’échantillon - wavekat-vad — la détection d’activité vocale avec plusieurs backends (WebRTC, Silero, et d’autres)
- wavekat-turn — la détection de tour de parole, qui sait quand un locuteur a fini de parler
- wavekat-lab — un tableau de bord interactif pour tester et comparer les backends audio
Au-dessus de ces bibliothèques, nous construisons wavekat-voice — un système de réponse téléphonique par IA qui se branche sur l’infrastructure SIP/RTP standard. Il décroche le téléphone, mène une vraie conversation et gère l’appel — pour que le chef d’entreprise n’ait pas à le faire.
Pourquoi commencer par l’open source ?
Nous pensons que la technologie fondamentale — VAD, détection de tour de parole, traitement audio — devrait être ouverte, vérifiable et libre d’utilisation pour bâtir dessus. Ces briques de base ne devraient pas être enfermées derrière des contrats d’entreprise.
Et ensuite ?
Nous sommes plongés dans le développement. Suivez-nous sur GitHub ou repassez ici — nous écrirons sur l’ingénierie derrière la voix en temps réel, les compromis que nous faisons et ce que nous apprenons en chemin.