Cali, abril 3 de 2026. Actualizado: miércoles, abril 1, 2026 21:04
WAXAL es un conjunto de datos abierto presentado por Google Research el 6 de marzo de 2026 que reúne grabaciones de voz y transcripciones en 27 lenguas de África subsahariana.
El objetivo declarado por sus autores es facilitar la creación de tecnologías de reconocimiento de voz (ASR) y de síntesis de voz (TTS) más representativas de la diversidad lingüística del continente.
El proyecto, iniciado en 2021, reúne trabajo colaborativo con universidades y organizaciones africanas y se publica bajo una licencia permisiva (Creative Commons CC‑BY‑4.0).
WAXAL agrupa dos colecciones principales orientadas a distintos usos:
El reconocimiento automático de voz (ASR) transforma audio en texto —por ejemplo, al dictar un mensaje—; la síntesis de voz (TTS) hace lo contrario, generando voz artificial a partir de texto —como la voz de un asistente virtual.
Hasta ahora, la mayoría de estas tecnologías funciona bien principalmente en idiomas con grandes cantidades de datos (inglés, español, etc.), dejando afuera a cientos de millones de hablantes de lenguas con menos recursos.
WAXAL busca abordar esa escasez de datos ofreciendo materiales que investigadores y desarrolladores pueden usar para crear servicios más inclusivos: asistentes, subtitulado automático, accesibilidad para personas con discapacidad, y herramientas educativas en lenguas locales.
Un aspecto central del proyecto fue que la recolección la lideraron organizaciones académicas y comunitarias africanas, con orientación técnica de Google Research.
Entre las instituciones participantes están Makerere University, University of Ghana, Digital Umuganda (en asociación con Addis Ababa University), el African Institute for Mathematical Sciences Senegal, Media Trust y Loud n Clear Communications Ltd.
Según la nota oficial, los socios mantienen la propiedad de los datos recolectados y acordaron publicarlos abiertamente para beneficio de la comunidad investigadora regional.
WAXAL se presenta además como catalizador de investigaciones ya publicadas y proyectos derivados, citando, entre otros:
La comunicación de Google Research presenta WAXAL como un primer hito y anuncia la intención de ampliar el corpus con más lenguas en el futuro. La nota se atiene a resultados de recolección y a trabajos académicos asociados; no se hacen afirmaciones sobre despliegues comerciales concretos ni sobre mejoras de rendimiento fuera de los estudios citados.
Esta nota fue generada 100% con IA. La fuente fue aprobada por Diario Occidente y el contenido final fue revisado por un miembro del equipo de redacción.


La curaduría y revisión editorial de estas notas está a cargo de Rosa María Agudelo Ayerbe, comunicadora social y periodista, con maestría en Transformación Digital y especialización en Inteligencia Artificial.
Desde su rol como líder del equipo de innovación y transformación digital del Diario Occidente, y a través de la unidad estratégica DO Tech, realiza un seguimiento permanente a las principales novedades en tecnología e inteligencia artificial a nivel global.
Estas notas se apoyan en un agente de investigación basado en inteligencia artificial, diseñado para monitorear semanalmente avances, lanzamientos y debates clave del sector.
El contenido es posteriormente leído, analizado, contextualizado y validado editorialmente antes de su publicación.
Este proceso forma parte del mecanismo de actualización continua que permite interpretar los desarrollos tecnológicos desde una mirada periodística, crítica y comprensible para audiencias no especializadas.

Fin de los artículos
Ver mapa del sitio | Desarrollado por: