OpenAI está lanzando una actualización significativa para su modo de voz, que promete convertir a su chatbot de IA en algo más similar a un asistente virtual.
Sin embargo, esta última incorporación al conjunto de tecnologías de OpenAI plantea varias preguntas sobre deepfakes, privacidad, derechos de autor, seguridad y preocupaciones generales en torno a la seguridad digital.
Modo de voz de OpenAI
El chatbot más avanzado de OpenAI, ChatGPT-4o, está recibiendo una actualización del «modo de voz«, actualmente implementada para un grupo limitado de usuarios pagos.
OpenAI, que se desarrolló por primera vez a fines de 2022, comenzó a probar lo que denominó «motor de voz» con un pequeño grupo de usuarios confiables a fines de 2023.
En una publicación de blog de marzo de 2024, OpenAI destacó las capacidades de su voice engine, que solo necesita una muestra de audio de 15 segundos para generar un discurso natural que se asemeja al del hablante original.
En los últimos meses, OpenAI ha probado las capacidades del modelo para encontrar puntos débiles en la tecnología, involucrando a más de 100 personas que hablaban 45 idiomas diferentes en 29 geografías.
Aunque el lanzamiento está limitado a ciertos miembros pagos, se planea una distribución completa una vez que se haya probado adecuadamente la seguridad de la herramienta.
Precauciones a tomar
Consciente de las posibles preocupaciones, OpenAI ha declarado que el modo de voz avanzado solo habla en cuatro voces predefinidas y está diseñado para bloquear salidas que sean de cualquier manera inapropiadas.
Además, ha establecido medidas para bloquear solicitudes de contenido violento o con derechos de autor.
En una publicación del 25 de junio en X, OpenAI explicó que el lanzamiento limitado de su modo voz avanzado necesitaría un mes adicional antes de su lanzamiento general.
La empresa está trabajando para mejorar sus capacidades para “detectar y rechazar ciertos contenidos”, entre otras cosas.
OpenAI sostiene que su tecnología debe cumplir con un alto nivel de seguridad y confiabilidad antes de su despliegue total.
Incidentes y controversias
OpenAI había intentado lanzar su nuevo modelo de voz, Sky, en mayo de 2024, pero se detuvo oportunamente justo antes de enfrentar la reacción negativa de Scarlett Johansson.
La actriz afirmó que había rechazado una oferta de Sam Altman para proporcionar la voz para el bot.
Además, alegó que OpenAI decidió imitar su voz para Sky y lanzarla de todos modos, lo que generó un considerable revuelo mediático.
Preocupaciones generativas
La IA, en su rápido avance, tiene la mala costumbre de provocar dilemas éticos y morales a cada paso.
La capacidad de la IA para transmitir autenticidad a través de deepfakes y réplicas de voz es una de las principales preocupaciones.
Las ramificaciones en el mundo real de la desinformación o la mala comunicación a través de mensajes de texto se amplifican con la posibilidad de suplantación de identidad por parte de la IA.
Esto podría provocar nuevos esquemas fraudulentos y estafas, o incluso interrupciones significativas en infraestructuras vitales.
OpenAI admite que su nueva herramienta de voz podría tener graves riesgos, especialmente importantes en un año electoral.
Dicho esto, la empresa parece comprometida a construir esta herramienta de manera responsable, trabajando con socios de todas las formas y tamaños para mitigar los posibles peligros.
La fragilidad de la confianza en el espacio digital
Internet está plagado de ataques de phishing, violaciones de la privacidad, fugas de datos, correos electrónicos no deseados y llamadas sospechosas de números desconocidos a través de WhatsApp, por nombrar solo algunos.
Si la IA continúa avanzando sin control y sin las regulaciones adecuadas, las cosas se complicarán rápidamente.
El lanzamiento de nuevas capacidades de voz por parte de OpenAI para GPT-4o es un paso hacia un dilema ético del que quizás no podamos salir fácilmente.
La tecnología promete avances significativos, pero también plantea serias preocupaciones sobre el robo de identidad y la seguridad digital.
La capacidad de replicar voces con una precisión tan alta abre la puerta a usos malintencionados que podrían socavar la confianza en la información y la comunicación digital.
Con información de CCN
Síguenos en nuestras redes sociales
Lea las noticias sobre Tecnología. Aquí