El asistente de voz en el telefono es imprescindible para mi ahora ya que me libera de la tarea de escribir. Pero todo indica que estamos viviendo los últimos días de esta forma de comunicarnos ("yo hablo, tu escribes") a otra donde se llegue al ("conversemos").
Los usuarios de ChatGPT ya tienen la posibilidad de comunicarse con ChatGPT a través de audios y tambien de imagenes. ¡Esto significara en concreto que ChatGPT puede oír y hablar! y ademas ver!
Empecemos con el caso de audio. Hay un nuevo modelo de conversión de texto a voz (¡leer!) que genera un audio similar a la voz del ser humano. A partir de unos segundos de grabación de la voz del usuario el modelo crea voces sintéticas pero realistas. Y a partir de alli, puede sostener dialogos ! conversar ! es alli donde reside la llamada "inteligencia artificial"
Este modelo se llama Call Annie y está disponible en la App Store. Esta app tiene la apariencia humana de Annie, un avatar creado usando AI con un aspecto físico muy real.
Este aspecto fisico y el realismo de la conversación es impactante y lo consiguen primero por la sincronización perfecta entre el movimiento de labios de Annie con las palabras que salen de su boca y segundo con la minimización del tiempo de respuesta lo que da fluidez a la conversación.
Recomiendo que ingrese y hable con Annie en la dirección: Callannie.ai. Mis primeras conversaciones con Annie (en su version publica, gratuita) me han dejado entusiasmado mas que por el avance por el futuro que se puede prever, una gran barrera aparece haber caido.
Los primeros usuarios de las versiones de pago están impresionados por el producto, ya que recuerda las conversaciones anteriores, entiende oraciones complejas, puede regresar a partes anteriores de la conversación y hacer recomendaciones basada en cosas que el usuario dijo.
La califican de excelente para intercambiar ideas o discutir algo sobre lo que estás tratando de aprender.
Esta app tiene detrás suyo a ChatGPT, por lo que cuando conversamos con ella lo hacemos directamente con ChatGPT. Para los usuarios de un iPhone o iPad es posible hacer una video llamada con Annie mientras que para los usuarios de Android solo está disponible la posibilidad de llamadas telefónicas y Annie que inicialmente solo se comunicaba en inglés, ahora puede hacerlo en español, aunque un tanto "masticado" pero lo hace. No le he preguntado si habla en otros idiomas pero esa facilidad debe llegar muy pronto.
Pero no todo es miel, para video llamadas se requiere IPhone con un iOS 16 o superior como sistema operativo lo que significa disponer de un IPhone 14 o 15. Los usuarios podran escoger entre cinco voces diferentes para interactuar con ChatGPT.
Existe también la característica de incognito lo que aísla la conversación entre el usuario y ChatGPT haciéndola absolutamente privada.
Las compañías con servicios de atención al cliente vía Call Centers están atentas a la evolución de esta característica.
Finalmente, Call Annie tiene dos características singulares: puedes desactivar la cara para limitarse a hablar y puede ser breve si se lo pides.
Los hombres casados apreciaran mucho estos detalles.
Mi próxima columna hablaremos un poco del área visual de ChatGPT
Mi próxima columna hablaremos un poco del área visual de ChatGPT
NOTA FINAL. Una disgresión. ¿Porque OpenAI lanza en este momento estas dos características valiosas para el usuario de su producto estrella ChatGPT?
La respuesta esta en que Amazon, su rival por el mercado de AI, ha decidido invertir 4,000 millones de dólares en su producto Antrophic.
Y ante ello OpenAI lanza al mercado estas dos características obligando a Amazon a centrarse en mejorar lo ya hecho o a idear una manera distinta de hacer lo mismo que sea del agrado de los usuarios, con lo cual, como se dice en jerga, la pelota está en cancha de Amazon.
Estamos ya en medio de una feroz competencia tecnológica entre Amazon versus Google + OpenAI por sentar un standard en una nueva área tecnológica de impacto notable.


No hay comentarios:
Publicar un comentario
Si deseas pon tu nombre al inicio del comentario.