17/11/2022
Te descubrimos qué es la inteligencia artificial y cómo se usa en la actualidad, alguna de sus funciones y como BERT esta ayudando a las IA.
Seguro que alguna vez habrás pensado en lo bien que te vendría tener en tu vida al asistente J.A.R.V.I.S. de lron Man o a K.I.T.T., ese coche fantástico que tantos villanos ha ayudado a detener gracias a la información tan detallada que ofrecía, siempre en el momento justo. Her, los replicantes de Blade Runner, Hal de Odisea en el espacio…, la inteligencia artificial que muestran las películas poco tiene que ver con la interacción real con las máquinas a la que estamos habituados hoy día.
Es cierto que lo que aparece en las películas, en realidad, se corresponde con el llamado concepto de “superinteligencia” y no con el estado del arte actual en desarrollo app y web. Pero también es verdad que, aunque las promesas de la ciencia ficción estén todavía lejos de convertirse en cotidianas, la inteligencia artificial ya es un elemento de trabajo habitual para las empresas más innovadoras.
¿Cómo aplicamos la IA en CaixaBank Tech?
En el Grupo CaixaBank, hace tiempo que trabajamos con la inteligencia artificial. De hecho, fuimos parte del equipo que enseñó a hablar español a Watson a principios de la pasada década. Desde entonces, hemos desarrollado múltiples aplicaciones basadas en IA, algunas dirigidas a ayudar a nuestros empleados y empleadas en su trabajo diario y otras directamente enfocadas en mejorar el servicio y la asistencia a los clientes, como lo es nuestro asistente virtual de CaixaBankNow.
A este tipo de aplicaciones, las hemos denominado aplicaciones 100% cognitivas porque las diseñamos con la aspiración de que “razonen” como si de un humano se tratase o como si ese J.A.R.V.I.S. que vemos en las películas nos estuviese respondiendo. ¿Qué diría al usuario? ¿Qué elementos de interacción ofrecería? ¿Cómo acompañaría la información que nos está aportando?
Interfaces conversacionales con la IA
Las interfaces conversacionales por voz y texto se plantean, por tanto, como ejes vertebradores de este nuevo tipo de aplicaciones, pero en convivencia con otros elementos gráficos como serían botones, formularios o listados que deben permitir conseguir una interacción lo más simple y visual posible. La predicción de texto o el resaltado de las respuestas son otros elementos que deben acompañar también la interacción. Para esto último, por ejemplo, se están explorando modelos de Q&A con BERT usando Tensorflow.js.
Debido a esta interacción conversacional, la comprensión del lenguaje natural mediante p.e., algoritmos de clasificación de intenciones, reconocimiento de entidades, desambiaguadores semánticos o graph databases para la representación de los dominios de conocimiento y sus relaciones se hace indispensable.
Así humanizamos a las IA gracias a algoritmos como BERT
Estas nuevas aplicaciones precisan de dinamismo y humanización en sus explicaciones, por lo que se hace necesario la utilización de tecnologías de generación de lenguaje natural para poder expresar de una forma natural la información. Para ello, nos apoyamos en algoritmos de generación de deep Learning, como GPT-2/3 o BERT.
Otro rasgo fundamental de este tipo de aplicaciones es la personalización de los contenidos. Al igual que un humano sabe adaptarse a la persona con la que interactúa, adecuando tanto el contenido expuesto como el formato que utiliza al perfil de su interlocutor, estas aplicaciones también tienen que poder comprender a qué perfil se dirigen y personalizar la información que exponen, siguiendo siempre los criterios de privacidad de los usuarios.
Otras funciones que desempeña la Inteligencia Artificial
Y del mismo modo, tienen que poder recomendar y ser proactivas, anticipándose incluso a las necesidades que el usuario pueda tener. Para ello, poder generar un contexto de usuario mediante embeddings, es decir, representaciones latentes del mundo aplicativo que preservan las principales características de un usuario, sus vínculos y relaciones, es vital para así alimentar a los algoritmos de recomendación avanzados que se utilizarán.
Las aplicaciones cognitivas también deben ser capaces de saber tratar imágenes y vídeos, además de la voz, ya sea a través de técnicas de procesado de imágenes para, por ejemplo, su clasificación y extracción de información relevante o para la generación de imágenes a partir de una serie de datos de entrada. En este sentido, se está trabajando por ejemplo con graph neural networks y se están estudiando los avances de DALL-E.
Otro rasgo fundamental de estas aplicaciones es la adaptabilidad al entorno y, por lo tanto, la omnicanalidad. La aplicación también debe adaptarse a la propia movilidad del usuario y a los dispositivos disponibles, traspasando información de un canal a otro de forma transparente para él. Por ejemplo, el móvil es especialmente útil para escanear información con la cámara y explotarla mediante algoritmos de IA, pero el PC o la propia pantalla de la TV puede ser mucho más útil para revisar el detalle de gráficas y analizar los datos.
Las aplicaciones cognitivas también deben beneficiarse de la aplicación de tecnologías biométricas para facilitar las tareas de autenticación y para mejorar la seguridad aplicativa incluso de forma transparente para el usuario gracias a la aplicación, por ejemplo, de biometría conductual.
La arquitectura de la IA
Arquitecturas de eventos, orquestración de microservicios, monitorización continua a través de algoritmos de detección de anomalías basados en autoencoders y en topic modelling, MLOps… La infraestructura y tecnología detrás de este nuevo paradigma de aplicaciones no es simple y está en continua evolución, con muchos retos tecnológicos aún por superar. No obstante, paso a paso y trabajando en modo agile para poder ir validando vía MVPs esta nueva forma de interactuar con nuestros usuarios finales, nos vamos aproximando a este nuevo concepto aplicativo 100% cognitivo, que permite ofrecer experiencias que comienzan a recordar a esos “superasistentes” del cine.
tags:
Comparte: