El Data + AI Summit de Databricks es un evento anual organizado por Databricks, una empresa líder en el ámbito de la inteligencia artificial y el análisis de datos, de la cual Igerencia es partner certificado. El summit reúne a expertos, profesionales y líderes de la industria para explorar las últimas tendencias, innovaciones y aplicaciones en el campo de la inteligencia artificial y los datos. Edward Canney, CEO y fundador de iGerencia, representó a nuestra compañía en el evento anual Data + AI Summit de Databricks en San Francisco. Es relevante destacar que este evento contó con la participación de tres empresas colombianas, entre ellas iGerencia. Esto nos llena de orgullo al demostrar que como empresa colombiana seguimos liderando en innovación y tendencias, siempre buscando las soluciones tecnológicas más avanzadas para nuestros clientes. Durante la cumbre, Databricks enfocó su atención en la Inteligencia Artificial generativa y presentó diversas innovaciones en el campo de la IA y el Lakehouse.
El enfoque en la Inteligencia Artificial generativa resalta el punto de inflexión alcanzado con el crecimiento en la popularidad de los grandes modelos de lenguaje (LLMs, large language models). En abril, Databricks lanzó Dolly 2.0, el primer LLM afinado con instrucciones verdaderamente abierto, que impulsa aplicaciones como resúmenes de texto y chatbots, y permite su uso comercial por parte de empresas y desarrolladores independientes.
Recientemente, Databricks también adquirió la startup de IA MosaicML por 1.3 mil millones de dólares, con el objetivo de permitir a las empresas construir modelos de IA generativos con sus propios datos.
El enfoque de Lakehouse AI busca ofrecer el mismo enfoque centrado en los datos para la IA, unificando la plataforma de datos y IA para que los clientes puedan desarrollar soluciones de IA generativas más rápidamente y con mayor éxito, utilizando modelos SaaS fundamentales para entrenar sus propios modelos personalizados con datos empresariales.
Entre las nuevas capacidades anunciadas se encuentran:
Búsqueda Vectorial: Permite a los desarrolladores mejorar la precisión de sus respuestas de IA generativa a través de la búsqueda de embeddings. Los embeddings son representaciones numéricas del texto que capturan su información semántica, lo que facilita a las computadoras comprender las relaciones entre conceptos. Además, se crean y gestionan automáticamente los embeddings vectoriales a partir de archivos en Unity Catalog, la solución insignia de Databricks para búsqueda y gobierno unificados. Mediante integraciones con Databricks Model Serving, los desarrolladores pueden mejorar la respuesta de los modelos al agregar filtros de consulta a la búsqueda.
Ajuste fino en AutoML: Ofrece un enfoque de bajo código que permite a los clientes ajustar finamente los LLMs utilizando sus propios datos, lo que da como resultado un modelo producido por AutoML sin tener que enviar datos a terceros. Las integraciones con MLflow, Unity Catalog y Model Serving también permiten compartir el modelo dentro de una organización.
Modelos de código abierto seleccionados: El Databricks Marketplace ofrece una lista seleccionada de modelos de código abierto, que incluyen modelos para diversos casos de uso de IA generativa, como seguimiento de instrucciones, resumen de texto y generación de imágenes.
Además, se anunció MLflow 2.5, la última versión del proyecto de código abierto de la Linux Foundation. Las actualizaciones incluyen:
MLflow AI Gateway: Permite la gestión centralizada de credenciales para modelos SaaS o APIs de modelos, y proporciona rutas de acceso controladas para consultas, lo que permite flujos de trabajo integrados. Los desarrolladores también pueden cambiar el modelo de backend para mejorar costos y calidad, así como alternar entre proveedores de LLM. Además, permite el almacenamiento en caché de predicciones para realizar un seguimiento de las solicitudes repetidas y la limitación de la tasa para gestionar los costos.
Herramientas visuales de MLflow Prompt: Herramientas visuales sin código que permiten a los usuarios comparar la salida de los modelos en función de un conjunto de indicaciones, que se registran automáticamente en MLflow.
Otros anuncios realizados en el evento incluyen:
Actualización de Databricks Model Serving para habilitar el soporte de inferencia basada en GPU para LLMs, con un tiempo de latencia hasta 10 veces menor y costos reducidos.
Introducción de Databricks Lakehouse Monitoring para supervisar y gestionar de manera más efectiva todos los activos de datos y IA dentro del Lakehouse.
Capacidades de Lakehouse Federation, que permiten a los clientes descubrir, consultar y gobernar datos en todas sus plataformas de datos desde Databricks sin necesidad de mover o copiar los datos, eliminando así los silos de datos.
Lanzamiento de Delta Lake 3.0, que presenta el formato Universal (UniForm), que permite leer datos almacenados en Delta como si se tratara de Apache Iceberg o Apache Hudi.
Lanzamiento de LakehouseIQ, que utiliza IA generativa para comprender terminología, patrones de uso de datos, estructura organizativa y más, para responder preguntas en el contexto empresarial.
El Data AI Summit es una oportunidad invaluable para conectarte con profesionales afines, establecer contactos y ampliar tu red de contactos dentro de la comunidad de datos y AI. Para Igerencia es muy valioso poder hacer parte de estos espacios que nos ayudan a mantenernos actualizados y ofrecer soluciones de vanguardia y última tecnología para nuestros clientes.
Si quieres conocer más sobre cómo podemos ayudar a tu empresa a implementar soluciones para mejorar tus procesos y potenciar tus resultados, ¡Escríbenos! o haz clic en Agenda una reunión con nosotros
Comentarios