Mistral AI lanza LLM de código abierto, Mistral 7B

[ad_1]

Mistral AI, una startup floreciente en el sector de la IA, se ha propuesto revolucionar la inteligencia artificial (IA) generativa con su primer modelo de lenguaje grande (LLM), Mistral 7B.

La compañía espera que el nuevo modelo de 7 mil millones de parámetros se convierta en una alternativa de código abierto a las soluciones de inteligencia artificial actuales.

Modelos de instrucción Mistral 7B y Mistral 7B

Mientras que otros han establecido el estándar de la industria con sus modelos de “caja negra”, Mistral AI cree que un enfoque de código abierto impulsado por la comunidad puede superarlos.

Haciendo comparaciones con los movimientos de código abierto en navegadores web y sistemas operativos, Mistral sugiere que los modelos respaldados por la comunidad son el futuro.

El lanzamiento de Mistral 7 B es el primer camino significativo de la compañía hacia la creación de modelos especializados que compitan con soluciones de IA más grandes y establecidas.

Los pesos del modelo sin procesar se distribuyen con Bittorrent y en Hugging Face. Este documentación detalla el paquete de implementación que permite ejecutar rápidamente una API de finalización en cualquier proveedor de nube importante con GPU NVIDIA.

Mistral AI lanza LLM de código abierto, Mistral 7BCaptura de pantalla de Mistral AI, septiembre de 2023

Los modelos abiertos de Mistral AI tienen como objetivo ofrecer una adaptabilidad superior, permitiendo la personalización para tareas específicas y necesidades del usuario.

Este enfoque se promociona como ventajoso para las empresas que buscan mantener los costos bajos y al mismo tiempo mantener el rendimiento.

Además, la empresa cree que los modelos de código abierto serán herramientas críticas en la lucha contra los desafíos éticos asociados con la IA, como la censura y los prejuicios.

A medida que los modelos generativos continúan influyendo en la sociedad, la capacidad de auditarlos para detectar fallas y mal uso se vuelve cada vez más vital.

Cómo utilizar Mistral 7B gratis

El modelo Mistral 7B está disponible para descargarcon documentación en GitHub o a través de abrazando la cara.

Además, puedes chatear con el modelo Mistral 7B Instruct en Laboratorios de perplejidad.

Captura de pantalla de Perplexity, septiembre de 2023

Mistral AI llegó a los titulares con financiación inicial

Mistral AI fue noticia este verano cuando planteó $113 millones en financiación inicial en junio, lo que subraya la confianza de los inversores en el enfoque de código abierto.

La financiación fue condujo por Lightspeed Venture Partners, con más de una docena de inversores, incluidos Eric Schmidtex director ejecutivo de Google, que a menudo habla AI.

El equipo de Mistral AI está compuesto por científicos de datos, ingenieros de software e ingenieros de aprendizaje automático extraídos de DeepMind, Meta, Hugging Face y otros.

Arthur Mensch, cofundador y director ejecutivo de Mistral AI expresado entusiasmo por lo que la empresa planeaba lograr:

“Nuestra formación como investigadores en IA, combinada con nuestras respectivas experiencias profesionales dentro de las principales empresas tecnológicas del mundo, nos ha convencido de que existe un camino a seguir para un proyecto alternativo e innovador que nos permitirá difundir responsablemente la tecnología más prometedora de nuestra generación como lo más ampliamente posible.

Estamos orgullosos de iniciar este proyecto global desde Francia, nuestro país de origen, y de contribuir, a nuestro nivel, al surgimiento de un nuevo actor creíble en inteligencia artificial generativa de Europa. Durante los próximos meses centraremos toda nuestra energía y pasión en honrar la confianza depositada en nosotros por nuestros inversores”.

De acuerdo con la plataforma de lanzamientolos planes de Mistral incluyen desarrollar modelos de IA superiores a los de OpenAI en 2024.

En esa ronda (tercer trimestre de 2024), esperamos necesitar recaudar 200 millones para entrenar modelos que superen las capacidades de GPT-4. Una financiación sólida nos permitirá entrenar modelos en infraestructuras más grandes, lo que nos establecerá como un jefe en investigación en IA que será el proveedor de referencia de la industria europea.

Mistral AI espera lanzar progresivamente nuevos modelos que cierren la brecha de rendimiento entre sus soluciones de código abierto y sus ofertas patentadas como parte de su estrategia continua.

¿Francia se posiciona como el próximo jefe en el desarrollo de la IA?

En JunioEl presidente francés, Emmanuel Macron, un gran promotor de las nuevas empresas tecnológicas francesas, estuvo en VivaTech, la feria tecnológica europea más grande de París.

Quería apoyar a las nuevas empresas francesas, ayudarlas a expandirse internacionalmente y atraer más inversiones en investigación y proyectos de IA en Francia.

Los expertos en tecnología también han anotado que la mayoría de los desarrolladores (11 de 14) de la tecnología Llama de código abierto de Meta AI son franceses, lo que hace que los últimos desarrollos de IA no sean sorprendentes.

El futuro de la IA de código abierto

Un competidor potencialmente sólido y de código abierto para los LLM existentes como Mistral 7B podría ofrecer nuevas oportunidades para que las empresas utilicen la IA, con posibilidades de personalización más amplias y un control mejorado sobre la seguridad de los datos.

El camino a modelos generativos de código abierto representa un cambio significativo en la industria de la IA, que desafía los modelos propietarios tradicionales por motivos éticos y de rendimiento.


Imagen de portada: The Hornbills Studio/Shutterstock



[ad_2]

Consultar el artículo en la publicación original

Mistral AI lanza LLM de código abierto, Mistral 7B
Salir de la versión móvil