Nota Oficial

Venezuela

Modelo de lenguaje a gran escala

Nos complace compartir los dos primeros modelos de la próxima generación de Llama, Meta Llama 3, disponibles para un amplio uso. Esta versión presenta modelos de lenguaje pre-entrenados y ajustados a las instrucciones con parámetros 8B y 70B, que pueden soportar una amplia variedad de casos de uso. Esta nueva generación de Llama demuestra un rendimiento de vanguardia en una amplia gama de parámetros de referencia del sector y ofrece nuevas funciones, como la mejora del razonamiento. Creemos que son los mejores modelos de código abierto de su clase. Y en apoyo de nuestro enfoque de código abierto de larga data, estamos poniendo Llama 3 en manos de la comunidad. Queremos dar paso a la próxima ola de innovación en IA en todos los ámbitos: desde aplicaciones hasta herramientas para desarrolladores, evaluaciones, optimizaciones de inferencia y mucho más.

Nuestros objetivos con Llama 3

Con Llama 3, nos propusimos construir los mejores modelos abiertos que estuvieran a la altura de los mejores modelos propietarios disponibles en la actualidad. Queríamos incorporar las devoluciones y comentarios de los desarrolladores para aumentar la utilidad general de Llama 3 y lo estamos haciendo sin dejar de liderar en el uso y despliegue responsables de los LLM. Adoptamos la ética del código abierto de publicar rápido y con frecuencia para que la comunidad pueda acceder a estos modelos mientras aún están en desarrollo. Los modelos basados en texto que publicamos hoy son los primeros de la colección de modelos Llama 3. Nuestro objetivo en un futuro próximo es hacer que Llama 3 sea multilingüe y multimodal, que tenga un contexto más amplio y que siga mejorando el rendimiento general de las capacidades básicas de LLM, como el razonamiento y la codificación.

Rendimiento de vanguardia

Nuestros nuevos modelos Llama 3 de parámetros 8B y 70B suponen un gran salto con respecto a Llama 2 y establecen un nuevo estado del arte para los modelos LLM a esas escalas. Gracias a las mejoras en el pre-entrenamiento y el post-entrenamiento, nuestros modelos pre-entrenados y ajustados a las instrucciones son los mejores en la actualidad a la escala de parámetros de 8B y 70B. Las mejoras en nuestros procedimientos de post-entrenamiento redujeron sustancialmente las tasas de falsos rechazos, mejoraron la alineación y aumentaron la diversidad en las respuestas de los modelos. También hemos observado grandes mejoras en capacidades como el razonamiento, la generación de código y el seguimiento de instrucciones, lo que hace que Llama 3 sea más dirigible.

En el desarrollo de Llama 3, nos fijamos en el rendimiento del modelo en puntos de referencia estándar y también tratamos de optimizar el rendimiento para escenarios del mundo real. Para ello, desarrollamos un nuevo conjunto de evaluación humana de alta calidad. Este conjunto de evaluación contiene 1.800 preguntas que cubren 12 casos de uso clave: pedir consejo, lluvia de ideas, clasificación, respuesta a preguntas cerradas, codificación, escritura creativa, extracción, adopción de un personaje/persona, respuesta a preguntas abiertas, razonamiento, reescritura y resumen. Para evitar el sobreajuste accidental de nuestros modelos en este conjunto de evaluación, ni siquiera nuestros propios equipos de modelización tienen acceso a él. El siguiente gráfico muestra los resultados agregados de nuestras evaluaciones humanas en todas estas categorías e instrucciones con Claude Sonnet, Mistral Medium y GPT-3.5.

Next La movilidad se sigue transformando »

Previous « Movistar lanza una nueva oferta

Published by

Tags: MetaVR

2 años ago

Nestlé Venezuela lanza «Gira y Gana»: Premios de hasta $20.000 para los Consumidores
Nestlé Venezuela ha activado su campaña promocional "Gira y Gana", una ambiciosa estrategia de mercadeo…
Guía Samsung: 5 Pasos para Elegir un Televisor con Calidad y Larga Vida Útil
Por Eduardo Travieso Itriago Samsung Perú ha publicado un protocolo de cinco pasos diseñado para…
Telefónica y CAF Lanzan el Primer Piloto Europeo de Edge Computing Comercial para la Industria
Telefónica Tech y CAF han culminado con éxito la implantación del primer piloto comercial de…

Nestlé Venezuela lanza «Gira y Gana»: Premios de hasta $20.000 para los Consumidores

Nestlé Venezuela ha activado su campaña promocional "Gira y Gana", una ambiciosa estrategia de mercadeo…

1 día ago

Venezuela

Guía Samsung: 5 Pasos para Elegir un Televisor con Calidad y Larga Vida Útil

Por Eduardo Travieso Itriago Samsung Perú ha publicado un protocolo de cinco pasos diseñado para…

1 día ago

Venezuela

Telefónica y CAF Lanzan el Primer Piloto Europeo de Edge Computing Comercial para la Industria

Telefónica Tech y CAF han culminado con éxito la implantación del primer piloto comercial de…

1 día ago

Venezuela

Movistar México: Estrategia de Vinculación de Líneas y Protección de Datos 2026

Telefónica Movistar México ha implementado un plan integral para cumplir con los nuevos lineamientos de…

2 días ago

Venezuela

Movistar Arena Bogotá presenta su cartelera para 2026: Liderazgo en el sector de eventos masivos

Por Eduardo Travieso Itriago Telefónica Movistar Colombia ha revelado la agenda oficial de eventos para…

2 días ago

Venezuela

Samsung Lanza la Serie Galaxy Buds4 en Perú: La Nueva Frontera del Sonido Hi-Fi

Samsung Perú ha presentado oficialmente la serie Galaxy Buds4, posicionándola como su solución definitiva en…

2 días ago

Modelo de lenguaje a gran escala

Related Post

Recent Posts

Nestlé Venezuela lanza «Gira y Gana»: Premios de hasta $20.000 para los Consumidores

Guía Samsung: 5 Pasos para Elegir un Televisor con Calidad y Larga Vida Útil

Telefónica y CAF Lanzan el Primer Piloto Europeo de Edge Computing Comercial para la Industria

Movistar México: Estrategia de Vinculación de Líneas y Protección de Datos 2026

Movistar Arena Bogotá presenta su cartelera para 2026: Liderazgo en el sector de eventos masivos

Samsung Lanza la Serie Galaxy Buds4 en Perú: La Nueva Frontera del Sonido Hi-Fi