MobileLLM-600M

Modelo de lenguaje de 600M de parámetros, eficiente y optimizado, diseñado para aplicaciones en dispositivos.

Producto ComúnProgramaciónModelo de lenguajeTransformer

MobileLLM-600M es un modelo de lenguaje autorregresivo desarrollado por Meta, con una arquitectura Transformer optimizada y diseñada para aplicaciones en dispositivos con recursos limitados. Este modelo integra tecnologías clave como la función de activación SwiGLU, una arquitectura delgada y profunda, el uso compartido de incrustaciones y la atención de consultas agrupadas. MobileLLM-600M ha logrado una mejora significativa en el rendimiento en tareas de razonamiento de sentido común de cero ejemplos, con un aumento de la precisión del 2.7%/4.3% en comparación con los modelos SoTA anteriores de 125M/350M. El diseño de este modelo es escalable a modelos más grandes, como MobileLLM-1B/1.5B, obteniendo en ambos casos resultados SoTA.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

Website AI Friendliness Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

MobileLLM-600M

MobileLLM-600M Situación del tráfico más reciente

MobileLLM-600M Tendencia de visitas

MobileLLM-600M Distribución geográfica de las visitas

MobileLLM-600M Fuentes de tráfico

MobileLLM-600M Alternativas

MobileLLM-125M — Modelo de lenguaje pequeño y altamente optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-350M — Modelo de lenguaje de parámetros sub-mil millones eficientemente optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-600M — Modelo de lenguaje de 600M de parámetros, eficiente y optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-1B — Modelo de lenguaje de Meta con menos de mil millones de parámetros, diseñado para aplicaciones en dispositivos móviles.

Google Vision Transformer — Modelo de reconocimiento de imágenes basado en Transformer

Qwen1.5-32B — Serie de modelos de lenguaje preentrenados basados en la arquitectura Transformer

MobiLlama — Modelo de lenguaje pequeño personalizado para dispositivos de borde

Modelo de Lenguaje Confiable (MLC) — Prueba el Modelo de Lenguaje Confiable (MLC) de Cleanlab en tu navegador.

Explicador de Transformadores — Herramienta de visualización para comprender a fondo el modelo Transformer

Sora para Dispositivos Móviles — Sora para Dispositivos Móviles es un proyecto de generación de vídeo a partir de texto en dispositivos móviles basado en un modelo de difusión.

BlueLM Modelo de Lenguaje Grande — Modelo de comprensión de lenguaje inteligente desarrollado de forma autónoma por vivo

Zamba2-mini — Modelo de lenguaje pequeño y avanzado, diseñado para aplicaciones en dispositivos.

Modelo de Lenguaje Pequeño Chino — Primer modelo de lenguaje grande en chino, centrado en la comprensión y generación de texto en chino.

Lora — Lora es un modelo de lenguaje local optimizado para dispositivos móviles, compatible con iOS y Android.

MobileLLM — Modelo de lenguaje pequeño y optimizado para dispositivos móviles

Modelo de lenguaje grande Yuanxiang XChat — Modelo de lenguaje grande líder en China

OLMo 2 13B — Modelo de lenguaje de referencia académica en inglés de alto rendimiento

LUAR — Modelo de aprendizaje de representación de autores basado en Transformer

CogView — Modelo Transformer para generación de imágenes a partir de texto en dominios generales

Qwen-VL — Modelo de lenguaje visual de propósito general

Modelo de lenguaje grande Tianrang Xiaobai — Plataforma abierta de aplicaciones de IA accesible para todos

Modelo de Lenguaje Grande Generativo Mencio (Mencio GPT) — Modelo de lenguaje grande controlable orientado a escenarios generativos

Megatron-LM — Investigación continua sobre el entrenamiento a gran escala de modelos Transformer

Honeybee — Modelo de predicción de red de lenguaje multimodal

Infini-attention — Amplía los modelos de lenguaje Transformer para procesar entradas infinitamente largas.

Modelo de Lenguaje Estable LM 2 1.6B — Modelo de lenguaje estable de 160 millones de parámetros

InternLM2 — Modelo de lenguaje preentrenado multilingüe

Modelo de lenguaje grande HunYuan de Tencent — Modelo de lenguaje grande HunYuan de Tencent, con capacidades excepcionales de creación de contenido en chino

Herramienta de Transparencia para LLM — Analiza el funcionamiento interno de los modelos de lenguaje Transformer.

MusiConGen — Modelo de generación de música a partir de texto basado en Transformer

MobileLLM-600M

MobileLLM-600M Situación del tráfico más reciente

MobileLLM-600M Tendencia de visitas

MobileLLM-600M Distribución geográfica de las visitas

MobileLLM-600M Fuentes de tráfico

MobileLLM-600M Alternativas

MobileLLM-125M — Modelo de lenguaje pequeño y altamente optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-350M — Modelo de lenguaje de parámetros sub-mil millones eficientemente optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-600M — Modelo de lenguaje de 600M de parámetros, eficiente y optimizado, diseñado para aplicaciones en dispositivos.

MobileLLM-1B — Modelo de lenguaje de Meta con menos de mil millones de parámetros, diseñado para aplicaciones en dispositivos móviles.

Google Vision Transformer — Modelo de reconocimiento de imágenes basado en Transformer

Qwen1.5-32B — Serie de modelos de lenguaje preentrenados basados en la arquitectura Transformer