ExllamaV2: Una biblioteca de inferencia para ejecutar LLM localmente en GPUs de consumo modernas

站长之家

Publicado elNoticias de IA · 1 minutos de lectura · Sep 15, 2023

241

ExllamaV2 es una biblioteca de inferencia diseñada para ejecutar eficientemente modelos de lenguaje a gran escala (LLM) en GPUs de consumo comunes. Admite el nuevo formato de cuantificación ajustable EXL2, logrando una mejora de rendimiento de entre 1,5 y 2 veces. El objetivo del proyecto es ser una solución de inferencia LLM fácil de usar, compatible con los modelos de Hugging Face, ofreciendo ejemplos interactivos para una experiencia fluida y accesible del poder de los LLM. En resumen, ExllamaV2 proporciona una vía práctica para ejecutar modelos de lenguaje a gran escala utilizando los recursos de una GPU doméstica.

exllamav2 GPU LLM

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

json

{ title: Anthropic está desarrollando tecnología de IA interpretable que podría reformular la estrategia de los modelos grandes de lenguaje de las empresas, content: La empresa de investigación de inteligencia artificial Anthropic ha anunciado recientemente que está desarrollando un sistema de IA con 'interpretabilidad'. Esta tecnología tiene el potencial de permitir que las empresas comprendan de manera más clara el proceso de toma de decisiones de los modelos grandes de lenguaje (LLMs). Este avance de investigación podría tener un impacto profundo en la forma en que las empresas establecen sus estrategias de aplicación de LLMs.}

Jun 18, 2025

Evaluación detallada de LLM SEO Monitor: Una herramienta esencial para la optimización por motores de búsqueda de IA

Analiza en detalle las funciones y características de la herramienta LLM SEO Monitor, así como la experiencia de uso. Aprende cómo mejorar la visibilidad de tu marca en motores de búsqueda de IA como ChatGPT y Gemini, y obtén el valor comercial del tráfico de búsquedas de IA.

Jun 17, 2025

Kimi-Dev-72B: LLM de código abierto para habilitar la resolución de problemas de ingeniería de software

Jun 17, 2025

Evaluación de LLM SEO Monitor: La herramienta indispensable para la optimización de búsqueda de marcas en la era de la IA

Explore a fondo cómo la herramienta revolucionaria LLM SEO Monitor ayuda a las marcas a monitorear su rendimiento en los resultados de búsqueda de asistentes de IA como ChatGPT y Google Gemini. Analice las funciones principales, comparaciones de ventajas y desventajas de precios, y cómo utilizarlo para brindar a las marcas una nueva ventaja competitiva en la era de la búsqueda de IA.

Jun 16, 2025

Apple vuelve a criticar la capacidad de inferencia en IA. Un conocido desarrollador de GitHub responde: ¡Esto no refleja adecuadamente el verdadero rostro de la capacidad de inferencia!

Recientemente, Apple publicó un artículo que suscitó gran debate sobre la existencia de importantes deficiencias en la capacidad de inferencia de los Modelos de Lenguaje Grande (LLM). Esta opinión rápidamente generó controversia en las redes sociales, especialmente entre los ingenieros senior de software de GitHub, como Sean Goedecke, quien expresó una fuerte oposición. Él argumenta que las conclusiones de Apple son demasiado parciales y no reflejan correctamente las capacidades de los modelos de inferencia. Según el documento de Apple, el rendimiento de los LLM es poco fiable cuando se trata de pruebas basadas en matemáticas y programación. El equipo de investigación de Apple sugirió

Jun 10, 2025

110

El sorprendente lanzamiento de MonkeyOCR para la interpretación de documentos LLM: ¡un modelo pequeño de 3 mil millones supera a Gemini!

Jun 9, 2025

Xiaohongshu lanza su primer modelo LLM de código abierto dots.llm1: 11.2 billones de datos no sintéticos impulsan el rendimiento en chino

Jun 9, 2025

Huawei lanza un modelo de gran escala de Ascend: ¡Una pregunta matemática de nivel universitario sin GPU puede entrenarse en solo 2 segundos!

May 30, 2025

Tongyi Labs y Pekín Universidad lanzan nueva tecnología ZeroSearch, activando la capacidad de búsqueda de LLM con una reducción del 88% en costos

May 29, 2025

$El modelo de búsqueda de Secret Tower AI \u200b\u00a0nueva y de alta velocidad ha sido lanzado, alcanzando una respuesta ultra rápida de 400 tokens/segundo$

El modelo de búsqueda de Secret Tower AI \u200b\u00a0nueva y de alta velocidad ha sido lanzado, alcanzando una respuesta ultra rápida de 400 tokens/segundo

La búsqueda de Secret Tower AI ha presentado un nuevo modelo de "alta velocidad", marcando un avance importante en la tecnología de búsqueda de inteligencia artificial. Utilizando medios técnicos innovadores, el tiempo de respuesta del motor de búsqueda de Secret Tower AI ha llegado a una impresionante velocidad de 400 tokens/segundo, asegurando que la mayoría de las preguntas reciban respuestas en menos de 2 segundos. Este progreso no solo mejora la experiencia del usuario, sino que también aumenta significativamente la eficiencia en la obtención de información. El logro de este modelo de "alta velocidad" se debe al uso de varias tecnologías avanzadas. El equipo de Secret Tower AI ha realizado optimizaciones en GPU con ker

May 27, 2025

200

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General