Modelo de IA de raciocínio de código aberto Sky-T1 chega, com custo de treinamento abaixo de US$ 450

A equipe NovaSky do laboratório de computação Sky do campus da Universidade da Califórnia, Berkeley, lançou na sexta-feira o modelo de raciocínio Sky-T1-32B-Preview, que se destacou em vários benchmarks importantes, rivalizando com as versões iniciais do o1 da OpenAI e, notavelmente, com um custo de treinamento extremamente baixo.

O Sky-T1-32B-Preview é o primeiro modelo de raciocínio de código aberto verdadeiramente replicável. A equipe NovaSky não apenas lançou o modelo, mas também divulgou o conjunto de dados usado para treiná-lo e o código de treinamento necessário, o que significa que o modelo pode ser replicado do zero. Como a equipe descreveu em um post de blog, "o custo de treinamento do Sky-T1-32B-Preview foi inferior a US$ 450, demonstrando a viabilidade de replicar capacidades de raciocínio avançadas de forma econômica". Recentemente, o treinamento de modelos com desempenho semelhante custava milhões de dólares. Essa redução drástica de custos é principalmente atribuída ao uso de dados de treinamento sintéticos ou gerados por outros modelos. Por exemplo, o modelo Palmyra X004, recentemente lançado pela empresa de IA Writer, foi treinado quase exclusivamente com dados sintéticos, com um custo de desenvolvimento de apenas US$ 700.000.

1_1693449769614_ai2023_Facial_AI_robots_a_lot_of_cash_on_the_conference_table_i_d531bb02-0ec5-4e0a-9f1c-a65fa11a4c51

Fonte da imagem: imagem gerada por IA, provedor de licenciamento de imagens Midjourney

Os modelos de raciocínio diferem dos modelos de IA comuns, pois são capazes de realizar verificação de fatos eficazmente, evitando assim algumas armadilhas comuns. No entanto, os modelos de raciocínio geralmente levam mais tempo para chegar a uma solução, variando de alguns segundos a alguns minutos. Sua maior confiabilidade em física, ciências e matemática é uma vantagem significativa.

A equipe NovaSky revelou que utilizou o modelo de raciocínio QwQ-32B-Preview da Alibaba para gerar os dados de treinamento iniciais do Sky-T1, posteriormente "refinando" os dados e usando o GPT-4o-mini da OpenAI para reformulá-los em um formato mais utilizável. O treinamento do Sky-T1, com seus 32 bilhões de parâmetros, usando 8 racks de GPUs Nvidia H100 levou cerca de 19 horas. A quantidade de parâmetros corresponde aproximadamente à capacidade do modelo de resolver problemas.

Em testes de desempenho, o Sky-T1 superou a versão inicial do o1 no MATH500 (um conjunto de desafios matemáticos de "nível de competição") e também superou a versão de demonstração do o1 em um conjunto de problemas do LiveCodeBench (uma avaliação de codificação). No entanto, o Sky-T1 teve um desempenho inferior à versão de demonstração do o1 no GPQA-Diamond, que inclui problemas de física, biologia e química que um estudante de doutorado deveria dominar. Além disso, a versão o1GA da OpenAI é mais poderosa do que a versão de demonstração, e a OpenAI espera lançar o modelo de raciocínio o3, com desempenho ainda melhor, nas próximas semanas.

Apesar disso, a equipe NovaSky afirma que o Sky-T1 é apenas o começo do desenvolvimento de modelos de código aberto com capacidades de raciocínio avançado. "No futuro, focaremos no desenvolvimento de modelos mais eficientes, mantendo um forte desempenho de raciocínio e explorando tecnologias avançadas para melhorar ainda mais a eficiência e precisão do modelo nos testes", escreveu a equipe em sua postagem. "Fique atento ao nosso progresso nesses projetos empolgantes". O surgimento desse modelo de raciocínio de código aberto certamente trouxe novas oportunidades e desafios para o campo da inteligência artificial, e seu desenvolvimento futuro merece atenção contínua.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

Website AI Friendliness Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Modelo de IA de raciocínio de código aberto Sky-T1 chega, com custo de treinamento abaixo de US$ 450

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais