Recentemente, a comunidade de código aberto OpenBMB recebeu um novo membro, "Juan Ji" (SurveyGO), que chamou a atenção na área de geração de textos longos. Atualmente, tanto estudantes quanto profissionais enfrentam dificuldades em obter informações, e a chegada de "Juan Ji" traz uma nova esperança para resolver esse problema.

QQ20250423-112138.png

"Juan Ji": O "Rei da Produtividade" na geração de textos longos

"Juan Ji" pode ser considerado o "Rei da Produtividade" na geração de textos longos. Utilizando entropia de informação e algoritmos de convolução, ela consegue organizar rapidamente uma grande quantidade de documentos, sintetizando informações complexas em resumos de alta qualidade. Seja em áreas de especialização pouco conhecidas ou em áreas de pesquisa populares, basta fornecer palavras-chave para que "Juan Ji" selecione documentos com precisão, extraia o conhecimento essencial e gere conteúdo lógico, rigoroso e perspicaz.

Obter os relatórios de resumo gerados por "Juan Ji" é simples. O usuário acessa o site especificado, seleciona o modo normal ou profissional para enviar a solicitação e, após o login, pode acessar o relatório. O site também oferece diversos temas de pesquisa inovadores na "Tabela de Solicitação de Escrita", permitindo a interação e curtidas dos usuários.

QQ20250423-112148.png

Testando a capacidade de "Juan Ji"

Para testar sua capacidade, a equipe realizou uma avaliação comparativa, fazendo "Juan Ji" e modelos como OpenAI-DeepResearch escreverem um resumo sobre "O impacto da guerra comercial sobre a vida das pessoas comuns". Avaliando a estrutura, o conteúdo, os pontos de vista e as citações, "Juan Ji" apresentou um desempenho excelente. Seu artigo gerado tinha um sumário claro, análise de conteúdo aprofundada, pontos de vista justificados e citações precisas, superando outros modelos em termos de capacidade geral.

QQ20250423-112418.png

LLMxMapReduce-V2: Capacitação tecnológica

Por trás da poderosa "Juan Ji" está a tecnologia de geração e integração de textos longos LLMxMapReduce-V2. Este é o resultado da colaboração entre AI9Star, OpenBMB e a equipe da Universidade Tsinghua, sendo uma versão aprimorada da tecnologia anterior. Essa tecnologia utiliza algoritmos de convolução de texto para agregar referências bibliográficas, combinando um método de dimensionamento de teste de convolução aleatória impulsionado pela entropia da informação para processar entradas extra longas de forma eficiente e melhorar a qualidade do artigo.

A equipe de pesquisa utilizou o teste de referência SurveyEval recém-desenvolvido para avaliação, e os resultados mostraram que o LLMxMapReduce-V2 apresentou um desempenho excelente em vários indicadores-chave, especialmente em relação ao uso de referências bibliográficas. Isso demonstra que a tecnologia "Juan Ji" é poderosa no processamento de tarefas de integração de informações em larga escala, com amplas perspectivas de aplicação futura na área de geração de textos longos, com potencial para impulsionar novos desenvolvimentos no setor.

Endereço: https://surveygo.thunlp.org/