Recientemente, la comunidad de código abierto OpenBMB ha dado la bienvenida a un nuevo miembro, "Juan Quién" (SurveyGO), que ha generado gran interés en el campo de la generación de textos largos. Actualmente, tanto estudiantes como profesionales se enfrentan a dificultades para acceder a la información, y la aparición de "Juan Quién" ofrece una nueva esperanza para solucionar este problema.

QQ20250423-112138.png

"Juan Quién": El "rey" de la generación de textos largos

"Juan Quién" se puede considerar el "rey" en el campo de la generación de textos largos. Utiliza la entropía de la información y algoritmos de convolución para organizar rápidamente una gran cantidad de documentos y sintetizar información compleja en resúmenes de alta calidad. Ya sea en áreas de especialización minoritarias o en áreas de investigación populares, solo con proporcionar palabras clave, "Juan Quién" puede filtrar documentos con precisión, extraer conocimientos clave y generar contenido lógico y perspicaz.

Obtener los informes de resumen generados por "Juan Quién" es sencillo. Los usuarios abren la URL especificada, seleccionan el modo normal o profesional para enviar sus solicitudes y, tras volver a iniciar sesión, pueden obtener el informe. La "tabla de requisitos de escritura" del sitio web también ofrece una variedad de temas de investigación novedosos, permitiendo la interacción y los votos de los usuarios.

QQ20250423-112148.png

Prueba de la capacidad de "Juan Quién"

Para probar su capacidad, el equipo llevó a cabo una evaluación comparativa, haciendo que "Juan Quién" y modelos como OpenAI-DeepResearch escribieran un resumen sobre el tema de "El impacto de la guerra arancelaria en la vida de las personas comunes". Al evaluar la estructura, el contenido, los puntos de vista y las citas, "Juan Quién" mostró un rendimiento excelente. Su artículo generado tiene un índice claro, un análisis profundo del contenido, puntos de vista razonables y citas precisas, superando en capacidad general a otros modelos.

QQ20250423-112418.png

LLMxMapReduce-V2: Potenciación tecnológica

Detrás de la potencia de "Juan Quién" se encuentra la tecnología de generación de integración de texto largo LLMxMapReduce-V2. Este es el resultado de la investigación conjunta de AI9Star, OpenBMB y el equipo de la Universidad de Tsinghua, y es una versión mejorada de la tecnología anterior. Esta tecnología utiliza algoritmos de convolución de texto para agregar referencias, combinada con un método de escalado de prueba de convolución aleatoria impulsado por la entropía de la información, para procesar de manera eficiente entradas extremadamente largas y mejorar la calidad del artículo.

El equipo de investigación utilizó la prueba de referencia SurveyEval de nuevo desarrollo para la evaluación, y los resultados mostraron que LLMxMapReduce-V2 mostró un rendimiento excelente en múltiples indicadores clave, especialmente en el uso de referencias. Esto demuestra que la tecnología de "Juan Quién" es potente en el manejo de tareas de integración de información a gran escala, y tiene un amplio potencial de aplicación en el campo de la generación de textos largos en el futuro, con la esperanza de impulsar un nuevo desarrollo en la industria.

Dirección: https://surveygo.thunlp.org/