En la actualidad, con el rápido desarrollo de las tecnologías de inteligencia artificial, la inteligencia de datos se ha convertido en la clave de la competitividad empresarial. Sin embargo, con los problemas frecuentes de "ilusiones" en los grandes modelos, las aplicaciones multimodales limitadas por barreras de datos y las dificultades para utilizar conocimientos privados de las empresas, la industria necesita un sistema de gestión de datos más potente. Para ello, Tongfang Zhikong Data Science lanzó oficialmente la versión 2.0 del sistema de gestión de bases de datos vectoriales AIKBase, con el objetivo de proporcionar a la IA una "mente de datos inteligente", renovando la infraestructura de datos inteligentes.
AIKBase V2.0 es un sistema de gestión de datos multimodal que combina las ventajas de búsqueda y vectoriales. Cuenta con cinco características principales: control nacional independiente, gestión unificada de múltiples tipos de datos, recuperación de vectores en milisegundos, consultas fusionadas precisas y expansión de clústeres distribuidos. Puede impulsar plenamente a los grandes modelos y ayudar a miles de industrias a lograr una transformación inteligente.
En cuanto a sus características, la capacidad de integración flexible y el motor de recuperación compatible con múltiples formatos de AIKBase V2.0 le permiten adaptarse fácilmente a cualquier gran modelo, abriendo el flujo de datos para escenarios como RAG y enriquecimiento de conocimiento. Completamente compatible con sistemas nacionales como Kunpeng, Feiteng CPU, UnionTech y Kylin, cumple con los estándares nacionales de innovación tecnológica, brindando una doble protección para la seguridad de los datos empresariales. El sistema admite la migración de datos de varios bases de datos principales, puede traducir inteligentemente datos no estructurados a vectores y almacenarlos uniformemente en el almacén de datos. Ya sea insertar nuevos datos o actualizar datos antiguos, se puede realizar rápidamente. Además, la tecnología de recuperación híbrida de AIKBase V2.0 permite combinar libremente la recuperación de vectores, escalares y texto completo, logrando respuestas en milisegundos incluso con cantidades de datos de cien millones, comprendiendo correctamente el "sentido". Su arquitectura de clúster distribuido puede expandirse fácilmente, admitiendo una arquitectura elástica a gran escala, asegurando una recuperación de alta performance y servicios confiables, satisfaciendo las necesidades de crecimiento comercial.
En pruebas de rendimiento, AIKBase V2.0 utilizó herramientas de evaluación de código abierto ANN-Benchmarks y comparó con bases de datos de código abierto como pgvector, Milvus y ElasticSearch. Los resultados mostraron que, en términos de la tasa de recuperación del 90% y el volumen máximo de consulta QPS, AIKBase V2.0 supera a las bases de datos de código abierto mencionadas anteriormente. Además, su tasa de entrada de datos es mayor y el tiempo de construcción del índice es más corto, demostrando su ventaja de "almacenar rápido, encontrar preciso y responder rápido".
La aplicación de AIKBase V2.0 es amplia, puede proporcionar una base de conocimiento privada a los grandes modelos, ayudándolos a "eliminar las ilusiones", haciendo que los resultados generados sean más precisos y oportunos. Soporta recuperación multimodal, logrando asociaciones semánticas en segundos entre texto, imágenes y videos, apoyando búsquedas de texto a imagen y de imagen a texto entre modalidades. Además, la función de recuperación híbrida de AIKBase V2.0 combina la "comprensión semántica" de la recuperación de vectores con la "coincidencia precisa" de la recuperación de texto completo, logrando una mejora significativa en la precisión de los resultados de recuperación.
Actualmente, AIKBase está profundamente integrado en la matriz de productos de China National Knowledge Infrastructure (CNKI), proporcionando un respaldo sólido para funciones centrales como la recuperación mejorada por IA y asistentes para investigación académica. La recuperación multimodal híbrida hace que la obtención de conocimiento sea más inteligente y la velocidad de respuesta en milisegundos hace que la experiencia de uso sea más eficiente.