Switch to English
Khipu

Khipu

Plataforma de ciberseguridad que analiza amenazas en tiempo real usando machine learning e IA conversacional, con múltiples modelos de detección y una interfaz en lenguaje natural.

Next.jsFastAPIVercel AI SDKLangChain

Khipu es una plataforma avanzada de análisis de ciberseguridad que combina aprendizaje automático con IA conversacional para detectar y analizar amenazas de seguridad en tiempo real. Desarrollada como un proyecto de hackathon por estudiantes de la Universidad Nacional de Colombia Sede Manizales, la plataforma democratiza el acceso a herramientas de análisis de seguridad de nivel profesional.

Capacidades Principales

El sistema integra cuatro modelos especializados de aprendizaje automático para una detección integral de amenazas:

  • Clasificador de Spam – Análisis de contenido de correos electrónicos usando vectorización TF-IDF
    • Detector de URLs de Phishing – Identificación de URLs maliciosas con regresión logística
      • Detector de Accesos Sospechosos – Análisis de patrones de acceso a la red usando Gradient Boosting
        • Analizador de Logs de Red – Detección de anomalías de tráfico con algoritmos de Árboles de Decisión

          Arquitectura Técnica

          Capa Frontend

          Construida con Next.js 15, TypeScript y Tailwind CSS, incluye:

          • Dashboard – Monitoreo en tiempo real de eventos de seguridad y visualización de alertas
            • Interfaz Conversacional – Análisis de amenazas en lenguaje natural impulsado por modelos OpenAI GPT
              • Librería de Componentes – Componentes UI especializados para mostrar resultados de detección ML

                Servicios Backend

                Arquitectura de microservicios basada en FastAPI que expone endpoints REST:

                • /api/v1/spam/classify – Clasificación de spam en correos electrónicos
                  • /api/v1/phishing/check-url – Detección de phishing en URLs
                    • /api/v1/suspicious/check-access – Análisis de accesos a la red
                      • /api/v1/suspicious-logs/check-log – Detección de anomalías en tráfico de red

                        Capa de Datos

                        • Base de Datos: PostgreSQL con Drizzle ORM para consultas type-safe
                          • Modelos ML: Modelos preentrenados de scikit-learn almacenados como archivos .pkl
                            • Ingeniería de Características: Vectorización TF-IDF, OneHotEncoder, StandardScaler

                              Funcionalidades Clave

                              Detección de Amenazas en Tiempo Real

                              Procesa eventos de seguridad a través de un pipeline estandarizado:

                              1. Ingesta de eventos vía API REST
                                1. Análisis por modelos ML con puntuación de confianza
                                  1. Clasificación de amenazas y evaluación de severidad
                                    1. Almacenamiento de resultados en la base de datos PostgreSQL

                                      Análisis de Seguridad Conversacional

                                      Interfaz en lenguaje natural donde los usuarios pueden:

                                      • Analizar correos, URLs y logs de red usando inglés cotidiano
                                        • Recibir evaluaciones estructuradas de amenazas con puntuaciones de confianza
                                          • Obtener recomendaciones de seguridad accionables
                                            • Acceder a análisis históricos y datos de tendencias

                                              Infraestructura de Pruebas Integral

                                              Suite robusta de pruebas con 13 escenarios predefinidos que cubren:

                                              • Patrones normales de acceso corporativo
                                                • Ataques de fuerza bruta e intentos de exfiltración de datos
                                                  • Ataques SYN flood, escaneo de puertos y UDP flood
                                                    • Diversas anomalías en el tráfico de red

                                                      Stack Tecnológico

                                                      • Frontend: Next.js 15, React, TypeScript, Tailwind CSS, Vercel AI SDK
                                                        • Backend: FastAPI, LangChain, OpenAI GPT, Scikit-learn, Pydantic
                                                          • Base de Datos: PostgreSQL con Drizzle ORM
                                                            • Modelos ML: TF-IDF, Regresión Logística, Gradient Boosting, Árboles de Decisión
                                                              • Despliegue: Vercel, Render

                                                                Impacto e Innovación

                                                                Khipu representa un avance significativo en la democratización de herramientas de ciberseguridad al:

                                                                • Combinar múltiples modelos de detección ML en una plataforma unificada
                                                                  • Proveer una interfaz conversacional de IA para usuarios no técnicos
                                                                    • Ofrecer análisis de amenazas en tiempo real con puntuaciones de confianza
                                                                      • Implementar pruebas exhaustivas con escenarios de ataque realistas
                                                                        • Desplegar un sistema listo para producción con tecnologías web modernas

                                                                          La plataforma logra cerrar la brecha entre el análisis de seguridad complejo y las interfaces fáciles de usar, haciendo que la detección de amenazas de nivel profesional sea accesible para organizaciones de todos los tamaños.


                                                                          Notas

                                                                          Este resumen se basa en la documentación técnica y el código fuente del proyecto. La plataforma demuestra capacidades de desarrollo full-stack, incluyendo integración de modelos ML, diseño de APIs, arquitectura de base de datos y desarrollo frontend moderno. Toda la información citada proviene directamente del código fuente y los archivos de documentación del proyecto.

                                                                          Páginas del wiki que podrías explorar: