Leandro Barbosa — Portfólio Técnico | ResearchMagic / MAGIC AI

Produto Principal

Private AI & Fabric HyperGrid

A plataforma que permite qualquer organização se tornar seu próprio provedor de IA.

MAGIC Private AI

Alternativa white-label ao ChatGPT com soberania total de dados

Plataforma de IA privada e distribuída que roda modelos avançados (LLMs, multimodal) na infraestrutura existente do cliente — CPUs, GPUs ou cloud privada. Prompts, documentos e logs nunca saem do ambiente do cliente. Compliance com FERPA, HIPAA, GDPR e SOC 2 por design.

Componentes Core

AI Chat — Interface conversacional open-source
Wizard AI — Orquestrador de seleção automática de modelos
Rapyd — Engine de aceleração de modelos (max throughput)
HyperGrid — Computação distribuída P2P (Go + libp2p)
Fabric — Camada de orquestração e integração
GatewAI — Filtro de conteúdo e logging de atividade

Capacidades

Multimodal: texto, imagem, áudio, vídeo
Hardware-agnostic: NVIDIA, AMD, Apple Silicon, CPU
Deploy: on-premise, cloud ou híbrido
90% de redução em custos de infraestrutura
Layer sharding com KV cache — 50% menos memória
69+ tokens/s, TTFT ~370ms (RTX 4090)

Mercados-Alvo

Enterprises com requisitos de compliance
Startups de tech que precisam de escala
Healthcare (pesquisa e diagnóstico)
Financeiro e seguros
Educação (FERPA)

Fabric HyperGrid — Inferência Distribuída P2P

Rede peer-to-peer para inferência de LLMs em cluster

Sistema de inferência distribuída que implementa layer sharding sobre redes P2P usando Go + libp2p. Workers dividem camadas do modelo (ex: Worker 1 → layers 0-7, Worker 2 → layers 8-15), reduzindo latência em 40-60% e memória em 50%. API compatível com OpenAI para integração drop-in.

Arquitetura

Master Node (Go Fiber) — Gateway API + coordenação
Worker Nodes (Go) — Tensor sharding + P2P
Circuit Relay v2 — Conectividade via relay nodes
Kademlia DHT — Service discovery descentralizado
Pre-Shared Key (PSK) — Rede privada segura
Protocol Buffers — Serialização cross-language

Performance

69+ tokens/segundo por nó
TTFT ~370ms (Time to First Token)
40-60% redução de latência com sharding
50% redução de memória via KV cache
Streaming e non-streaming responses
Jaeger tracing + Prometheus metrics

Ecossistema Completo

Produtos & Serviços Desenvolvidos

Cada componente foi projetado, implementado e deployado por mim — do backend à infraestrutura.

TeamTela Chat

Produção

Interface conversacional enterprise com sistema de raciocínio multi-estágio, RAG integrado, voz via LiveKit e orquestração de squads de agentes. Explicações educacionais transparentes step-by-step.

Next.js 15 React 19 TypeScript PostgreSQL Drizzle ORM NextAuth v5 LiveKit

Multi-LLM

Providers

RAG

Knowledge Base

Voice

Real-time

Agents Studio

Produção

Plataforma visual no-code/low-code para criação de workflows de agentes IA. Drag-and-drop com colaboração em tempo real, billing via Stripe e SDKs em TypeScript e Python.

Next.js 15 React 19 Socket.io PostgreSQL pgvector Stripe Turbo

112+

Test Files

SDKs

Real-time

Collaboration

BambooAI

Produção / Open Source

Plataforma de análise de dados em linguagem natural. Converte perguntas em código Pandas executável com sistema multi-agente (8-10 agentes especializados), auto-healing de código e suporte a ontologias OWL.

Python FastAPI Flask Pandas Pinecone SSE

8-10

Agentes

Multi-LLM

Providers

pip

Installable

RAGFlow

Produção

Engine de RAG enterprise com chunking inteligente, análise de layout de documentos, processamento multimodal (PDF, DOCX com imagens), workflows agênticos com MCP e text-to-SQL.

Python Docker K8s MCP Multi-LLM

v0.20+

Versão

Cross-lang

Queries

Agentic

Workflows

Magic Fabric Data

Produção v2.0

Sistema NLP-to-SQL com cache multi-nível (exato + semântico), matching de entidades categóricas via Milvus, geração automática de charts e suporte a conversação contextual. Cache hit 431x mais rápido que pipeline completo.

FastAPI Celery Redis MongoDB Milvus Databricks

431x

Cache Speedup

$95K+

Saving/Ano

15+

API Endpoints

Agentic Data

Desenvolvimento Ativo

Conversor NLP-to-SQL com orquestração LangGraph, plugin registry com 454+ linhas, extração automática de schema, busca semântica via Elasticsearch e validação de SQL com execução segura.

FastAPI LangGraph Elasticsearch PostgreSQL SSE

834

Lines GraphFactory

Plugin

Architecture

Streaming

Real-time

TeamAgents Workflow API

Produção

API central de gerenciamento de agentes IA e orquestração de workflows. Composição de ferramentas, colaboração multi-agente, integração com Factory API e gerenciamento de API keys master.

FastAPI MongoDB Pydantic K8s Async

Multi-Agent

Orchestration

K8s

Ready

Darwin-Gödel Machine

Avançado

Sistema autônomo de evolução de software. Usa algoritmos evolucionários + LLMs para criar código auto-aperfeiçoável com memória vetorial cross-generation, teacher-student patterns e 95%+ de taxa de sucesso.

Python ChromaDB MongoDB pytest-bdd Multi-LLM

95%+

Success Rate

6.1K+

Tests

85%+

Knowledge Reuse

TeamTela Iceberg

Produção

Analytics de transações para tracking de uso de LLMs. Apache Iceberg para data lake, Redis para cache/filas, Celery para processamento async com Dead Letter Queue e operações atômicas com recovery automático.

FastAPI Apache Iceberg Redis MongoDB Celery Cloudflare R2

Token

Usage Tracking

DLQ

Failure Recovery

Atomic

Operations

Fabric Fleet AI

Desenvolvimento Ativo

Gestão inteligente de frota com monitoramento por câmeras em tempo real, GPS tracking via WebSocket, conversão FLV→HLS via FFmpeg, gravação automática e integração com ZenduIT e FleetVision.

FastAPI React 18 WebSocket FFmpeg HLS.js Redis

Real-time

GPS + Video

JT1078

Protocol

DVR

30min Buffer

Speech-to-Text Server

Produção

Proxy TTS compatível com API OpenAI, integração ElevenLabs para alta qualidade, JWT auth, rate limiting via Redis (sliding window), OpenTelemetry tracing e Prometheus metrics.

FastAPI ElevenLabs Redis JWT OpenTelemetry Prometheus

OpenAI

Compatible API

Rate Limit

Sliding Window

Mem0 MCP Server

Produção

Gerenciamento de memória persistente para agentes IA com protocolo MCP. Interface dual REST + MCP, PostgreSQL backend, busca semântica, isolamento por sessão e streaming SSE.

FastAPI PostgreSQL MCP SSE Docker

Dual

REST + MCP

Semantic

DB-MCP Server

Produção

Conector de banco de dados MCP-compliant. Suporte a PostgreSQL, MySQL e SQLite. Queries parametrizadas (proteção SQL injection), connection pooling via Singleton e múltiplos protocolos de transporte.

FastAPI PostgreSQL MySQL SQLite MCP

Databases

Core Tools

K8s

Ready

Ackerminds Lakehouse

Produção

Lakehouse domain-driven em Databricks com arquitetura medalion (bronze→silver→gold) para empresa de leilão de vinhos. ML modules para scraping, NER de atributos, record matching fuzzy e predição de preços.

Databricks Spark Delta Lake Terraform Azure Python

Databricks Jobs

95%+

Success Rate

Modules

LLM Benchmark Suite

Pesquisa

Suite de benchmarking para engines de inferência (vLLM vs sglang) e modelos NER. Inclui server de inferência OpenAI-compatible com multi-hardware (NVIDIA, Apple Silicon, CPU) e benchmarks de throughput GPU.

Python Docker vLLM sglang PyTorch CUDA

Models Tested

Llama 40x

vs Kimi Speed

TeamTela Console

Ativo

Painel administrativo com dashboards, gestão de usuários e monitoramento do sistema. Component library com Radix UI + shadcn/ui.

React TypeScript TailwindCSS Radix UI TanStack

Integrações & Bots

Ativo

Ecossistema de integrações: WhatsApp Client para messaging, Slack para workflow automation, Magic Auth para autenticação, e Casdoor como IAM (OAuth/OIDC) multi-tenant.

WhatsApp Slack OAuth/OIDC Casdoor Magic Links

Domínio Técnico

Stack Tecnológico

Full-stack com profundidade — do kernel ao pixel.

⚡ Backend & APIs

Python (FastAPI, Flask, Celery)Core APIs
Go (Fiber, libp2p)Distributed Systems
Node.js / BunTooling & SDKs
Protocol BuffersSerialization
GraphQL / REST / gRPCAPI Patterns

🎨 Frontend

Next.js 15 / React 19Web Apps
TypeScript (Strict)Type Safety
TailwindCSS + shadcn/uiDesign System
Zustand / JotaiState Mgmt
ReactFlowVisual Workflows

🗄️ Dados & Storage

PostgreSQL + pgvectorPrimary DB + Embeddings
MongoDBDocument Store
RedisCache, Queues, Rate Limit
Apache Iceberg / Delta LakeData Lake
Elasticsearch / MilvusSearch & Vectors
Databricks / SparkBig Data

🤖 AI / ML

OpenAI, Anthropic, xAI, DeepSeekLLM Providers
LangGraph / LangChainAgent Orchestration
Pinecone / ChromaDB / MilvusVector DBs
PyTorch / HuggingFaceModel Inference
NVIDIA Triton / vLLM / sglangModel Serving
MCP ProtocolAI Integration Standard

☁️ Infraestrutura

Docker + Docker ComposeContainerization
Kubernetes / K0s / HelmOrchestration
TerraformIaC
Azure / AWS / Cloudflare R2Cloud Providers
Nginx / Custom LBLoad Balancing

📊 Observabilidade

OpenTelemetryDistributed Tracing
PrometheusMetrics
JaegerTrace Visualization
GrafanaDashboards
Structured LoggingAzure Log Analytics

Resultados Comprovados

Cases & Impacto

Números reais de projetos entregues e em produção.

Acker Merrall & Condit — Lakehouse de Dados + NER para Vinhos

Leilão & Varejo de Vinhos Premium

Construí um data lakehouse completo em Databricks com arquitetura medallion (bronze→silver→gold) cobrindo domínios de leilão, operacional, transacional e ML. Inclui módulos de web scraping, parser de atributos de vinho por NER, record matching fuzzy e predição de preços de leilão. Pipeline de NER benchmarkado com 5+ modelos LLM, alcançando 40x mais velocidade com Llama 3.3 versus Kimi K2.

95%+

Pipeline Success

Jobs Automatizados

1.5M+

Registros

40x

Speed NER

Plataforma NLP-to-SQL — Dados Conversacionais para Enterprise

Analytics & Business Intelligence

Sistema que permite perguntas em linguagem natural sobre bases de dados complexas. Cache multi-nível (exato + semântico) com speedup de 431x, matching categórico de entidades via banco vetorial Milvus, geração automática de charts e contexto conversacional. Economia estimada de $95K-$117K/ano para 1000 queries/dia.

431x

Cache Speedup

~30ms

Cache HIT

$117K

Economia/Ano

50%

Cache Hit Rate

Inferência Distribuída P2P — HyperGrid

Infraestrutura de IA

Sistema de inferência de LLMs distribuído via rede P2P, permitindo que organizações construam seus próprios clusters de IA usando hardware existente. Layer sharding distribui camadas do modelo entre workers, com API compatível OpenAI para integração transparente. Dois protótipos evoluíram para produção: coordenado (Hypergrid1) e descentralizado (libp2p POC).

90%

Redução Custo Infra

69+

Tokens/seg

50%

Menos Memória

~370ms

TTFT

Engenharia de IA em Escala Enterprise

Um ecossistema completo de IA

Arquitetura Macro do Ecossistema MAGIC AI

Private AI & Fabric HyperGrid

MAGIC Private AI

Componentes Core

Capacidades

Mercados-Alvo

Fabric HyperGrid — Inferência Distribuída P2P

Arquitetura

Performance

Produtos & Serviços Desenvolvidos

TeamTela Chat

Agents Studio

BambooAI

RAGFlow

Magic Fabric Data

Agentic Data

TeamAgents Workflow API

Darwin-Gödel Machine

TeamTela Iceberg

Fabric Fleet AI

Speech-to-Text Server

Mem0 MCP Server

DB-MCP Server

Ackerminds Lakehouse

LLM Benchmark Suite

TeamTela Console

Integrações & Bots

Stack Tecnológico

⚡ Backend & APIs

🎨 Frontend

🗄️ Dados & Storage

🤖 AI / ML

☁️ Infraestrutura

📊 Observabilidade

Cases & Impacto

Acker Merrall & Condit — Lakehouse de Dados + NER para Vinhos

Plataforma NLP-to-SQL — Dados Conversacionais para Enterprise

Inferência Distribuída P2P — HyperGrid

Competências & Visão

Full-Stack & Full-Depth

Production-First Mentality

AI-Native Architecture

Visão de Produto & Negócio

Pronto para construir juntos?

Engenharia de IA
em Escala Enterprise