Portfólio Técnico — 2023–2026

Engenharia de IA
em Escala Enterprise

Ao longo de anos, projetei e implementei um ecossistema completo de IA distribuída com 70+ projetos, cobrindo desde inferência distribuída P2P até plataformas no-code de agentes autônomos — tudo sob a marca ResearchMagic / MAGIC AI.

70+
Projetos
107GB
Codebase
8
Linguagens
15+
Serviços em Produção
6.1K+
Testes Automatizados

Um ecossistema completo de IA

Da infraestrutura de GPU distribuída até interfaces de chat com raciocínio avançado — cada camada foi arquitetada e implementada por mim.

Arquitetura Macro do Ecossistema MAGIC AI

Usuário / API
Chat, Console, SDK
Orquestração
Workflow API, Agents Studio
Agentes IA
RAG, NLP-to-SQL, Voice
Inferência
HyperGrid P2P, Triton
Hardware
GPU, CPU, Apple Silicon
Dados
PostgreSQL, MongoDB, Iceberg
Memória Vetorial
Pinecone, Milvus, ChromaDB
Cache & Filas
Redis, Celery, DLQ
Observabilidade
OpenTelemetry, Prometheus

Private AI & Fabric HyperGrid

A plataforma que permite qualquer organização se tornar seu próprio provedor de IA.

Produtos & Serviços Desenvolvidos

Cada componente foi projetado, implementado e deployado por mim — do backend à infraestrutura.

TeamTela Chat

Produção
Interface conversacional enterprise com sistema de raciocínio multi-estágio, RAG integrado, voz via LiveKit e orquestração de squads de agentes. Explicações educacionais transparentes step-by-step.
Next.js 15 React 19 TypeScript PostgreSQL Drizzle ORM NextAuth v5 LiveKit
Multi-LLM
Providers
RAG
Knowledge Base
Voice
Real-time

Agents Studio

Produção
Plataforma visual no-code/low-code para criação de workflows de agentes IA. Drag-and-drop com colaboração em tempo real, billing via Stripe e SDKs em TypeScript e Python.
Next.js 15 React 19 Socket.io PostgreSQL pgvector Stripe Turbo
112+
Test Files
3
SDKs
Real-time
Collaboration

BambooAI

Produção / Open Source
Plataforma de análise de dados em linguagem natural. Converte perguntas em código Pandas executável com sistema multi-agente (8-10 agentes especializados), auto-healing de código e suporte a ontologias OWL.
Python FastAPI Flask Pandas Pinecone SSE
8-10
Agentes
Multi-LLM
Providers
pip
Installable

RAGFlow

Produção
Engine de RAG enterprise com chunking inteligente, análise de layout de documentos, processamento multimodal (PDF, DOCX com imagens), workflows agênticos com MCP e text-to-SQL.
Python Docker K8s MCP Multi-LLM
v0.20+
Versão
Cross-lang
Queries
Agentic
Workflows

Magic Fabric Data

Produção v2.0
Sistema NLP-to-SQL com cache multi-nível (exato + semântico), matching de entidades categóricas via Milvus, geração automática de charts e suporte a conversação contextual. Cache hit 431x mais rápido que pipeline completo.
FastAPI Celery Redis MongoDB Milvus Databricks
431x
Cache Speedup
$95K+
Saving/Ano
15+
API Endpoints

Agentic Data

Desenvolvimento Ativo
Conversor NLP-to-SQL com orquestração LangGraph, plugin registry com 454+ linhas, extração automática de schema, busca semântica via Elasticsearch e validação de SQL com execução segura.
FastAPI LangGraph Elasticsearch PostgreSQL SSE
834
Lines GraphFactory
Plugin
Architecture
Streaming
Real-time

TeamAgents Workflow API

Produção
API central de gerenciamento de agentes IA e orquestração de workflows. Composição de ferramentas, colaboração multi-agente, integração com Factory API e gerenciamento de API keys master.
FastAPI MongoDB Pydantic K8s Async
Multi-Agent
Orchestration
K8s
Ready

Darwin-Gödel Machine

Avançado
Sistema autônomo de evolução de software. Usa algoritmos evolucionários + LLMs para criar código auto-aperfeiçoável com memória vetorial cross-generation, teacher-student patterns e 95%+ de taxa de sucesso.
Python ChromaDB MongoDB pytest-bdd Multi-LLM
95%+
Success Rate
6.1K+
Tests
85%+
Knowledge Reuse

TeamTela Iceberg

Produção
Analytics de transações para tracking de uso de LLMs. Apache Iceberg para data lake, Redis para cache/filas, Celery para processamento async com Dead Letter Queue e operações atômicas com recovery automático.
FastAPI Apache Iceberg Redis MongoDB Celery Cloudflare R2
Token
Usage Tracking
DLQ
Failure Recovery
Atomic
Operations

Fabric Fleet AI

Desenvolvimento Ativo
Gestão inteligente de frota com monitoramento por câmeras em tempo real, GPS tracking via WebSocket, conversão FLV→HLS via FFmpeg, gravação automática e integração com ZenduIT e FleetVision.
FastAPI React 18 WebSocket FFmpeg HLS.js Redis
Real-time
GPS + Video
JT1078
Protocol
DVR
30min Buffer

Speech-to-Text Server

Produção
Proxy TTS compatível com API OpenAI, integração ElevenLabs para alta qualidade, JWT auth, rate limiting via Redis (sliding window), OpenTelemetry tracing e Prometheus metrics.
FastAPI ElevenLabs Redis JWT OpenTelemetry Prometheus
OpenAI
Compatible API
Rate Limit
Sliding Window

Mem0 MCP Server

Produção
Gerenciamento de memória persistente para agentes IA com protocolo MCP. Interface dual REST + MCP, PostgreSQL backend, busca semântica, isolamento por sessão e streaming SSE.
FastAPI PostgreSQL MCP SSE Docker
Dual
REST + MCP
Semantic
Search

DB-MCP Server

Produção
Conector de banco de dados MCP-compliant. Suporte a PostgreSQL, MySQL e SQLite. Queries parametrizadas (proteção SQL injection), connection pooling via Singleton e múltiplos protocolos de transporte.
FastAPI PostgreSQL MySQL SQLite MCP
3
Databases
4
Core Tools
K8s
Ready

Ackerminds Lakehouse

Produção
Lakehouse domain-driven em Databricks com arquitetura medalion (bronze→silver→gold) para empresa de leilão de vinhos. ML modules para scraping, NER de atributos, record matching fuzzy e predição de preços.
Databricks Spark Delta Lake Terraform Azure Python
9+
Databricks Jobs
95%+
Success Rate
19
Modules

LLM Benchmark Suite

Pesquisa
Suite de benchmarking para engines de inferência (vLLM vs sglang) e modelos NER. Inclui server de inferência OpenAI-compatible com multi-hardware (NVIDIA, Apple Silicon, CPU) e benchmarks de throughput GPU.
Python Docker vLLM sglang PyTorch CUDA
5+
Models Tested
Llama 40x
vs Kimi Speed

TeamTela Console

Ativo
Painel administrativo com dashboards, gestão de usuários e monitoramento do sistema. Component library com Radix UI + shadcn/ui.
React TypeScript TailwindCSS Radix UI TanStack

Integrações & Bots

Ativo
Ecossistema de integrações: WhatsApp Client para messaging, Slack para workflow automation, Magic Auth para autenticação, e Casdoor como IAM (OAuth/OIDC) multi-tenant.
WhatsApp Slack OAuth/OIDC Casdoor Magic Links

Stack Tecnológico

Full-stack com profundidade — do kernel ao pixel.

Backend & APIs

  • Python (FastAPI, Flask, Celery)Core APIs
  • Go (Fiber, libp2p)Distributed Systems
  • Node.js / BunTooling & SDKs
  • Protocol BuffersSerialization
  • GraphQL / REST / gRPCAPI Patterns

🎨 Frontend

  • Next.js 15 / React 19Web Apps
  • TypeScript (Strict)Type Safety
  • TailwindCSS + shadcn/uiDesign System
  • Zustand / JotaiState Mgmt
  • ReactFlowVisual Workflows

🗄️ Dados & Storage

  • PostgreSQL + pgvectorPrimary DB + Embeddings
  • MongoDBDocument Store
  • RedisCache, Queues, Rate Limit
  • Apache Iceberg / Delta LakeData Lake
  • Elasticsearch / MilvusSearch & Vectors
  • Databricks / SparkBig Data

🤖 AI / ML

  • OpenAI, Anthropic, xAI, DeepSeekLLM Providers
  • LangGraph / LangChainAgent Orchestration
  • Pinecone / ChromaDB / MilvusVector DBs
  • PyTorch / HuggingFaceModel Inference
  • NVIDIA Triton / vLLM / sglangModel Serving
  • MCP ProtocolAI Integration Standard

☁️ Infraestrutura

  • Docker + Docker ComposeContainerization
  • Kubernetes / K0s / HelmOrchestration
  • TerraformIaC
  • Azure / AWS / Cloudflare R2Cloud Providers
  • Nginx / Custom LBLoad Balancing

📊 Observabilidade

  • OpenTelemetryDistributed Tracing
  • PrometheusMetrics
  • JaegerTrace Visualization
  • GrafanaDashboards
  • Structured LoggingAzure Log Analytics

Cases & Impacto

Números reais de projetos entregues e em produção.

Acker Merrall & Condit — Lakehouse de Dados + NER para Vinhos

Leilão & Varejo de Vinhos Premium

Construí um data lakehouse completo em Databricks com arquitetura medallion (bronze→silver→gold) cobrindo domínios de leilão, operacional, transacional e ML. Inclui módulos de web scraping, parser de atributos de vinho por NER, record matching fuzzy e predição de preços de leilão. Pipeline de NER benchmarkado com 5+ modelos LLM, alcançando 40x mais velocidade com Llama 3.3 versus Kimi K2.

95%+
Pipeline Success
9+
Jobs Automatizados
1.5M+
Registros
40x
Speed NER

Plataforma NLP-to-SQL — Dados Conversacionais para Enterprise

Analytics & Business Intelligence

Sistema que permite perguntas em linguagem natural sobre bases de dados complexas. Cache multi-nível (exato + semântico) com speedup de 431x, matching categórico de entidades via banco vetorial Milvus, geração automática de charts e contexto conversacional. Economia estimada de $95K-$117K/ano para 1000 queries/dia.

431x
Cache Speedup
~30ms
Cache HIT
$117K
Economia/Ano
50%
Cache Hit Rate

Inferência Distribuída P2P — HyperGrid

Infraestrutura de IA

Sistema de inferência de LLMs distribuído via rede P2P, permitindo que organizações construam seus próprios clusters de IA usando hardware existente. Layer sharding distribui camadas do modelo entre workers, com API compatível OpenAI para integração transparente. Dois protótipos evoluíram para produção: coordenado (Hypergrid1) e descentralizado (libp2p POC).

90%
Redução Custo Infra
69+
Tokens/seg
50%
Menos Memória
~370ms
TTFT

Competências & Visão

Full-Stack & Full-Depth

Do design de protocolo P2P em Go ao frontend React com design system. Da infraestrutura Terraform/K8s à otimização de modelos com Flash Attention. Não delego — eu construo cada camada.

Production-First Mentality

15+ serviços em produção com observabilidade (OpenTelemetry, Prometheus), rate limiting, DLQ, circuit breakers e atomic operations. Não é POC — é software que roda 24/7.

AI-Native Architecture

MCP Protocol, LangGraph, multi-agent orchestration, RAG, NLP-to-SQL, memória vetorial, voice AI — cada padrão moderno de IA implementado e validado em produção.

Visão de Produto & Negócio

Análises estratégicas documentadas com ROI calculado, comparações de modelo com métricas de custo/performance, e arquiteturas desenhadas para escalar de startup a enterprise.

Pronto para construir juntos?

Todo este ecossistema está pronto para ser aplicado, escalado e monetizado. 70+ projetos, 107GB de código, anos de R&D — e a melhor parte: tudo funciona.

researchmagic.com

Leandro Barbosa — Engineering Lead & Founder
ResearchMagic / MAGIC AI / TELA