Imagina você rodar modelos locais com a mesma qualidade dos grandes modelos de API? essa e a ideia que estou construindo!
Minha tese é simples: especialistas sob demanda vencem generalistas inchados. Em vez de carregar um Frankenstein de 70B parâmetros para “fazer tudo”, eu mantenho um modelo base compacto residente em VRAM e plugo experts leves (LoRA/DoRA/IA³) só quando a tarefa pede. Isso roda em GPU de consumo (8–16 GB), carrega adapters em milissegundos e mantém contexto longo sem custo absurdo. Não é MoE; é composição dinâmica em runtime, com um roteador heurístico que aciona 1–10 experts por consulta.
Banco único é gambiarra elegante. Sistema sério usa três: Elasticsearch (descoberta ampla), Vectorizer MCP (código exato por chunk) e Neo4j (estrutura/relacionamentos). Resultado prático em produção: 95–98% de qualidade percebida, com ~150 ms de latência extra e ~4K tokens por prompt. O custo compensa fácil: 5× de ROI.
Por que RAG bom não é só similaridade. Como combinar semântica, sinais, estrutura e tempo — guiados por um layer de raciocínio — produz respostas atuais, explicáveis e baratas. Inclui uma reflexão crítica sobre o modelo de RAG “buscar parecido e torcer”.
Vamos começar com um título difícil só pra assustar quem chega: "Relevância Semântica Contextualizada com Ponderações Heurísticas Dinâmicas no Pré-processamento de Vetores em Ambientes Cognitivos com ...
Essa reflexão é mais sobre você do que propriamente sobre as IAs, mas vamos aos fatos. Venho acompanhando a evolução da área de TI há mais de 23 anos, e lembro de ouvir falar em IAs pelo menos desde e...
Hoje eu vou falar um pouco sobre a briga que está acontecendo entre os designers e as inteligências artificiais (IAs), que estão sendo super difundidas por aí e utilizadas pelo público em geral. Eu vo...
Hoje eu vou comentar sobre o relatório do Ministério da Defesa, que saiu no dia 09/11, sobre as eleições e o sistema de votação. Como esse é um tema muito polêmico, eu já vou deixar o disclaimer de qu...
Várias pessoas me mandaram mensagens sobre uma notícia que saiu no jornal O Globo no dia 06/11, falando que no segundo turno das eleições, 147 urnas tiveram 100% dos votos para Bolsonaro ou para Lula,...
Hoje eu vou fazer uma análise de um relatório preliminar do primeiro turno das eleições que está rolando na internet, que um dos inscritos do canal do meu YouTube me mandou por email para eu dar uma o...
Hoje eu vou fazer um post curtinho, só para dar continuação a um post anterior, onde eu contei sobre um sistema que eu comecei a desenvolver para monitorar o conteúdo das emissoras de rádios. Eu vou d...