Como Criar um Portal de Notícias Tech 100% Autônomo e Custo Zero

No atual cenário de inteligência artificial, muito se fala sobre o potencial dos agentes autônomos. Mas como tirar esses conceitos do papel e criar uma ferramenta real que trabalha para você todos os dias, sem estourar o limite do cartão de crédito?

Recentemente, encarei o desafio de construir um sistema de curadoria, enriquecimento e publicação de notícias de tecnologia 100% autônomo. O objetivo era claro: o sistema deveria rodar na minha própria infraestrutura (self-hosted), ler múltiplos feeds RSS, filtrar conteúdos inéditos do dia, expandir a matéria com pesquisas em tempo real na internet, gerar imagens conceituais e publicar tudo formatado no WordPress. E o melhor de tudo: gastando absolutamente zero reais.

Após algumas sessões de arquitetura e engenharia de fluxos, tomamos as decisões mais resilientes que transformaram essa ideia em um robô indestrutível. Abaixo, compartilho o blueprint e as decisões técnicas que fizeram esse projeto dar certo.


🛠️ A Arquitetura do Sistema (A Pilha Open-Source)

Para garantir o controle total dos dados e custo zero de infraestrutura, escolhemos as seguintes ferramentas:

  • Orquestrador Core: n8n (Community Edition) rodando localmente via Docker (utilizando a tag :latest-ai para habilitar os nós de LangChain).
  • CMS: WordPress (também self-hosted), atuando como a nossa camada de apresentação.
  • Cérebro (LLM): Google AI Studio (Gemini 1.5 Flash) na camada gratuita como motor principal.
  • Olhos na Web: Tavily AI / Serper.dev para permitir que a IA navegue no Google e enriqueça as matérias.
  • Diretor de Arte: Pollinations AI (modelo FLUX) para geração contínua de imagens de capa sem necessidade de chaves de API.

🚀 As 5 Grandes Decisões Acertadas do Projeto

Durante o desenvolvimento, nos deparamos com os desafios clássicos de engenharia de automação. Estas foram as soluções que ditaram o sucesso do sistema:

1. Filtro Estrito por String e Fuso Horário

O Desafio: Feeds RSS vêm de servidores espalhados pelo mundo, gerando conflitos de fuso horário que faziam o robô duplicar ou “perder” as notícias da madrugada.
A Solução: Em vez de confiar em operadores padrão de data, forçamos o nó Filter do n8n a converter tanto a data de publicação quanto a data atual ($now) em strings puras no formato yyyy-MM-dd. Comparação de texto exato eliminou qualquer falha de fuso horário.

2. Barreira Anti-Repetição com N8N Data Tables

O Desafio: Como o robô roda todos os dias lendo os mesmos feeds, precisávamos de uma memória de longo prazo para ele nunca reescrever e repostar uma matéria antiga.
A Solução: Recusamos soluções complexas como instalar um banco PostgreSQL dedicado. Em vez disso, ativamos o N8N Data Tables (banco SQLite interno nativo da versão Community). Criamos a tabela historico_posts. Agora, o robô faz uma consulta rápida utilizando a lógica If Row Does Not Exist antes de mandar o conteúdo para a IA. O que já foi lido é descartado imediatamente.

3. Filtro Antes do “Limit” (Curadoria Inteligente)

O Desafio: Configuramos o robô para processar no máximo 5 notícias de cada feed por execução. Porém, se as 5 primeiras notícias do feed fossem as mesmas de ontem, o robô atingia o limite processando nada de novo.
A Solução: Mudamos a topologia do fluxo. O nó Data Table que checa o histórico foi posicionado antes do nó Limit. Dessa forma, se o feed trouxer 10 notícias e 5 já forem antigas, o banco descarta as repetidas primeiro, garantindo que o limite de 5 seja preenchido apenas por matérias 100% inéditas.

4. Pollinations AI via GET e Injeção de Contexto no WordPress

O Desafio: APIs de imagem de ponta possuem limites severos de créditos gratuitos ou geravam bloqueios de segurança (erros 403 do CloudFront) no n8n. Além disso, o nó nativo do WordPress não possuía o campo “Imagem de Destaque” (Featured Media).
A Solução: Substituímos geradores complexos pelo Pollinations AI, enviando o prompt formatado dinamicamente via requisição GET com encodeURIComponent. Para a publicação, dividimos em duas etapas: primeiro, o n8n faz o upload do arquivo binário para a biblioteca de mídias do WordPress através de um nó HTTP Request. Em seguida, criamos o post em modo Draft e usamos um segundo HTTP Request na rota /posts/{id} para injetar o ID da imagem gerada como a capa oficial.

5. Mecanismo de Contingência Automática (Fallback)

O Desafio: APIs gratuitas sofrem com Rate Limits (limites de requisições por minuto). Se o ecossistema estivesse sob alta carga, o robô quebrava no meio da madrugada.
A Solução: Tornamos o fluxo resiliente. Configurando a opção On Error -> Redirect to Error Port no nó do Gemini, abrimos um “Plano B”. Se o Gemini falhar por excesso de tráfego, o n8n ignora o erro instantaneamente e desvia o fluxo para um segundo nó de IA configurado com o Groq Cloud (Llama 3). Um nó Merge no modo Choose First Operating garante que, não importa qual IA responda, o portal receberá o artigo.


⚙️ O Fluxo de Trabalho Final (Workflow)

O resultado final é uma obra de arte visual dentro do n8n:

  1. Schedule Trigger: Acorda o robô todas as manhãs.
  2. Múltiplos RSS Readers: Coletam as atualizações em paralelo.
  3. Data Tables Check: Filtra o que nunca foi visto antes.
  4. Limits & Merge: Separam o filé m聯gnon das notícias e unificam a lista.
  5. AI Agent (Gemini/Groq) + Tavily: Analisa os títulos, pesquisa os desdobramentos na web e gera uma matéria jornalística estruturada estritamente em JSON com propriedades de title, html_content, prompt_imagem e categoria_id.
  6. Pollinations API: Cria a identidade visual em segundos.
  7. WordPress API Pack: Faz o upload da mídia, publica o rascunho na categoria correta, vincula a capa e registra o link na tabela de histórico.

Workflow n8n

💡 Lição Aprendida

Automatizar processos não é apenas empilhar ferramentas, é saber gerenciar o fluxo de dados e prever falhas. Construir um sistema autônomo com custo zero provou que a comunidade open-source e as ferramentas self-hosted atingiram um nível de maturidade onde o único limite real é a nossa criatividade.

Se você está pensando em escalar seu marketing de conteúdo, criar portais de nicho ou apenas estudar engenharia de prompts e agentes de IA, o n8n combinado com modelos open-source/gratuitos é o melhor ponto de partida.

E você, qual processo repetitivo do seu dia a dia está implorando para ser orquestrado por um agente autônomo? Deixe nos comentários! 🚀

Nota do autor:

Como é o propósito desse projeto, essa coluna foi escrita utilizando o Modo IA do Google gerando a matéria a partir do contexto. Caso tenham interesse no template do n8n, posso disponibilizar.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *