KALLAVY
Começar
Broker de IA do Brasil

Integre as melhores IAs do mundo. Sem complicações.

OpenAI, Claude, Gemini e DeepSeek em um único endpoint — 100% compatível com a API da OpenAI. A Kallavy intermedia cada requisição, contabiliza o uso por cliente e consolida tudo em uma fatura única em reais via PIX com NF-e automática.

Sem cartão internacional
NF-e automática
LGPD compliant
cliente.py
# Troque apenas base_url — zero refactor
from openai import OpenAI

client = OpenAI(
  api_key="sk-br-abc123",
  base_url="https://api.kallavy.com/v1"
)

resp = client.chat.completions.create(
  model="gemini-flash",
  messages=[{"role":"user",
               "content":"Resuma..."}]
)
Latência
~10 ms
Uptime
99.9%

Por que empresas brasileiras escolhem a Kallavy

7+

Modelos de IA

4

Provedores globais

~10ms

Latência média no BR

100%

Infra hospedada no BR

Vantagens

O que torna a Kallavy diferente

Feito por brasileiros, para empresas brasileiras. Removemos todas as fricções entre você e a IA global.

3
barreiras
eliminadas

PIX & NF-e automática

Recarregue sua conta via PIX em segundos. Nota Fiscal emitida automaticamente pelo parceiro Focus NFe. Nunca mais segure uma iniciativa de IA por falta de cartão corporativo.

1

100% compatível com OpenAI

Já usa a biblioteca openai? Troque apenas base_url e continue. Sem SDK novo, sem refactor, sem lock-in.

2

Suporte em português

Time técnico brasileiro no horário de Brasília. WhatsApp, email e chat em PT-BR. Dúvida sobre prompt, erro 429 ou escolha de modelo? Falamos sua língua.

3
Como funciona

Três passos. Cinco minutos.

Do cadastro à primeira chamada da API, sem burocracia.

1

Crie sua conta

CNPJ ou CPF, e-mail e senha. Sua API Key é gerada na hora e aparece apenas uma vez — guarde bem.

2 minutos
2

Recarregue via PIX

QR Code instantâneo assim que a proposta é acertada. O crédito aparece na sua conta em segundos e a NF-e é emitida na sequência, sem intervenção manual.

1 minuto
3

Comece a usar

Aponte seu SDK favorito para api.kallavy.com/v1. Se já usava OpenAI, o código nem muda. A Kallavy intermedia cada requisição: autentica, conta tokens por cliente, repassa pro provedor e devolve a resposta — tudo pronto pra fatura única em reais.

Imediato
Infraestrutura

A única IA com rota direta até o seu usuário

Estamos conectados direto ao PTT.br de São Paulo — o maior ponto de troca de tráfego da América Latina. Peering nativo com as operadoras brasileiras significa que seus dados cruzam menos saltos, chegam mais rápido e com menos pontos de falha.

KA
Kallavy
São Paulo
PTT.br
IX.br SP
Peering direto
Operadoras BR
Vivo · Claro · TIM · Oi · Algar
Seu usuário
Brasil todo

Seu tráfego não atravessa o Atlântico. Sem transit internacional, sem câmbio em cada requisição, sem surpresas no RTT.

~10 ms
Latência média
para SP e RJ
99.9%
SLA de
disponibilidade
10 Gbps
Backbone dedicado.
Zero overselling
PTT.br
Peering direto com
top ISPs brasileiros

Velocidade real

Tráfego nacional não sai do Brasil. Cada request poupa o RTT transatlântico — o que seu chatbot sente é a IA respondendo como se estivesse na sala ao lado.

Resiliência

Roteamento BGP multi-path e fallback automático entre provedores de IA. Se um upstream cair, roteamos para o próximo sem você nem perceber.

Soberania de dados

Servidores em território nacional. Logs, metadados e cadastros ficam no Brasil, aderentes à LGPD. Auditorias e DPA sob demanda.

Modelos disponíveis

Os melhores modelos globais, em um único endpoint

Do GPT-4o premium ao Gemini Flash econômico — escolha o que cabe no seu caso de uso e no seu bolso. Fallback automático se um provedor cair.

OpenAI premium

GPT-4o

Multimodal topo de linha. Visão, texto e raciocínio.

128k contexto
OpenAI econômico

GPT-4o Mini

Rápido e leve para grande volume.

128k contexto
Anthropic premium

Claude Sonnet

Raciocínio profundo e escrita de alta qualidade.

200k contexto
Google premium

Gemini 1.5 Pro

Contexto gigante para análise de documentos.

2M contexto
Google + popular

Gemini Flash

Ultrarrápido. Perfeito para chatbots de atendimento.

1M contexto
DeepSeek alta eficiência

DeepSeek Chat

Altíssimo custo-benefício para uso geral.

64k contexto
DeepSeek reasoning

DeepSeek R1

Raciocínio passo-a-passo estilo o1.

64k contexto
Kallavy em breve

Roteamento automático

Você escolhe qualidade ou custo. A gente roteia.

Multi-provider

Lista de modelos em constante evolução. Fale com a gente para ver valores, SLAs e casos de uso específicos.

Dúvidas frequentes

Perguntas que fazem sentido

Se a sua não estiver aqui, chama a gente no WhatsApp.

A Kallavy é o seu intermediador brasileiro entre sua aplicação e as grandes IAs globais. Quando sua aplicação manda um prompt, a gente autentica a requisição, contabiliza os tokens de entrada e saída por cliente, repassa pro provedor real (OpenAI, Anthropic, Google ou DeepSeek) e devolve a resposta. No fechamento do período, você recebe uma única fatura em reais com NF-e cobrindo todo o uso da equipe. Pense em operadora telefônica: você não fala com cada torre, só com uma empresa que cuida de tudo.

Não. A Kallavy não mantém estoque de tokens. Sua aplicação faz requisições pela nossa API, a gente contabiliza em tempo real e repassa pros provedores reais (OpenAI, Anthropic, Google, DeepSeek). Eles nos cobram pelo uso agregado em dólar, a gente cobra de você em reais esse custo convertido mais uma taxa de intermediação que varia por modelo e volume. A taxa cobre a operação brasileira: NF-e, suporte PT-BR, risco cambial, infra nacional, SLA e contabilização por cliente.

Sim, NF-e de serviço (NFS-e) é emitida automaticamente a cada recarga confirmada via PIX, usando a integração com Focus NFe. Disponível no seu painel em PDF e XML, e também enviada por e-mail.

Não. A API da Kallavy é 100% compatível com a da OpenAI. Basta trocar base_url para https://api.kallavy.com/v1 e usar sua API Key Kallavy. Funciona com a lib oficial openai em Python, Node, Go etc.

Não armazenamos o conteúdo dos prompts nem das respostas — por princípio de LGPD e política interna. Guardamos apenas metadados: modelo usado, quantidade de tokens, horário e custo. Auditorias financeiras e técnicas são baseadas nesses metadados.

Você é cobrado pelo que efetivamente consumir: tokens de entrada e saída por modelo, contabilizados em tempo real. Sobre o custo do provedor em dólar, a Kallavy aplica a conversão em reais e adiciona uma taxa de intermediação que varia por modelo e volume — a taxa cobre NF-e, suporte PT-BR, infra no Brasil, risco cambial e contabilização. Trabalhamos com créditos pré-pagos (PIX) ou faturamento mensal pra contas B2B. Fale com a gente para uma proposta sob medida.

Fallback automático. Se a OpenAI der 5xx, a Kallavy roteia para um modelo equivalente (ex: Claude Sonnet) sem você fazer nada. Você configura a cadeia de fallback no painel.

API no ar agora mesmo

Pronto para chamar a IA?

Crie sua conta, recarregue via PIX e faça sua primeira requisição em menos de 5 minutos. Sem cartão internacional, sem burocracia.

Créditos pré-pagos
Sem fidelidade
NF-e automática