FAQ Ollama (Modelos Locais) no OpenClaw

Ollama permite rodar modelos de IA no seu computador. Zero custo de API, funciona offline, privacidade total. Ideal para dados sensíveis.

Para PC com 8GB RAM: llama3.1:8b-q4. Com 16GB: llama3.1:8b. Com 32GB+: llama3.1:70b-q4. Para código: codestral.

Sim, excelente no Mac com Apple Silicon (M1/M2/M3). Usa GPU integrada para inferência rápida.

Modelos 7-8B são bons para FAQ e tarefas simples. Para qualidade próxima ao GPT-4, use 70B (precisa de 40GB+ RAM).

Sim! Configure model routing: Ollama para privacidade (dados sensíveis), Claude/GPT-4 para qualidade máxima.

Execute ollama pull modelo novamente. Ele baixa apenas as atualizações. Verifique novos modelos em ollama.ai/library.

Sim, detecta automaticamente. CUDA deve estar instalado. Verifique: nvidia-smi. Inferência é 5-10x mais rápida com GPU.

Sim, via WSL2 ou app nativo para Windows. Mac e Linux são os mais otimizados.

Não encontrou sua resposta?