FAQ sobre Comandos de Voz no OpenClaw
Perguntas frequentes sobre usar o OpenClaw com comandos de voz: áudio, transcrição e TTS.
O OpenClaw entende áudio/voz?
Sim! Envie mensagens de voz pelo WhatsApp ou Telegram. O OpenClaw transcreve via Whisper e responde normalmente.
O assistente pode responder com voz?
Sim! Configure tts_enabled: true e escolha voz. Respostas são convertidas em áudio e enviadas como mensagem de voz.
Qual a qualidade da transcrição?
Whisper (OpenAI) tem ~95% de acurácia em português brasileiro. Para áudio com ruído, a qualidade pode cair.
Funciona com sotaques regionais?
Sim, Whisper suporta bem variações regionais do português brasileiro. Sotaques muito fortes podem ter menor acurácia.
Transcrição funciona offline?
Sim, com Whisper local via Ollama ou whisper.cpp. Sem custo e sem enviar áudio para nuvem.
Posso usar voz no Discord?
Sim, o bot pode participar de canais de voz no Discord, ouvir e responder (requer configuração avançada).
Quanto custa a transcrição?
Whisper API: $0.006/minuto (~R$0.03/min). Whisper local: gratuito.
Áudios longos funcionam?
WhatsApp limita áudio a 15 minutos. Telegram não tem limite prático. Para reuniões longas, divida em partes.
Não encontrou sua resposta?
- FAQ Geral — perguntas básicas sobre o OpenClaw
- FAQ Técnico — problemas técnicos e soluções
- Troubleshooting — guias de solução de problemas
- Comunidade Discord — pergunte para outros usuários
- GitHub Issues — reporte bugs