---
title: "FAQ sobre Comandos de Voz no OpenClaw"
url: "https://openclaw.ia.br/faq/voice-faq/"
markdown_url: "https://openclaw.ia.br/faq/voice-faq.MD"
description: "Perguntas frequentes sobre usar o OpenClaw com comandos de voz: áudio, transcrição e TTS."
date: "2026-02-15"
author: ""
---

# FAQ sobre Comandos de Voz no OpenClaw

Perguntas frequentes sobre usar o OpenClaw com comandos de voz: áudio, transcrição e TTS.


### O OpenClaw entende áudio/voz?

Sim! Envie mensagens de voz pelo WhatsApp ou Telegram. O OpenClaw transcreve via Whisper e responde normalmente.


### O assistente pode responder com voz?

Sim! Configure `tts_enabled: true` e escolha voz. Respostas são convertidas em áudio e enviadas como mensagem de voz.


### Qual a qualidade da transcrição?

Whisper (OpenAI) tem ~95% de acurácia em português brasileiro. Para áudio com ruído, a qualidade pode cair.


### Funciona com sotaques regionais?

Sim, Whisper suporta bem variações regionais do português brasileiro. Sotaques muito fortes podem ter menor acurácia.


### Transcrição funciona offline?

Sim, com Whisper local via Ollama ou whisper.cpp. Sem custo e sem enviar áudio para nuvem.


### Posso usar voz no Discord?

Sim, o bot pode participar de canais de voz no Discord, ouvir e responder (requer configuração avançada).


### Quanto custa a transcrição?

Whisper API: $0.006/minuto (~R$0.03/min). Whisper local: gratuito.


### Áudios longos funcionam?

WhatsApp limita áudio a 15 minutos. Telegram não tem limite prático. Para reuniões longas, divida em partes.


---

## Não encontrou sua resposta?

- [FAQ Geral](/faq/geral/) — perguntas básicas sobre o OpenClaw
- [FAQ Técnico](/faq/tecnico/) — problemas técnicos e soluções
- [Troubleshooting](/troubleshooting/) — guias de solução de problemas
- [Comunidade Discord](https://discord.gg/clawd) — pergunte para outros usuários
- [GitHub Issues](https://github.com/openclaw/openclaw/issues) — reporte bugs