Este documento tem por objetivo central apresentar uma forma de se utilizar o computador através de comandos de voz. A ferramenta escolhida foi o recurso de acessibilidade nativo presente no sistema operacional Windows 11. As principais vantagens de se utilizar o recurso nativo são o suporte a longo prazo por parte do fabricante do sistema operacional, correções de “bugs” de forma mais rápida e consistente, maior integração com aplicativos instalados e não possuir nenhum custo adicional ao usuário.
O recurso de acessibilidade nativo do Windows 11 habilita o usuário a trabalhar com o Windows e seus diversos aplicativos por voz, como interagir com itens na tela, utilizar o teclado e o mouse por voz, trabalhar com a criação, edição e navegação de textos por voz e muitas outras funcionalidades. O recurso também habilita o controle do sistema por visão, porém essa funcionalidade não será coberta por este documento.
O acesso por voz do Windows 11 permite que todos, incluindo pessoas com deficiências de mobilidade, possam controlar seu computador e texto de autor através de sua voz. Essa funcionalidade está disponível no Windows 11 versão 22H2 e posterior, portanto recomendamos que o sistema operacional esteja sempre atualizado para se adquirir as últimas melhorias ao recurso de acessibilidade do Windows.
O video abaixo demonstra como realizar a configuração inicial da funcionalidade de acessao por voz do Windows 11.
A funcionalidade de acesos por voz do windows possui uma grande quantidade de comandos para realizar diferentes ações com o computador. Abaixo estão algumas das ações mais úteis para lidar com a prórpia ferramenta e acessar o menu de controle e comandos do recurso
| Para fazer isto | Diga isto |
|---|---|
| Ativar o acesso por voz | Unmute |
| Desativar o acesso por voz | Mute |
| Abrir a lista de comandos | What can i say |
| Ativar o modo de Comandos | Commands mode |
| Ativar o modo de Dicção | Dictation mode |
| Ativar o modo padrão (ditar & comandos) | Default mode |
| Mostrar numeros | Show numbers |
| Esconder numeros | Hide numbers |
| Clicar em um item | Click <nome_do_item> |
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos iniciais.
Abaixo estão alguns dos comandos mais úteis para interagir com controles utilizando a ferramenta de acesso por voz do Windows 11. Estes comandos nos permitem efeutar clicks, mover o ponteiro do mouse para um item, liberar a última ação realizada e muito mais. A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção. Um ponto muito importante é que estes comandos funcionam na janela ativa. Para interagir com outras janelas é necessário mudar o contexto para a janela desejada (veja Interação com Aplicativos).
| Para fazer isto | Diga isto |
|---|---|
| Clicar em um item | Click <nome_do_item> |
| Duplo Clique em um item | Double click <nome_do_item> |
| Mover o ponteiro para um item | Move to <nome_do_item> |
| Liberar a última ação | Dismiss |
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos.
Abaixo estão alguns dos comandos mais úteis para interagir com overlays utilizando a ferramenta de acesso por voz do Windows 11. Estes comandos nos permitem efeutar um controle mais fino sobre os componentes. A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Mostrar numeros | Show numbers |
| Mostrar numeros na janela ativa | Show numbers here |
| Mostrar numeros para o aplicativo | Show numbers <nome_do_aplicativo> |
| Cancelar um ação | Cancel |
| Interagir com o numero | <numero_desejado> |
| Mostrar a grid | Show grid |
| Esconder a grid | Hide grid |
| Desfazer a ultima ação | Undo |
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos.
Abaixo estão alguns dos comandos mais úteis para interagir com aplicativos utilizando a ferramenta de acesso por voz do Windows 11. Estes comandos nos permitem abrir, fechar, minimizar, maximizar, trocar de contexto entre aplicativos e muito mais. A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Abrir um aplicativo | Open <nome_do_aplicativo> |
| Fechar Aplicativo | Close <nome_do_aplicativo> |
| Mudar para o aplicativo | Switch to <nome_do_aplicativo> |
| Minimizar o aplicativo | Minimizae <nome_do_aplicativo> |
| Maximizar o aplicativo | Maximizae <nome_do_aplicativo> |
| Restaurar o aplicativo | Restore <nome_do_aplicativo> |
| Rolar para uma direção | Scroll <direção> |
| Iniciar a rolagem para uma direção | Start scrolling <direção> |
| Para a rolagem | Stop scrolling |
| Pesquisar algo em algum mecanismo de busca | Search on <mecanismo_de_busca> for <assunto_desejado> |
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos.
Abaixo estão alguns dos comandos mais úteis para interagir com o mouse e teclado utilizando a ferramenta de acesso do Windows 11. Estes comandos nos permitem efeutar clicks com o mouse, pressionar teclas específicas do teclado e muito mais. A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Executar um clique com o botão esquerdo | Click ou Left click |
| Executar um clique com o botão direito | Right click |
| Executar um clique duplo | Double click |
| Pressionar uma tecla | Press <tecla> |
| Pressionar e segurar uma tecla | Press and hold <tecla> |
| Soltar a tecla pressionada | Release <tecla> ou Release <tecla> |
| Pressionar a tecla Esc | Escape ou Cancel |
| Pressionar a tecla Backspace | Backspace |
| Pressionar a tecla Enter | Enter |
| Mover o ponteiro do mouse em uma direção | Move mouse <direção> |
| Arrastar o ponteiro do mouse em uma direção | Drag mouse <direção> |
| Aumentar a velocidade do ponteiro | Faster ou Move faster |
| Diminuir a velocidade do ponteiro | Slower ou Move slower |
| Parar de mover o ponteiro do mouse | Stop ou Stop moving |
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos.
O acesso por voz também possui comandos para trabalhar com textos, permitindo ditar e inserir símbolos e caracteres especiais, selecionar, editar e navegar por textos.
A lista completa de comandos pode ser acessada pela própria ferramenta através do comando "What can i say". O video abaixo demonstra como utilizar alguns destes comandos.
A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Inserir texto em uma caixa de texto | <texto_a_ser_inserido> |
| Inserir um comando de acesso de voz como texto em uma caixa de texto | Type <comando_de_voz> |
| Inserir texto no cursor com inicial maiúscula para cada palavra | Capitalize <texto_a_ser_inserido> |
| Inserir texto sem espaço em branco antes | No space <texto_a_ser_inseridoo> |
| Abrir o teclado virtual | Show keyboard |
| Fechar o teclado virtual | Hide keyboard |
| Soletre o texto letra por letra | Spell that |
| Corrigir o texto selecionado ou último texto ditado | Correct that |
| Corrigir texto específico | Correct <texto_a_ser_corrigido> |
O video abaixo demonstra como utilizar os comandos de Ditar Textos do Acesso de Voz / Voice Access
A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Selecionar próxima palavra | Select that |
| Selecione tudo | Select all |
| Selecionar Texto | Select <texto_a_selecionar> |
| Selecionar linha | Select line |
| Selecionar palavra | Select <palavra_a_selecionar> |
| Selecionar parágrafo | Select paragraph |
| Selecionar próximos N caracteres | Select next <contagem_desejada> characters |
| Deselecionar | Unselect that |
A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Excluir o texto selecionado ou último ditado | Delete that |
| Excluir texto específico | Delete <texto_a_ser_excluído> |
| Excluir todo o texto | Delete all |
| Excluir caractere anterior ou seguinte | Delete previous character ou Delete next character |
| Excluir palavra anterior ou seguinte | Delete previous word ou Delete next word |
| Recortar o texto selecionado | Cut that |
| Copiar o texto selecionado | Copy that |
| Cole o texto em uma caixa de texto | Paste that |
| Desfazer a última ação | Undo that |
| Refazer a última ação | Redo that |
A tabela abaixo apresenta alguns dos comandos mais importantes para esta seção.
| Para fazer isto | Diga isto |
|---|---|
| Inserir uma nova linha | New line |
| Inserir um novo parágrafo | New paragraph |
| Mover o cursor para antes ou depois de um texto específico | Go before <texto_desejado> ou Go after <texto_desejado> |
| Ir para o topo ou parte inferior de um documento | Go to top ou Go to bottom |
| Mover o cursor para o começo ou fim da palavra | Go to start of word ou Go to end of word |
| Mover o cursor para o começo ou fim da linha | Go to start of line ou Go to end of line |
| Mover o cursor para o começo ou fim de um parágrafo | Go to start of paragraph ou Go to end of paragraph |
| Mover o cursor um número de caracteres ou palavras para a esquerda ou direita | Move left/right <N_desejado> characters ou Move left/right <N_desejado> words |
| Mover o cursor para cima ou para baixo por um número de linhas ou parágrafos | Move up/down <N_desejado> lines ou Move up/down <N_desejado> paragraphs |
Além do sistema de comando por voz do Microsoft Windows há uma gama de softwares que proporcionam o controle do computador por voz e a transformação de áudio em caracteres. Neste contexto de conversão de informações de áudio para texto abordaremos abordaremos o software gratuito Lily Speech.
LilySpeech é um aplicativo de ditação de voz e conversão para texto para a plataforma Microsoft Windows e possui suporte para 51 idiomas, incluindo o português brasileiro. O software LilySpeech é alimentado pelo serviço de fala para texto do Google Chrome, que é 99,5% preciso (o mesmo sistema da assistente do Android). É possível personalizar o LilySpeech para reconhecer palavras personalizadas. Podem ser nomes comerciais, endereços da web, a grafia correta dos nomes das pessoas, termos específicos do setor ou qualquer coisa que desejar.
Em termos de utilização de recursos é um software extremamente leve que não deixa o computador lento nem consumirá sua memória. Isso é possível porque a conversão real de fala em texto ocorre na nuvem e não utiliza os recursos das máquinas locais. Além disso, Lily Speech pode transcrever o áudio diretamente para qualquer software de processamento de texto, eliminando a necessidade de digitação e também aumenta a velocidade de inserção de dados uma vez que a fala é mais rápida que a digitação. O Lily Speech também permite com uma tecla de atalho abrir a captação de áudio (gadget), facilitando o uso do software por parte do usuário com limitações motoras.
O video abaixo demonstra como instalar e utilizar algumas das funcionalidades do Lily Speech.
Este documento esta sobre a licença de Cultura Livre da Creative Commons
Controle do Windows por Voz by Ayrton Albuquerque, Eduardo Janaczko, Thales Salata is licensed under CC BY 4.0