Sabia que você está ajudando a digitalizar livros antigos?

Uma palestra do TED informou aos mais desavisados que muitos usuários de internet estão ajudando a digitalizar livros antigos sem nem se dar conta disso. O guatemalteco Luis von Ahn fez uma apresentação sobre o sistema CAPTCHA, que ele ajudou a criar, revelando o que está por trás desse transtorno.

Você com certeza já viu aqueles códigos chatinhos que precisa digitar ao preencher um formulário, provando que é realmente um ser humano, em vez de um programa de computador com más intenções. Então, toda vez que você digita aquelas letrinhas, está ajudando a web a digitalizar livros antigos. "No total, 900 milhões de pessoas nos ajudam a digitalizar livros através dos CAPTCHA, ou seja, 10% da humanidade," Luis afirma.

O sistema funciona da seguinte maneira: os programas de OCR, que escaneiam uma página de texto para digitalizar as palavras ali contidas, não consegue distinguir algumas letras que aparecem distorcidas, talvez por causa da posição da página, da tinta gasta, do papel amarelado ou simplesmente porque o texto está em uma língua que utiliza acentos (ou cedilhas) que confundem o computador.

Assim sendo, quando digitamos algumas palavras no sistema CAPTCHA, estamos ensinando o computador a ler e aprender palavras novas que vieram de livros digitalizados, melhorando a qualidade e precisão do texto que queremos ler em um livro antigo. Pense bem, se você visitar o Google Books procurar um livro de mil setecentos e guaraná de rolha ―que já caiu no domínio público, não é impresso há décadas e hoje é distribuído livremente pela internet― o CAPTCHA teve uma mãozinha nisso.

O palestrante também explicou a relação entre essa atividade interativa e a iniciativa de traduzir a internet por meio de voluntários. Uma extensão desse projeto é o programa Duolinguo, que será lançado daqui a menos de um mês. Estou curiosa para ver como ele funciona, já que sou tradutora profissional e muito me preocupa essa ideia de que algum dia os computadores serão capazes de traduzir textos rapidamente e em qualquer idioma... Por enquanto, meu emprego está mais do que garantido, principalmente quando vemos o exemplo de tradução mecânica mostrado na palestra. Um desastre!

Outra informação muito divertida é que existe um movimento chamado CAPTCHArt, no qual usuários capturam a tela (pressionando a tecla PrintScreen ou usando um programa para esse fim) quando se deparam com uma combinação bem esquisita de duas palavras selecionadas aleatoriamente pelo sistema no rodapé de um formulário. Um exemplo mostrado pelo palestrante apresenta as palavras "invisible" e "toaster" e o usuário que estava preenchendo o formulário decidiu capturar a tela e desenhar uma "torradeira invisível" para ilustrar a obra de arte.

Confira essa palestra interessante, disponível em inglês, e leia a matéria completa, em espanhol, aqui. Além disso, diga para a gente se, daqui em diante, você vai se sentir um pouco menos incomodado com aquelas palavrinhas chatas que encontra no final de um formulário.