Games se transformam em professores
Lewis Dartnell - da INFO
12 de fevereiro de 2009
Aristides é um típico garoto de 13 anos de idade. Ele joga basquete depois da aula, está aprendendo a tocar clarinete e sempre, no fim do dia, se diverte com seu videogame. Um jogo o atrai particularmente. Ele costuma acessar o site www.fold.it. Com o apelido Cheese, entra numa estrutura 3D que se parece com as raízes de uma árvore. É possível manipular esses tubos verdes de diferentes tamanhos até que se comprimam e atinjam o menor volume possível. Parece um jogo um tanto bizarro — um parente distante do Tetris, talvez. Mas, na verdade, é uma brilhante simulação de um dos mais desafiadores enigmas que os cientistas tentam desvendar: como as proteínas se agrupam?
As estruturas com que Aristides brinca são representações criadas por computador de proteínas reais como o colágeno. Sem que conheça qualquer princípio da biologia molecular, ele está contribuindo com a solução de um dos mais complicados problemas da ciência moderna. “Descobrir exatamente como uma longa cadeia de proteínas se dobra da forma mais compacta possível, com base na análise de infinitas possibilidades, é uma tarefa difícil para os computadores”, diz David Baker, da Universidade de Washington em Seattle, que inventou o jogo. Conforme o comprimento da cadeia de proteínas aumenta, o número de maneiras distintas que ela tem para se agrupar cresce exponencialmente. Mesmo para as cadeias simples, um computador convencional demoraria séculos para encontrar o arranjo ideal. No entanto, com a ajuda de 60 mil jogadores como Aristides, o Foldit já conseguiu determinar como muitas proteínas se organizam.
|quebra|
O sucesso do Foldit resume uma nova e mais inteligente interpretação para uma velha ideia. A última década assistiu ao avanço de projetos de computação distribuída, nos quais complexos problemas computacionais são divididos em partes menores e enviados a milhões de micros espalhados por todo o mundo, para que os cálculos sejam feitos em paralelo. O mais antigo e popular projeto desse tipo integrou o projeto Search for Extraterrestrial Intelligence (SETI — Pesquisa por Inteligência Extraterrestre). No SETI@home, sinais recebidos por vários radiotelescópios são analisados por computadores que estariam ociosos sem essa tarefa, na tentativa de identificar uma mensagem enviada pelos alienígenas. A partir daí, a computação distribuída vem sendo aplicada em outras áreas, incluindo a biologia, a criptografia e a meteorologia.
Entretanto, existem limites até para o que milhões de computadores juntos são capazes de fazer. “Embora essas máquinas sejam muito rápidas e precisas na resolução de certos problemas, elas ainda são superadas de longe pelo cérebro humano em tarefas como processamento visual ou percepção espacial, por exemplo”, diz Aaron Sloman, pesquisador de inteligência artificial da Universidade de Birmingham, no Reino Unido. Por isso, o conceito de computação distribuída está ganhando uma nova abordagem. Em vez de aproveitar apenas PCs ociosos, pesquisadores estão inventando formas de tirar proveito do poder de processamento dos cérebros dos donos desses equipamentos.
Há abundância desse material intelectual à disposição. Clay Shirky, da Universidade de Nova York, chegou à conclusão de que, a cada fim de semana, apenas nos Estados Unidos, 100 milhões de horas (considerando todas as pessoas) são gastas assistindo a comerciais de TV. É o mesmo período gasto para criar e editar os 2,5 milhões de registros da Wikipedia. Se uma fração desse potencial desperdiçado em frente à TV fosse dirigida a atividades online, que ajudassem a ciência, a contribuição seria imensa.
|quebra|
Um dos exemplos mais recentes de tentativas de conseguir o apoio de internautas foi o site Clickworkers, da Nasa. O projeto, lançado em 2000, pedia aos voluntários para que indicassem a posição e o tamanho de crateras em fotografias da superfície de Marte feitas na década de 1970 pela sonda Viking. Mais recentemente, voluntários ajudaram a classificar acidentes geográficos em imagens de ultra-alta resolução transmitidas pela nave Mars Reconnaissance Orbiter. A Nasa também espera contar com essa força de trabalho para examinar as imagens enviadas pela nave espacial Dawn, quando ela explorar Vesta e Ceres, dois corpos celestes encontrados no cinturão de asteroides entre Marte e Júpiter.
Jogos do bem
Há um relevante inconveniente na abordagem do Clickworkers: é uma tarefa solitária e monótona. É difícil entender o que motiva essas pessoas além do altruísmo. Essa característica é um obstáculo ao avanço de projetos que necessitam da colaboração de muitos internautas. O que fazer para que essas pessoas se mantenham estimuladas por essa atividade? Luis von Ahn, cientista da computação da Universidade Carnegie Mellon, no estado americano da Pennsylvania, diz que conhece a resposta para essa questão. Desde 2002, ele incentiva pesquisadores a recorrerem a voluntários — ou computadores humanos — muito além dos esforços do Clickworkers. O segredo de von Ahn é transformar problemas intrincados em jogos divertidos.
|quebra|
Seu primeiro jogo, chamado ESP, foi desenvolvido para criar uma lista de palavras a que as pessoas associariam certas imagens de uma base de dados, com o objetivo de treinar sistemas de inteligência artificial. Para tanto, o jogo forma pares de jogadores anônimos e lhes mostra fotografias idênticas. Os jogadores devem adivinhar qual palavra seu parceiro usará para descrever o objeto retratado. Ganha mais pontos quem descobre isso mais rapidamente. Assim que há concordância nas palavras, uma nova imagem é mostrada e a dupla continua correndo contra o relógio para marcar pontos.
O ESP está disponível no site Games with a Purpose (www.gwao.com), que já atraiu 120 mil participantes e auxiliou várias pesquisas. O ESP, por exemplo, rotulou mais de 50 milhões de fotos e, no ano passado, foi licenciado pelo Google para aprimorar seu mecanismo de busca de imagens. “As pessoas adoram esse jogo e dizem que sentem uma conexão muito forte com os outros voluntários e com os cientistas”, diz von Ahn.
O projeto mais recente do cientista é o reCAPTCHA. CAPTCHAs são imagens geradas por computador nas quais uma palavra é distorcida e apresentada sobre um fundo distrativo. Isso tende a tornar impossível para um sistema computacional reconhecê-la. Mas a tarefa é simples para um ser humano. Esse procedimento é utilizado em sites como o Facebook e o Twitter para confirmar se um novo usuário é realmente uma pessoa e, assim, evitar que crackers usem programas robôs para ativar milhares de contas e enviar spam ou realizar ataques.
|quebra|
O reCAPTCHA aproveita a habilidade das pessoas para identificar as imagens deformadas. Ele usa textos de manuscritos antigos que precisam ser digitalizados, mas que não foram identificados por aplicativos de reconhecimento de caracteres. A palavra desconhecida é mostrada ao usuário junto com uma conhecida, que é o verdadeiro teste de humanidade. Ao decifrar corretamente as duas palavras, os usuários confirmam que são humanos e ganham acesso ao serviço online, e, ao mesmo tempo, ajudam a digitalizar e preservar textos antigos. O sistema já ajudou a transcrever mais de 1 bilhão de palavras. Está sendo empregado para digitalizar 130 anos de edições do The New York Times. No futuro, von Ahn espera desenvolver um método semelhante para fazer transcrições de registros históricos em áudio.
Viagem às galáxias
Recorrer a pessoas para processar imagens não é um método perfeitamente seguro, entretanto. Já houve resultados inesperados, como os notados pelos cientistas do Galaxy Zoo. Esse projeto, iniciado em 2007, reuniu 160 mil voluntários para identificar cerca de 1 milhão de galáxias em imagens coletadas pelo Sloan Digital Sky Survey (www.sdss.org). Internautas tinham de definir a estrutura das galáxias como espiral ou elíptica e anotar a direção da rotação das espirais. Não é necessário conhecimento técnico para realizar essa tarefa. Portanto, qualquer pessoa pode contribuir.
|quebra|
Uma das coisas que os pesquisadores do Galaxy Zoo queriam saber era se existia alguma tendência na direção do giro das galáxias espirais. Uma análise prévia havia apontado que o fato de uma galáxia girar no sentido horário ou anti-horário dependia de para onde se olha, no céu, ou seja, sugeria uma inesperada organização do universo em larga escala. No entanto, as informações obtidas com a ajuda dos voluntários do Galaxy Zoo confirmaram que não existe esse tipo de organização no universo visível.
Mas o Galaxy Zoo detectou uma curiosa tendência na maneira como diferentes voluntários classificavam as mesmas galáxias. Por alguma razão, as pessoas estão mais propensas a interpretar que uma galáxia espiral gira no sentido anti-horário. Os pesquisadores acreditam que essa predisposição não influenciou o resultado. Isso só ficou evidente em razão da grande quantidade de internautas que participaram do projeto. Contudo, essa é uma interessante inferência em relação ao comportamento humano. Como os cientistas podem assegurar que as idiossincrasias inconscientes do ser humano não estão alterando os resultados? A origem da tendência que se observou entre os voluntários do Galaxy Zoo não ficou clara. “Pessoalmente, suspeito que a causa seja simplesmente o fato de o sentido anti-horário ser representado pelo botão do meio”, opinou Kate Land, que conduziu o estudo baseado nos resultados gerados pelo Galaxy Zoo.
|quebra|
O projeto teve outro resultado inesperado. No ano passado, a professora holandesa Hanny van Arkel reconheceu uma estranha entidade astronômica numa imagem. O objeto se parece com um bocado de fumaça verde brilhante, não contém estrelas e não lembra nenhum fenômeno celeste conhecido. Se não fossem os olhos atentos de Arkel, provavelmente esse ente astronômico não teria sido descoberto. “O cérebro humano é incrivelmente eficaz para identificar o incomum, algo complicado para os parâmetros de busca de um sistema de catalogação visual automático”, ressaltou Chris Lintott, astrofísico da Universidade de Oxford e um dos líderes da equipe do Galaxy Zoo. Em agradecimento à habilidade de van Arkel, o objeto ganhou o nome de Voorwerp (objeto, em holandês) de Hanny.
Proteínas na rede
Enquanto o Galaxy Zoo conta com entusiastas da astronomia e o reCAPTCHA, de von Ahn, é usado em locais da web em que o internauta é obrigado a resolver um enigma para ter acesso ao sistema, uma nova geração de projetos espera que as pessoas doem seu tempo livre. O Foldit está na vanguarda desses métodos. Esse jogo surgiu com base em um projeto de computação distribuída chamado Rosetta@home, também desenvolvido por David Baker. De forma similar ao SETI@home, o Rosetta@home usa o tempo ocioso de computadores do mundo todo para procurar todas as possíveis configurações de uma cadeia proteica e descobrir qual delas é a mais compacta. Com os resultados desse projeto, a equipe de Baker publicou, nos últimos anos, uma série de artigos nas revistas Nature e Science a respeito de estruturas e designs de cadeias de proteína. Porém, Baker e seus colegas perceberam que os resultados brutos do Rosetta@home precisavam ser refinados para se tornar úteis. Agora Baker quer analisar as soluções inventadas pelos jogadores do Foldit para aperfeiçoar os programas de computador por trás do Rosetta@home.
|quebra|
Quando se trata de equações complexas como o agrupamento das proteínas, todavia, nem todos estão convencidos de que os seres humanos chegarão às soluções corretas. Vijay Pande — o principal cientista de outro projeto de computação distribuída que simula a organização das cadeias de proteína chamado Folding@home, da Universidade de Stanford — está preocupado com a possibilidade de os voluntários produzirem resultados muito inferiores aos gerados por computadores. “Dobrar proteínas é como aprender a jogar xadrez, mas com mais peças e regras muito mais complicadas. Há um número ainda maior de combinações possíveis”, argumentou ele. Pande não acredita que pessoas serão capazes de explorar todas as articulações possíveis. Embora Pande admita que o Foldit é uma ótima forma de demonstrar a complexidade das proteínas para quem não tem conhecimentos técnicos, ele diz que ficará muito surpreso se os resultados obtidos forem tão bons quanto os oferecidos pelos computadores.
Previsivelmente, Baker discorda disso. O grande número de maneiras inéditas em que as proteínas podem se organizar é exatamente o que confunde os computadores, diz ele. Jogadores como Aristides demonstraram como os seres humanos podem ser habilidosos ao montar proteínas com o intuito de chegar ao arranjo ideal. Poucos meses após começar a brincar com o Foldit, Aristides já se destacou como um dos dez melhores jogadores entre os 60 mil que existem. Ele foi convidado para ser membro do grupo dos melhores participantes do Foldit. O garoto vem demonstrando tanto talento para solucionar o problema exposto pelo jogo que foi apelidado por um dos cientistas de “sábio do Foldit”. Recentemente, foi levado até Seattle para contar aos pesquisadores como decifra os enigmas da organização das proteínas.
|quebra|
Humanos x máquinas
A precisão das abordagens humana e computacional será conhecida em breve, quando saírem os resultados de uma competição chamada Avaliação Decisiva das Técnicas de Previsão da Estrutura das Proteínas (da sigla em inglês CASP). A prova compara estruturas de proteínas determinadas experimentalmente com as previstas pelos pesquisadores — usando computadores ou pessoas. As primeiras análises dos resultados obtidos com o Foldit são promissoras. “Observamos soluções de seres humanos competitivas com as criadas pelas máquinas e, às vezes, até melhores”, afirma Zoran Popovic, da Universidade de Washington, o principal pesquisador por trás do Foldit. “As pessoas terão desempenhos ainda melhores quando as ferramentas dos jogos forem aprimoradas”, diz.
Em novembro, o Foldit foi expandido com um jogo que basicamente desafia os jogadores a elaborar o design de novas proteínas. É possível modificar o aspecto das cadeias, efetivamente criando proteínas sintéticas. Os melhores designs serão sintetizados e testados, diz Popovic. Jogos como esse podem ajudar na produção de novos medicamentos e vacinas. “Nesse jogo, as pessoas terão ainda mais vantagens que os computadores”, prevê Baker.
Do mesmo jeito que as aplicações de computação distribuída avançaram com a popularidade do SETI@home, outras áreas da ciência podem seguir o exemplo do Foldit. Clay Shirky é ainda mais otimista: “No futuro, haverá tantas iniciativas de processamento humano que todos nós sentiremos uma impetuosa competição nesses exercícios cerebrais”. Quem quer que tenha dito que o propósito da tecnologia é nos dar mais tempo livre não podia estar mais equivocado.