Ciência
Novo algoritmo analisa redes sociais
Paula Rothman, de INFO Online Quarta-feira, 30 de junho de 2010 - 17h02Wiki Commons |
![]() |
SÃO PAULO - Na Universidade de Maryland, cientistas criam algoritmo capaz de analisar redes com mais de 778 milhões de pontos.
Chamado COSI ("Cloud Oriented Subgraph Identification”), ele irá permitir a análise de padrões em redes como facebook, orkut e Twitter, que contém milhões de links.
“Percebemos que a maioria dos trabalhos em achar padrões só se aplicava a pequenos gráficos em rede”, diz o professor V.S. Subrahmanian, autor do projeto feito em parceira com seu aluno Matthias Broecheler e com Andrea Pugliese, professor da Universidade de Calábria, na Itália.
“Com a ascensão das redes sociais, esses gráficos estão ficando enormes. Tome o Facebook como exemplo: cada pessoa é mais que um ponto na rede, pois cada comentário, cada foto, quem tageou algo, cada informação torna-se um ponto”, diz Subrahmanian.
Em dois anos de trabalho, a equipe buscou resolver um dos problemas fundamentais: a partir de um padrão estabelecido, seria possível encontrar todas as sub-redes relacionadas com a consulta (a chamada query)?
“Por exemplo, queremos encontrar em uma rede todos que estejam empregados em uma empresa X, que são fãs do cantor Y, que buscam conselho de viagens no Brasil, e assim por diante”, diz o professor. “Para otimizar esta busca, a chave está na habilidade de dividir essas querys em muitas partes quase independentes, cada uma em um cluster – de forma que a probabilidade de que todos os dados desejados estejam na mesma nuvem aumenta”.
Em outras palavras, a equipe de Maryland encontrou uma forma de dividir as redes sociais em uma serie de pequenas sub-redes quase independentes. Cada uma delas está armazenada em um cluester diferente de computadores. Essa divisão foi baseada nos tipos de consultas feitas ao banco de dados. “Os padrões de pedidos de query feitos no passado nos ajudam. Vemos o que as pessoas pediram e, baseado nisso, agrupamos a rede social em diferentes clusters”, diz Subrahmanian.
O arranjo se dá de forma que a probabilidade de uma query precisar ter acesso a dois clusters é a menor possível. “Suponha que você trabalhe em um projeto e precise reunir frequentemente duas pessoas do escritório. Seria uma vantagem tê-las sentadas próximas, ao invés de colocá-las em prédios separados. O mesmo acontece com as querys: se forem acessadas sempre juntas, é melhor colocá-las juntas”, explica.
De acordo com o professor, o novo sistema poderia resolver problemas em redes sociais com 778 milhões de pontos. A ferramenta, que ainda deve levar alguns meses antes de ser disponibilizada, poderia ser aplicada a campanhas de marketing e até mesmo eleições.
Últimas notícias de Ciência
23/05/2012 - 08h22 - Amantes do café vivem mais, diz estudo
22/05/2012 - 20h00 - Unicamp descobre ponto fraco da vassoura-de-bruxa
22/05/2012 - 16h50 - Aos 96, morre Eugene Polley, inventor do controle remoto
22/05/2012 - 15h29 - Primeira nave privada decola em direção à ISS
22/05/2012 - 09h00 - Nasa faz foto psicodélica da órbita da Terra
-
Ao invés de "gráfico", neste contexto o termo certo não seria "grafo"?
enviado por: Guilherme M. Stiebler em 01/07/2010 - 23:57 -
Achei que quem escrevia para a Info saberia algo de computação... cluster em data mining é diferente de "cluster de computadores" djow...
enviado por: Dirceu Pauka Júnior em 01/07/2010 - 11:34 -
Mas na terceira vez que ele pensa acaba comprando. xD
Drigotav Tav.
enviado por: jonathan em 30/06/2010 - 19:28 -
Vender, vender, vender, tudo isso baseado na premissa de que as pessoas compram por impulso. É... tem tudo para dar certo. Se o cliente pensar duas vezes ele não compra.
enviado por: Drigotav Tav em 30/06/2010 - 18:45





30
