Siga-me no Twitter em @vascofurtado

segunda-feira, 18 de maio de 2009

Porque a Informação na Internet Flui tão Rapidamente?

Em alguns textos desse blog (aqui e aqui, por exemplo), escrevi sobre as celebridades da web e sobre indicadores de porque elas aparecem. Mas nem todas as causas se relacionam com o aspecto cultural ou comportamental dos internautas. Uma das razões é porque a web é uma rede que possui algumas características que a tornam infraestrutura adequada para fluxo da informação. Deixem-me introduzir dois conceitos estatísticos importantes para a compreensão do todo. O primeiro é o de distribuição probabilística de uma variável aleatória (puxa vida!). Calma. Basta entender que a maioria dos fenômenos que ocorre na vida real segue o que chamamos de distribuição normal ou gaussiana. Por exemplo, se estivermos interessados em observar a altura dos cidadãos adultos de Fortaleza (a variável a ser observada). A maioria vai estar perto da média (admitamos 1,68m). Poucos estariam nos extremos (2,00m e 1,50m). Se traçarmos um gráfico onde no eixo X temos as alturas das pessoas e no Y a quantidade de pessoas com aquela altura, veremos que a curva tem um formato de sino (por isso chamada de em inglês, Bell Curve). O pico da curva é a média e as caudas, tanto esquerda como direita, representam os extremos com as poucas pessoas altas e as poucas baixas, respectivamente. Agora, nem tudo no mundo segue essa regra. Algumas coisas têm um comportamento bem “desajeitado” (ou seja, não seguem a curva normal). Por exemplo, vamos observar agora os aeroportos do mundo todo (colocando-os no eixo X) em relação à quantidade de vôos que eles recebem por dia (eixo Y). Será que o gráfico faz a mesma curva? Ou seja, poderíamos dizer que a maioria dos aeroportos recebe em média o mesmo número de vôos? Evidentemente que não. Temos poucos aeroportos no mundo que recebem milhares de vôo por dia e muitos aeroportos que recebem poucos vôos. Esses poucos aeroportos com muitos vôos são chamados de hubs. Se traçarmos a curva para retratar a distribuição dos aeroportos teremos a curva B da figura abaixo. Já escrevi sobre essa curva chamada de cauda longa aqui. Voltemos então à questão da web. Duas características próprias da web seguem a distribuição tipo cauda longa. Se escolhermos as páginas da web como nossa variável de observação e a quantidade de links que apontam para cada página (ou mesmo a quantidade de acessos que elas recebem), observamos que se forma uma rede onde poucas páginas recebem milhões de links (os hubs são Google, Facebook, Youtube, Blogger, etc,) e milhões de outras recebem pouco links. Isso também vale para as redes que se formam nos sites de relacionamento tipo Orkut, Facebook, MySpace, etc. Nelas temos poucas pessoas que têm milhares de amigos e são super conectadas enquanto temos milhões de pessoas que são pouco conectadas. Mas o que isso tem mesmo a ver com a velocidade do fluxo da informação? Essas redes, ditas livres de escala (scale free, em inglês) possuem uma propriedade que influencia diretamente a velocidade de transmissão da informação: a conexão entre dois pontos quaisquer da rede se faz em média com poucos passos. É por isso que se consegue ir de avião de qualquer canto do mundo para qualquer outro somente com duas ou no máximo três conexões. Os hubs acabam se conectando e fazem um papel de centralizadores e distribuidores entre pontos com poucas conexões. Assim uma informação que sai de um ponto da rede chega aos outros muito rapidamente, pois viaja através de hubs. A figura C mostra o formato de uma rede desse tipo. O mais interessante é que essas características estão presentes em redes diversas que vão desde redes moleculares, partículas subatômicas e mesmo distribuição de crimes numa cidade. O estudo dessas redes deu origem ao que alguns batizam de ciência das redes. Uma área com enfoque multi-disciplinar explorada por físicos, biólogos, químicos, sociólogos e cientistas de computação dentre outros.

Nenhum comentário: