quinta-feira, 17 de novembro de 2011

Big DADOS

Idade dos dados
De repente, podemos conhecer o mundo completamente. Em seguida, reprogramá-lo

The Glory of Big Data Jesse Lenz

No final do primeiro dia da Conferência deste ano TED, seu curador discreto, Chris Anderson, subiu ao palco e fez um pronunciamento. "O poder de computação em algumas das coisas que estamos vendo é realmente surpreendente", disse ele. "Parece-me como se as coisas de repente marcou até um nível de uma forma inesperada. Estamos acostumados a Lei de Moore.Estamos acostumados a coisas cada vez melhor e melhor. E depois de alguns anos, de repente só se sente como se-Kapow!-Não há mudança um passo. "

Para trás quando era apenas uma conferência exclusiva para génios geek e capitalistas de risco, TED significava Technology, Entertainment, Design. Agora que mais de 1.000 TED Talks estão disponíveis on-line livre e foram vistos 300 milhões de vezes, os três iniciais são menos significativos do que é o ethos expressa no lema da conferência, "Ideas Worth Spreading". De qualquer maneira, TED nunca foi sobre o recolhimento seus falantes juntos para apoiar alguma "tendência". predigested

Em 2011, o volume de dados disponíveis está prevista para continuar ao longo de sua curva de crescimento exponencial para 1,8 zettabytes. (A zettabyte é um trilhão de gigabytes; que é a 1 com 21 zeros à direita por trás dele.)O que eu acho que é por isso que Chris parecia tão surpreso e encantado com sua própria declaração.Nós tínhamos acabado de ouvir de Mattias Astrom, cuja empresa digitalmente mapas cidades do mundo e todos os edifícios neles gloriosamente fiel renderizações tridimensionais. Depois disso, o artista digital Aaron Koblin explicou como ele visualiza enormes conjuntos de dados (por exemplo, traçando todos os vôos na América do Norte e, em seguida, quebrar os dados por tipo de tempo, de altitude de avião, e assim por diante, e apresentar tudo isso em um seqüencialmente renderização spoolable que é ao mesmo tempo reveladora e bela). Koblin especializada em projetos de crowdsourced, como um vídeo da música Johnny Cash puxado por milhares de estranhos, frame por frame. O nível de detalhes é impressionante, um fã derramou 31.000 pinceladas em um único frame. E porque este é o espaço digital e criação de cada quadro é registrado e catalogado online, você pode assistir todos os tempos, assim como cada artista desenhou.

Mas não foi até a manhã seguinte que realmente entendeu o que Chris tinha sido chegar. É quando Deb Roy, que dirige o Cognitive grupo Machines no MIT Media Lab, subiu ao palco e apresentou-nos ao filme caseiro final, 240 mil horas de vídeo e áudio que cobrem quase todas as interações seu filho tinha com ninguém em toda a família Roy do momento em que o recém-nascido chegou em casa do hospital. Isto fornece um mapa à escala 1:01 completo de como o garoto aprendeu, especialmente como ele aprendeu a falar a navegar no mundo da abstração, a linguagem, os dados. Usando um conjunto de dados brutos que excede 200 terabytes (mais de 20 vezes o tamanho da coleção completa impressa da Biblioteca do Congresso em 2000), Roy pode traçar exatamente como seu filho experimentou cada uma das palavras que ele proferiu, eventualmente, e tem provocado algumas idéias fascinantes sobre a aquisição da linguagem.

Roy também tem mostrado que os métodos que ele desenvolveu para armazenar e analisar as lições de uma criança discurso pode ser aplicado de forma mais ampla, e ele começou a fazê-lo. Em particular, ele se voltou seus olhos varrendo computacionais para a esfera social-media, para assistir, digamos, um pronunciamento presidencial e todas as suas repercussões multiplicando, tweets, retweets, as abreviações, as distorções e contestações em tempo real, e ao fazê-lo de desenho um mapa detalhado das grandes redes sociais e como eles evoluem.

A quantidade de dados disponíveis para nós é cada vez mais vasto. Em 2010 nós jogamos, nadaram, revolvia-se, e afogou-se em 1,2 zettabytes das coisas, e em 2011 o volume está previsto para continuar ao longo de sua curva de crescimento exponencial para 1,8 zettabytes. (A zettabyte é um trilhão de gigabytes;. Que é a 1 com 21 zeros à direita por trás dele) O estudo da IDC Universo Digital a partir do qual eu tenho arrancado esses números prestativamente observa que, se você estava inclinado para armazenar todos os dados nos discos rígidos de 32 gigabytes iPads, isso exigiria que os 57,5 ​​bilhões de dispositivos, o suficiente para erguer um muro de 61 metros de altura 4.005 milhas de comprimento, a partir de Miami todo o caminho até Anchorage.

Uma pequena parte desse enorme muro seria esforço casa do Google para criar um censo mais completo possível da palavra publicada desde 1500. A empresa já reuniu dados suficientes alguns 500.000.000.000 palavras de mais de cinco milhões de livros para alegar a emergência de uma nova ciência, culturomics. Eventualmente, a cunhagem, evolução e declínio de cada palavra e frase poderia ser atribuída através dos séculos. Usando o Google é acessívelVisualizador Ngram , já podemos observar a explosão da palavra "sexo" depois de 1960. Ou citações assistir Rembrandt gradualmente crescer, superando as de Cézanne, em 1940, apenas para testemunhar golpe Picasso passado ambos a menos de uma década depois.Estes não são exemplos acadêmicos e inferências painstakingly de alguns livros excelentes, este é o exame rigoroso de como uma palavra ou frase a ortografia eo uso realmente mutante ano a ano.

Nenhum comentário:

Postar um comentário