Tag Archives: Visualização de Dados

Um baita vídeo sobre visualização de dados

Pegando carona na indicação de Marcos Palacios, fica aqui a recomendação para todos aqueles que se interessam por visualização de dados a assistirem o vídeo Journalism in the age of data. É um material super bacana com depoimentos de diversos profissionais, na maioria do mercado norte-americano, abordando diferentes aspectos da visualização de dados, como, por exemplo, uma nova era de infográficos e ferramentas para criação de peças de visualização de dados. Vale muito a pena. A parte ruim, para quem está atrasado no inglês, é que não tem legendas. A propósito, se alguém souber de uma versão legendada, avisa aí!

Obs.: tomei a liberdade, por licença poetica, de usar no título a expressão baita, que, para quem não é do Rio Grande do Sul e não conhece, pode ser entendida como uma interjeição de aprovação 🙂

Anúncios

Infografia e visualização de dados

Em um dos posts anteriores questionei sobre as diferenças entre infografia e visualização de informação (ou de dados, como costumo tratar – veja mais abaixo). No artigo Visualização de dados estruturada por banco de dados digitais sintoniza o Jornalismo com a complexidade informativa contemporânea, assinado por mim e pelo professor Walter Lima, que o apresentará no Intercom (2 a 6 de setembro, em Caxias do Sul), tratamos  desta diferença.

Consideramos que a infografia traz consigo uma narrativa, ou, no caso das infografias disponíveis na internet, várias opções de narrativas a serem seguidas pelos usuários. Por outro lado, a visualização de dados é uma ferramenta para apresentação e exploração dos dados, sem determinar um ou mais caminhos por onde se navegar.

O site Eager Eyes também tratou recentemente deste assunto. E trata da infografia como uma peça feita especificamente para tratar de um tema, que exige um contexto. Já a visualização de dados, de acordo com este artigo, é livre de contexto, é mais geral.

Conceitos, conceitos…
Reconheço que definições são importantes, óbvio. Mas, convenhamos que às vezes a gente perde um tempão procurando mil referências para conseguir identificar com qual concordamos. É ou não é? Bem, duas nomenclaturas que às vezes também confundem são visualização de dados e de informação. Lendo a dissertação de mestrado de Daniel Melo Ribeiro, Visualização de dados na internet, encontrei alguns esclarecimentos que ajudam nesta definição.

Ele recorre aos conceitos de alguns autores, entre eles Shedroff, para definir dado, informação e conhecimento. Este defende que o vasto conteúdo disponível não pode ser considerado como informação, pois são meros dados. A informação se dá quando os dados são organizados de forma lógica, contextualizada. Por fim, nas palavras de Daniel, “o conhecimento é a compreensão obtida pela experiência, e pode ser comunicado pela construção de interações entre indivíduos, sendo, portanto, fundamentalmente participativo”.

A partir destes conceitos, visualização de dados parece mais de acordo com o que venho estudando. É na análise e manipulação de dados apresentados que os usuários podem assimiliar informações.

Infografia ou visualização de informação?

Eu andava confusa em relação às minhas leituras para entender melhor o meu tema e começar a escrever. Lá estava eu direcionando todas as minhas leituras para infografia e infografia em base de dados. Até que o meu orientador, Walter Lima, me chamou a atenção: meu tema é visualização de dados. Eu sabia disso no início, e me parece que eu entendia melhor a diferença, meio que por osmose mesmo. Onde foi que me perdi? Enfim…

Ou seja: estamos falando de apresentar ao usuário formas de se navegar em uma base de dados com grande volume de informações de uma forma clara e amigável. Ele bem que me avisou das poucas leituras em português sobre o tema. E uma das indicações obrigatórias de bibliografia, em inglês, que eu vinha adiando há tempos, tornou-se hoje meu livro de cabeceira. Acompanhado de um dicionário, óbvio. Trata-se de uma tese apresentada em 2008 por Michael Danziger para o Massachusetts Institute of Technology. O título é “Information visualization for the people”.

Minha leitura só começou, mas o autor já diferenciou bem o que é uma coisa e o que é outra. Ele usa o termo information visualization, que seria visualização da informação, mas que eu venho chamando de visualização de dados. Veja as diferenças em uma livre e modesta tradução minha:

Infográficos normalmente mostram as informações em suportes visualmente estáticos, como gráficos, tabelas, diagramas, etc.

Visualização de informação se refere ao uso de sistemas interativos para visualizar informação, focando em representações dinâmicas para exploração de grandes conjuntos de dados.

Pelo que o autor apresenta do trabalho, e pelo próprio título, dá para ver que ele abordará bastante a necessidade de a visualização de dados voltar-se cada vez mais ao “usuário comum”, e não apenas a atender públicos da área científica.

Criatividade solta nos especiais da Copa

Eu não entendo de futebol. Mas sei como este esporte desperta paixão e envolve as pessoas. Convivo com vários apaixonados por futebol. Por isso, nem de longe quero dar a entender que se informar sobre a Copa do Mundo por qualquer um dos materiais abaixo é mais interessante ou emocionante do que acompanhar as partidas. Esclarecida esta questão, veja abaixo exemplos de especiais sobre a Copa do Mundo que se utilizam da visualização de dados de uma forma bem bacana.

Começando pelo espanhol Marca. A imagem abaixo é do calendário dos jogos. Mas vale acessar o site para ver o especial feito para a Copa com muitos conteúdos multimídia shows de bola.

O The New York Times está acompanhando as partidas com análise em tempo real e gráficos cheios de dados. Dá para ver os passes minuto a minuto, as áreas do campo em que a bola mais esteve, a quantidade de toques de cada jogador, entre outros. Deixo a opinião para quem realmente entende de futebol. Mas me parece que o material serve mais para uma análise pós-jogo do que algo para ser acompanhado durante a partida.

Há alguns dias o Estadão está com um infográfico interativo que indica onde jogam os atletas de cada uma das seleções. E não se contenta apenas com os dados desta edição da disputa. É possível comparar com as quatro copas anteriores. Eu, particularmente, não gostei muito da navegabilidade. Mas é riquíssimo em informações e muito bonito visualmente.

O El Mundo está com muitos materiais legais na sua seção multimídia sobre a Copa. No meu entendimento, nenhum deles é infografia em base de dados, mas valem muito a pena.

Conhece mais alguma peça legal sobre a Copa? Avisa aí!

Desperdiçando dados

Não podemos nos maravilhar com as diversas possibilidades tecnológicas que temos hoje e esquecer da nossa habilidade de contar histórias. Esta foi a reflexão que ficou na minha cabeça após ouvir Alberto Cairo no painel “A evolução da narrativa jornalística na Web” no 1º Seminário Internacional de Jornalismo Online, o Sijol. O evento, que também pautou meu post anterior, ocorreu neste sábado, 29 de maio, na Cásper Líbero, em São Paulo. Cairo é editor de multimídia e infografia da Editora Globo.

Um dos exemplos apresentados por Cairo que deu força ao ponto de vista que abre este post foi justamente a primeira peça de visualização de dados com a qual tive contato. Trata-se do gráfico do The New York Times abaixo. Ele apreenta excelentes dados da bilheteria do cinema norte-americano.

 

As marés altas e baixas dos filmes que entraram em cartaz nos EUA podem ser acompanhadas em uma linha do tempo que vai de 1986 a 2008. Clicando nos filmes, abre-se um breve resumo. Entretanto, nem todos têm este recurso disponível. Também dá para fazer buscas pelos nomes dos filmes.

Certamente este gráfico é riquíssimo se for analisada a quantidade de dados que contempla. Oferece ao usuário a possibilidade de consultar informações sobre filmes de diferentes épocas acessando a apenas uma página. Acontece que, como bem colocou Cairo durante o painel no Sijol, é pouco explicativo. No meu ponto de vista, a navegação é complicada, confusa demais. Um desperdício de tecnologia e de dados tão valiosos para uma navegação difícil. Imagino que só segura os internautas que estejam realmente muito interessados no assunto ou que precisem demais de algum dado que está ali.

Sijol debate a visualização de dados

Até o momento meu entendimento sobre visualização de dados é limitado apenas a algumas ferramentas que venho conhecendo, e muitas delas mostrando aqui. Assistir ao primeiro painel do I Seminário Internacional de Jornalismo Online (Sijol), promovido na Cásper Líbero, em São Paulo, me deu outra dimensão sobre o assunto. O evento foi transmitido ao vivo pelo Portal Terra, com excelente qualidade, diga-se de passagem.

O painel “A notícia a partir de bases de dados que permitem ao leitor interagir com grandes volumes de informação” começou com apresentação de Andrei Scheinkman, programador de aplicativos jornalísticos do New York Times. Ele mostrou alguns exemplos de produtos que o site do jornal oferece.

Pedro Valente, jornalista e programador, responsável pelo Yahoo Open Hack Day, mostrou que se os dados não são fáceis de serem acessados nos sites das organizações responsáveis por eles, ou se esta visualização não é prazerosa, hackers podem ajudar desenvolvendo peças que mudam esta percepção. E que, no momento em que os dados apresentados são de interesse público, isso tem tudo a ver com jornalismo. Independentemente de ser um jornalista quem faz isso. Você pode baixar a apresentação dele aqui.

Da apresentação de Rubens Almeida, diretor de integração e especialista em bases de dados e georeferenciamento do iG, destaque para o fato de o Brasil não ter tradição em desenvolver bases de dados. Ponto de vista reforçado pela mediadora deste painel, Tereza Rangel, diretora de planejamento do UOL, durante o tempo dedicado a perguntas da plateia. As organizações no Brasil não oferecem tantos dados quanto poderiam, além de não apresentá-los de forma interessante e de fácil acesso. Para Almeida, o grande desafio é fazer intefaces que tornem a consulta a dados prazerosa.

A última apresentação deste painel ficou por conta do meu orientador de TCC, o professor Walter Lima, da Cásper Líbero, um dos organizadores do evento, inclusive. Ele falou sobre relevância. Para ele, a relevância está sendo vista de outra forma com a utilização da internet porque a topologia de rede é altamente descentralizada, com baixa hierarquia. Para muitas pessoas, a relevência é determinada pelo Google. Assim como o Google, outros sistemas dizem para aos usuários o que é importante ou mais relevante. Muitos creem que se algo não está nos primeiros resultados de uma busca, não é importante.

O Sijol foi organizado pelo Centro Knight para o Jornalismo nas Américas da Universidade do Texas em Austin (EUA), Grupo de Pesquisa Tecnologia, Comunicação e Cultura de Rede  do Programa de Pós-graduação da Faculdade Cásper Líbero e pela ONA-Brasil.

Rosental, do Centro Knight, avisa que verá com a Cásper Líbero a possibilidade de disponibilizar o arquivo com todo o evento para acesso posterior, o que seria ótimo!

Visualização de dados no Google

Um site de buscas tão popular quanto o Google não poderia mesmo ficar sem uma ferramenta que aprimora a visualização de dados. Ainda mais tendo em vista que é um riquíssimo repositório de informações. Em março deste ano foi anunciada em seu blog a criação do Google Public Data Explorer, um projeto do Google Labs. Portanto, ainda em fase experimental.

Entre os parceiros para a disponibilização de informações está o Banco Mundial, mas há também outras organizações. Diferente de algumas ferramentas já citadas aqui no Notícias Visuais, esta não permite que o usuário gere visualizações com dados próprios, apenas que consulte gráficos de determinados temas.

A apresentação visual não é das mais inovadoras. Os dados podem ser acessados nos tradicionais modelos de gráficos com linhas ou colunas ou então com a utilização de mapas e círculos. Estas duas últimas possibilidades são também bastante usuais nas ferramentas que tenho conhecido.

Um recurso bem interessante é você poder ver a evolução do dado que está analisando como se fosse um vídeo, podendo parar a qualquer momento para observar com mais calma as informações de um determinado ano.

Mapa das medalhas olímpicas

Exemplo velhinho este, mas vale mostrar. É do The New York Times. Mapa das medalhas olímpicas desde a olimpíada de 1896, considerada a primeira da Era Moderna, até a de 2008. Países com mais medalhas representados em círculos maiores. É possível visualizar pela distribuição geográfica dos países ou pelo ranking.

Bundle e o dinheiro descomplicado

Descobri o Bundle em um post do Flowing Data. Com o mote de tratar de dinheiro de uma forma descomplicada, o site é focado em visualizações relacionadas a finanças pessoais. Um dos serviços é o Everybody’s Money.  

Como funciona?   

O usuário quer saber se está gastando ou economizando em média a mesma quantia que uma pessoa com seu perfil. Ou seja: mesma faixa etária, composição familiar semelhante (casal sem filhos, por exemplo), mesma renda e localidade (acho que os dados são só dos EUA). O resultado apresenta os segmentos “compras/casa/saúde e família/comida e bebida/viagem e lazer/deslocamento” desta forma:  

Também é possível comparar um perfil com outro, ou o mesmo perfil em diferentes localidades, para se ter ideia de onde se gasta mais com cada coisa. Este vídeo também explica como funciona.  

Outra ferramenta bacana é o Spending Quiz, um questionário para definir seu perfil em relação a dinheiro. E os dados estão por toda parte. Se em uma resposta você indica que investe em viagens para locais distantes, quando a tela passa para a questão seguinte é apresentado um dado sobre quantidade de pessoas que viajam ao exterior. Os resultados do Everybody’s Money podem ser compartilhados pelo Facebook e Twitter e os do Spending Quiz apenas pelo Facebook. 

Também tem muitos outros conteúdos interessantes e vários gráficos com análises sobre os resultados. Vale muito a pena.

Mapa interativo para “ver” os índices de homicídios

O exemplo de visualização de dados deste post é brasileiro. Faço buscas em sites jornalísticos de fora para tentar descobrir formas diferentes de visualização das notícias. Mas sempre gosto de ter exemplos que sejam o mais próximo possível da minha realidade. Gostaria de achar um bom caso tupiniquim para servir de análise no meu TCC, inclusive. Ainda não encontrei…

Buenas, o “Mapa da violência no Brasil 2010 – Anatomia dos homicídios no Brasil” é uma publicação do Instituto Sangari que faz um mapeamento dos homicídios no País. Aqui é possível fazer download da versão completa da publicação. Encontrei este estudo através do site do Estadão, que colocou no ar em março o mapa interativo que abre este post, e que deixa a consulta a estes dados bem mais interessante. Vasculhei o site do Instituto Sangari para conferir se a produção não era deles também. Como não encontrei no site, deduzo que seja criação do Estadão mesmo.

O mapa colorido se refere apenas à quantidade de homicídios em jovens entre 15 e 24 anos, faixa etária em que os números são maiores. O estudo fez o mesmo levantamento de outras idades também. Observe como o mapa muda de acordo com as cores selecionadas na lista ao lado dele. Também é possível pesquisar pelo nome das cidades e conferir a taxa de homicídios entre mais idades apuradas pelo estudo.