dataviz

Curso de análise e visualização de dados

Funções Básicas

Proposta do Curso

A disciplina se propõe a introduzir fundamentos básicos da análise e da visualização de dados. O curso pretende munir os alunos de conhecimento prático e laboratorial acerca da análise exploratória de dados. Os alunos aprenderão a ler e criar diferentes tipos de gráficos, a produzir análises sobre estatísticas descritivas, análises textuais lexicométricas, análises georreferenciadas e análises de redes sociais. Além disso, eles receberão treinamento para a coleta de dados de diferentes repositórios públicos, bem como para limpar e organizar bancos de dados (data wrangling).

Com caráter de oficina, o curso utilizará variados softwares e aplicativos para suas operações, e poderá fornecer ainda capacitação básica e instrumental em linguagem R e na gramática de gráficos de seu principal pacote de visualização de dados, ggplot2. Os conhecimentos adquiridos poderão instrumentalizar futuros profissionais analistas de dados, cientistas de dados e business intelligence (BI).

Requisitos e Funcionamento

O curso tem caráter de oficina. Serão ministradas três aulas síncronas com 4h de duração cada. Os alunos receberão material de apoio, documentação e scripts com os principais comandos executados a cada aula. É necessário ter um computador (desktop ou laptop) com acesso à internet para o curso. Solicita-se a instalação prévia dos seguintes softwares, todos opensource:

Instale sempre primeiro o software R e depois o R Studio. Usuários de Mac Os devem instalar também o X Quartz https://www.xquartz.org/. Durante o curso, outros pacotes e plugins serão instalados, conforme orientação do(a) professor(a) responsável.

Principais Pacotes R

dplyr · # O dplyr é um dos pacotes do Tidyverse e é voltado especificamente para o trabalho de manipulação de dados. O dplyr se estrutura em torno de um conjunto de verbos, que operam como funções para a manipulação de grandes bancos de dados. Para mais detalhes, acesse: https://dplyr.tidyverse.org/

tidyr · # O tidyr é um dos pacotes do Tidyverse e é voltado especificamente para a arrumação de bancos de dados. Para mais detalhes, acesse: https://tidyr.tidyverse.org/

stringr · # O stringr é um dos pacotes do Tidyverse e é voltado para a manipulação de strings textuais. Para mais detalhes, acesse: https://stringr.tidyverse.org/

ggplot2 · # O ggplot2 é um sistema para criação de gráficos, baseado em uma grámática própria e em camadas estéticas. Para mais detalhes, acesse: https://ggplot2.tidyverse.org/

Referências Adicionais

  • Aquino, J. A. (2014). R para Cientistas Sociais.

  • Bruce, P., & Bruce, A. (2019). Estatística Prática para Cientistas de Dados.

  • Cairo, A. (2016). Truthful Art Data: Charts, and Maps for Communication.

  • Cervi, E. (2019). Manual de Métodos Quantitativos para Iniciantes em Ciência Política, vol. 1.

  • Cervi, E. (2019). Manual de Métodos Quantitativos para Iniciantes em Ciência Política, vol. 2.

  • Cherven, K. (2015). Mastering Gephi Network Visualization.

  • Cleveland, W. S. (1985). The Elements of Graphing Data.

  • D’Ignazio, C. (2020). Data Feminism.

  • Figueiredo Filho, D. (2019). Métodos Quantitativos em Ciência Política.

  • Knaflic, C. N. (2019). Storytelling com Dados: um Guia sobre Visualização de Dados para Profissionais de Negócios.

  • Krause, A., Rennie, N., & Tarran, B. (2023). Best Practices for Data Visualisation Insights.

  • Oliveira, P. F., Guerra, S., & McDonnell, R. (2018). Ciência de Dados com R: Introdução.

  • Salviati, M. E. (2017). Manual do Aplicativo Iramuteq.

  • Spiegelhalter, D. (2022). A arte da estatística: Como Aprender a Partir de Dados.

  • Wickham, H. (2019). R para Ciência de Dados: importe, arrume, transforme, visualize e modele dados.

  • Wickham, H. (2010). ggplot2: Elegant Graphics for Data Analysis.

  • Wurman, R. S. (1999). Ansiedade De Informação: Como Transformar Informação em Compreensão.