Proposta do Curso
A disciplina se propõe a introduzir fundamentos básicos da análise e da visualização de dados. O curso pretende munir os alunos de conhecimento prático e laboratorial acerca da análise exploratória de dados. Os alunos aprenderão a ler e criar diferentes tipos de gráficos, a produzir análises sobre estatísticas descritivas, análises textuais lexicométricas, análises georreferenciadas e análises de redes sociais. Além disso, eles receberão treinamento para a coleta de dados de diferentes repositórios públicos, bem como para limpar e organizar bancos de dados (data wrangling).
Com caráter de oficina, o curso utilizará variados softwares e aplicativos para suas operações, e poderá fornecer ainda capacitação básica e instrumental em linguagem R e na gramática de gráficos de seu principal pacote de visualização de dados, ggplot2. Os conhecimentos adquiridos poderão instrumentalizar futuros profissionais analistas de dados, cientistas de dados e business intelligence (BI).
Requisitos e Funcionamento
O curso tem caráter de oficina. Serão ministradas três aulas síncronas com 4h de duração cada. Os alunos receberão material de apoio, documentação e scripts com os principais comandos executados a cada aula. É necessário ter um computador (desktop ou laptop) com acesso à internet para o curso. Solicita-se a instalação prévia dos seguintes softwares, todos opensource:
- R https://cran-r.c3sl.ufpr.br/ (versões para Linux, Mac OS e Windows disponíveis)
- R Studio https://www.rstudio.com/products/rstudio/download/#download (versões para Linux, Mac OS e Windows disponíveis)
Instale sempre primeiro o software R e depois o R Studio. Usuários de Mac Os devem instalar também o X Quartz https://www.xquartz.org/. Durante o curso, outros pacotes e plugins serão instalados, conforme orientação do(a) professor(a) responsável.
-
Gephi https://gephi.org/ (versões para Linux, Mac OS e Windows disponíveis)
-
IramuteQ http://www.iramuteq.org/ (versões para Linux, Mac OS e Windows disponíveis)
Principais Pacotes R
dplyr · # O dplyr é um dos pacotes do Tidyverse e é voltado especificamente para o trabalho de manipulação de dados. O dplyr se estrutura em torno de um conjunto de verbos, que operam como funções para a manipulação de grandes bancos de dados. Para mais detalhes, acesse: https://dplyr.tidyverse.org/
tidyr · # O tidyr é um dos pacotes do Tidyverse e é voltado especificamente para a arrumação de bancos de dados. Para mais detalhes, acesse: https://tidyr.tidyverse.org/
stringr · # O stringr é um dos pacotes do Tidyverse e é voltado para a manipulação de strings textuais. Para mais detalhes, acesse: https://stringr.tidyverse.org/
ggplot2 · # O ggplot2 é um sistema para criação de gráficos, baseado em uma grámática própria e em camadas estéticas. Para mais detalhes, acesse: https://ggplot2.tidyverse.org/
Referências Adicionais
-
Aquino, J. A. (2014). R para Cientistas Sociais.
-
Bruce, P., & Bruce, A. (2019). Estatística Prática para Cientistas de Dados.
-
Cairo, A. (2016). Truthful Art Data: Charts, and Maps for Communication.
-
Cervi, E. (2019). Manual de Métodos Quantitativos para Iniciantes em Ciência Política, vol. 1.
-
Cervi, E. (2019). Manual de Métodos Quantitativos para Iniciantes em Ciência Política, vol. 2.
-
Cherven, K. (2015). Mastering Gephi Network Visualization.
-
Cleveland, W. S. (1985). The Elements of Graphing Data.
-
D’Ignazio, C. (2020). Data Feminism.
-
Figueiredo Filho, D. (2019). Métodos Quantitativos em Ciência Política.
-
Knaflic, C. N. (2019). Storytelling com Dados: um Guia sobre Visualização de Dados para Profissionais de Negócios.
-
Krause, A., Rennie, N., & Tarran, B. (2023). Best Practices for Data Visualisation Insights.
-
Oliveira, P. F., Guerra, S., & McDonnell, R. (2018). Ciência de Dados com R: Introdução.
-
Salviati, M. E. (2017). Manual do Aplicativo Iramuteq.
-
Spiegelhalter, D. (2022). A arte da estatística: Como Aprender a Partir de Dados.
-
Wickham, H. (2019). R para Ciência de Dados: importe, arrume, transforme, visualize e modele dados.
-
Wickham, H. (2010). ggplot2: Elegant Graphics for Data Analysis.
-
Wurman, R. S. (1999). Ansiedade De Informação: Como Transformar Informação em Compreensão.