O curso “Análise Quantitativa de Textos com R” abordará conceitos como: o que é análise quantitativa de textos; como estruturar textos capturados de pdfs, html simples e word em uma base de dados; como realizar o pré-processamento destes dados (por exemplo: remoção de caracteres que não são relevantes para a análise, remoção de “stop words”, utilização de expressões regulares para identificar palavras relevantes, entre outros); como realizar contagens de palavras ou n-grams mais frequentes; como visualizar estas contagens (como uma nuvem de palavras ou gráficos de barras); e por fim será abordado de forma introdutória a modelagem de tópicos, um método não supervisionado para criar grupos de documentos (similar ao cluster utilizado com dados numéricos). Serão apresentados também alguns exemplos destes tipos de análises. Todas as ferramentas utilizadas são gratuitas: utilizaremos a linguagem de programação R, o RStudio, e os pacotes stringr, ggplot2, dplyr, tidytext, entre outros. O curso tem como público-alvo pessoas que tenham conhecimento intermediário em R e tenham interesse em analisar textos com métodos quantitativos utilizando R.
27 de novembro a 1 de dezembro
Segunda, Quarta e Sexta: das 19h às 22h
Professor responsável: Beatriz Milz
Beatriz Milz é doutoranda em Ciência Ambiental (PROCAM/IEE/USP) na Universidade de São Paulo. Co-organizadora da R-Ladies São Paulo, uma comunidade que tem como objetivo promover a diversidade de gênero na comunidade da linguagem R. Instrutora de tidyverse certificada pela RStudio.
Avaliações
Não há avaliações ainda.