O curso “Análise Quantitativa de Textos com R” abordará conceitos como: o que é análise quantitativa de textos; como estruturar textos capturados de pdfs, html simples e word em uma base de dados; como realizar o pré-processamento destes dados (por exemplo: remoção de caracteres que não são relevantes para a análise, remoção de “stop words”, utilização de expressões regulares para identificar palavras relevantes, entre outros); como realizar contagens de palavras ou n-grams mais frequentes; como visualizar estas contagens (como uma nuvem de palavras ou gráficos de barras); e por fim será abordado de forma introdutória a modelagem de tópicos, um método não supervisionado para criar grupos de documentos (similar ao cluster utilizado com dados numéricos). Serão apresentados também alguns exemplos destes tipos de análises. Todas as ferramentas utilizadas são gratuitas: utilizaremos a linguagem de programação R, o RStudio, e os pacotes stringr, ggplot2, dplyr, tidytext, entre outros. O curso tem como público-alvo pessoas que tenham conhecimento intermediário em R e tenham interesse em analisar textos com métodos quantitativos utilizando R.
10 a 13 de novembro
Segunda, terça e quinta-feira: das 19h às 22h
Professora responsável: Beatriz Milz
Em estágio pós-doutoral na Universidade Federal do ABC, vinculada ao Laboratório de Planejamento Territorial (Laplan). Possui doutorado em Ciência Ambiental (PROCAM/IEE/USP) pela Universidade de São Paulo, mestre em ciências pela Universidade Federal de São Paulo (UNIFESP), e bacharelado em Gestão Ambiental pela Universidade de São Paulo (USP). Co-organizadora da R-Ladies São Paulo, uma comunidade que tem como objetivo promover a diversidade de gênero na comunidade da linguagem R. Instrutora de tidyverse certificada pela RStudio (atual Posit). Tem experiência em ensino de programação em R desde 2022, com experiência ensinando no cebrap.lab, no Programa de Verão do Instituto de Matemática e Estatística da Universidade de São Paulo (IME/USP), e em cursos privados.
Avaliações
Não há avaliações ainda.