Curso introdutório à análise quantitativa de texto com R, voltado à organização, sistematização e exploração de dados textuais para pesquisa. Serão abordados procedimentos para importação e estruturação de textos provenientes de diferentes formatos, organizando-os em bases de dados adequadas para análise. O curso contemplará etapas de tokenização, limpeza textual e contagem de palavras e n-grams (sequências de n palavras consecutivas) mais frequentes, bem como a visualização dessas frequências por meio de gráficos e nuvens de palavras. Será oferecido também um primeiro contato com modelagem de tópicos (topic modeling), método não supervisionado para identificar padrões e agrupar documentos. Recomenda-se conhecimento intermediário prévio da linguagem R ou preparação por meio de materiais de estudo de acesso aberto.
23 a 26 de novembro
Segunda, terça e quinta-feira: das 19h às 22h
Professora responsável: Ana Carolina Andrada
Ana Carolina Andrada é socióloga, pesquisadora nas áreas de políticas públicas, mercado de trabalho, cuidado e educação. Graduada em Ciências Sociais pela Universidade de São Paulo (USP) e em Jornalismo pela Faculdade Cásper Líbero, é mestre (2013) e doutora (2022) em Sociologia pela USP. Atualmente é pesquisadora associada ao Centro Brasileiro de Análise e Planejamento (Cebrap) e à Rede Cuidado, Direitos e Desigualdades (Rede CuiDDe).





Reviews
There are no reviews yet.