DISCIPLINA DE INVERNO Introdução à Ciência de Dados (ENSP.80.131.1)

DETALHES

Disciplina de natureza Teórica de nível Doutorado, com carga horária de 60 horas e 2 créditos.

Número de vagas:
25
Período:
31/07/2023 a 04/08/2023
Pré-requisitos:
Sem pré-requisito.
Área(s) de Concentração:
Métodos Quantitativos em Epidemiologia , Epidemiologia Geral , Epidemiologia, Etnicidade e Saúde , Epidemiologia das Doenças Transmissíveis

HORÁRIO

Dia Início Fim
Todos os dias 9h 17h

PROFESSORES

Nome
Leonardo Soares Bastos
Oswaldo Gonçalves Cruz

EMENTA

"A ciência de dados é uma área multidisciplinar que combina habilidades de diferentes áreas de conhecimento, como programação, matemática e estatística para extrair conhecimento de grandes bases dados para a tomada de decisão. O cientista de dados é um dos profissionais mais requisitados do mercado de trabalho nos dias atuais. Objetivos: o objetivo deste curso é introduzir o aluno ao arcabouço conceitual e exemplos e algumas técnicas utilizadas na área de ciência de dados para que possam aplicar as novas técnicas e ferramentas estudadas em problemas reais, utilizando para isso a linguagem de programação R e suas respectivas bibliotecas mais comumente utilizadas para este tipo de análise. Serão abordados os seguintes tópicos: leitura, pré-processamento e manipulação de conjuntos de dados, transformação e harmonização de dados, mineração de dados, aprendizado estatístico supervisionado e construção de modelo de classificação com árvores de decisão. Requisitos: Não é necessário conhecimento prévio em R, mas é desejável que o aluno tenha noções de lógica de programação. Se o aluno tiver acesso a computador com internet, também poderá replicar os exemplos. Dinâmica: a dinâmica se baseia em aulas expositivas, leitura de textos selecionados e prática guiada utilizando o R. Avaliação: apresentação de uma proposta de aplicação de um dos conteúdos aprendidos em problemas reais."

Categoria: Eletiva - Curso de Inverno.

Pré-requisito: Não há.
Informações sobre as aulas: Serão 5 encontros presenciais.

Candidatos externos: Serão aceitos Alunos dos Programas de Strictu Sensu da ENSP, Alunos de outros Programas de Strictu Sensu da FIOCRUZ, Alunos de outros Programas de Strictu Sensu.

Vagas: Mínimo 05 e máximo 25.

A disciplina ofertará 01 vaga para Estágio em Docência e o pré-requisito é ser Ser aluno de doutorado, Conhecimento de R. .

Docente convidada: Luciana Correia Alves

BIBLIOGRAFIA

"BURGER, S.V. Introduction to Machine Learning with R: Rigorous Mathematical Analysis. Beijing: O'Reilly, 2018.

IZBICKI, R. E.; SANTOS, T. M. DOS. Aprendizado de máquina: uma abordagem estatística. 1ᵃ edição. 2020. 272 páginas. ISBN: 978-65-00-02410-4.

JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An Introduction to Statistical Learning with Applications in R. New York, NY: Springer, 2021.

KUHN, M.; JOHNSON, K. Applied predictive modeling. New York, NY: Springer, 2013.

KUHN, M. Building predictive models in R using caret package. Journal of Statistical Software, v. 28, n. 5, p. 1-26, 2008."