Disciplinas
Título |
Programação para Ciência de Dados |
Carga horária |
26 h |
Objetivos |
Esse módulo objetiva capacitar no aluno o uso de lógica de programação e o ensinar o uso das linguagens Python e R aplicadas à ciência de dados. Os tópicos abordam desde tipos de variáveis, estruturas de programação até a utilização de bibliotecas que permitam a manipulação e análise de diferentes tipos de dados. |
Ementa |
|
Título |
Estatística Descritiva e Visualização de Dados |
Carga horária |
16h |
Objetivos |
Apresentar aos alunos técnicas estatísticas para análise de dados reais. Abordar os principais métodos para descrição, exploração, análise e interpretação de dados uni e multivariados. Introduzir o uso de pacotes estatísticos e discutir o uso das técnicas. |
Ementa |
|
Título |
Bancos de Dados |
Carga horária |
24 hrs |
Objetivos |
O objetivo da disciplina é tratar de assuntos relacionados à modelagem de dados, armazenamento e recuperação de dados, além do uso de Sistemas Gerenciadores de Banco de Dados Relacionais (SGBDRs). Para tanto, serão apresentados conceitos de bancos de dados, que abrangem os níveis conceitual, lógico e físico, sobre modelo Entidade-Relacionamento Estendido, Modelo Relacional, mapeamento entre modelos conceitual e lógico, linguagem de consulta SQL, organização física de dados (páginas de disco, arquivos, campos e registros) e estruturas de indexação (árvore-B e variantes, hashing e bitmap). Nesse sentido, serão apresentadas as ferramentas necessárias para o projeto e implementação de bancos de dados em SGBDRs. |
Ementa |
|
Título |
Probabilidade |
Carga horária |
24h |
Objetivos |
Apresentar as regras básicas do cálculo de probabilidades, os conceitos de valor esperado, variáveis aleatórias (discreta e contínua) e suas extensões multivariadas. |
Ementa |
|
Título |
Introdução a Modelos de Regressão |
Carga horária |
32h |
Objetivos |
Apresentar aos alunos técnicas de modelagem estatística, diagnósticos e critérios de escolha de modelos. Uso de pacotes estatísticos |
Ementa |
|
Título |
Pré-processamento de Dados Estruturados |
Carga horária |
8h |
Objetivos |
Introduzir aos alunos a importância do pré-processamento de dados para obtenção de resultados mais confiáveis. Neste módulo, serão apresentados possíveis problemas a se tratar nesta fase do processo, bem como técnicas para lidar com cada um desses problemas. |
Ementa |
|
Título |
Estatística computacional |
Carga horária |
16h |
Objetivos |
Este módulo visa discutir conceitos de aleatoriedade e pseudo-aleatoriedade em algoritmos, ilustrando conceitos de inferência através de simulação estocástica. Além disso, serão apresentados os principais métodos computacionais para solução de problemas em Estatística. |
Ementa |
|
Título |
Introdução a Modelos de Classificação |
Carga horária |
24h |
Objetivos |
Este módulo visa apresentar conceitos básicos e algoritmos de aprendizado de máquina para a tarefa de classificação, desenvolvendo no aluno a competência para saber identificar quais algoritmos de classificação e quais ferramentas podem ser adequados a cada problema. Além disso, visa também capacitar o aluno a realizar a análise de resultados desses algoritmos, bem como combinar modelos para melhores resultados. |
Ementa |
|
Título |
Análise de Agrupamento de Dados |
Carga horária |
24h |
Objetivos |
Apresentar ao aluno os principais conceitos que envolvem o agrupamento de dados e capacitá-los a aplicar suas técnicas, bem como ajuste fino de seus parâmetros. Apresentar as principais técnicas de agrupamento de dados, desde as clássicas até o estado-da-arte e apresentar aplicações reais que envolvam conjuntos de dados públicos de diferentes origens (acadêmicos, do governo e mercado). |
Ementa |
|
Título |
Bancos de Dados Não-Relacionais |
Carga horária |
16 h |
Objetivos |
Apresentar aos alunos SGBDs Não-Relacionais, seus princípios, modelagem, criação e uso de SGBDs não-Relacionais. Fornecer aos alunos conhecimento para determinar qual abordagem (relacional ou não-relacional) é mais adequada para um tipo de aplicação. |
Ementa |
|
Título |
Processamento de Linguagem Natural |
Carga horária |
18 hrs |
Objetivos |
Capacitar o aluno a manipular textos para transformá-los em informação. Ao final deste módulo o aluno estará apto a converter o texto em informação útil para os algoritmos de aprendizado de máquina utilizando, para isso, ferramentas, bibliotecas e recursos linguístico-computacionais disponíveis. |
Ementa |
|
Título |
Redes Neurais Artificiais |
Carga horária |
16h |
Objetivos |
Apresentar fundamentação sobre os principais modelos de Redes Neurais Artificiais existentes na literatura, e suas formalizações matemáticas, bem como seus respectivos modelos de aprendizado. Além disso, apresentar implementações práticas dos modelos estudados. |
Ementa |
|
Título |
Deep Learning |
Carga horária |
24h |
Objetivos |
Apresentar os principais fundamentos de redes neurais profundas, e como construir tais redes neurais, formalizações matemáticas e modelos de aprendizado. Serão apresentadas implementações práticas dos modelos estudados. |
Ementa |
|
Título |
Processamento Digital de Imagens e Visão Computacional |
Carga horária |
18 h |
Objetivos |
Habilitar o aluno a aplicar técnicas de filtragem para a redução de ruído de imagens e melhoramento de sua qualidade; Capacitar o aluno a realizar o pré-processamento de imagens para a subsequente aplicação de técnicas de aprendizado de máquina; Habilitar o aluno a identificar as técnicas mais adequadas a serem aplicadas dependendo do tipo de imagem a ser processada. |
Ementa |
Introdução: visão geral das etapas de um sistema de processamento de imagens; Apresentação de técnicas de obtenção e modificação de histogramas; Detalhamento sobre filtragem espacial de imagens (filtros lineares e não-lineares); Visão geral sobre filtragem de imagens no domínio da frequência; Introdução à classificação de imagens. |
Título |
Análise de Séries Temporais |
Carga horária |
24 h |
Objetivos |
Apresentar o conceito de série temporal e suas principais aplicações, especialmente a construção de modelos preditivos. Indicar as bibliotecas especificas do R e Python para estimar os modelos estudados. |
Ementa |
|
Título |
Projeto de Experimentos em Aprendizado de Máquina |
Carga horária |
24h |
Objetivos |
Apresentar ao aluno conceitos relacionados à pesquisa científica e capacitá-lo a: (i) identificar problemas nos quais a ciência de dados pode ser aplicada, (ii) projetar soluções para um ou mais problemas de ciência de dados, (iii) desenvolver experimentos para testar as soluções e (iv) reportar os resultados na monografia de Trabalho de Conclusão de Curso. |
Ementa |
|
Título |
Aprendizado de Máquina sobre Grandes Volumes de Dados |
Carga horária |
26 h |
Objetivos |
O objetivo da disciplina capacitar o aluno a manipular e analisar grandes volumes de dados de forma escalável. Para isso, serão abordados conceitos de técnicas de computação distribuída utilizando arcabouços para manipulação e análise de dados. Capacitar o aluno a aplicar técnicas de aprendizado máquina sobre grandes volumes de dados dados utilizando programação funcional (Python e Scala). Para isso, serão estudados frameworks bem conceituados no mercado, como Hadoop e Spark. |
Ementa |
|