FDIG

FDIG - Ferramentas Digitais para uma Ciência Aberta e com grandes quantidades de dados

 

Repositório do gitHub com o curso: https://alecamar.github.io/FDIG/

Professor responsável: Alexandre Camargo Martensen

#Devido a pandemia cronograma foi alterado e será fornecida no segundo semestre letivo de 2021. 

 

Breve descrição da disciplina

Estamos vivenciando uma mudança de paradigma na ciência, onde a ciência passa a ser cada vez mais baseada na colaboração entre cientistas organizados em redes, largamente alicerçada em grandes bancos de dados (“big data”) obtidos via de regra através de sensores remotos automatizados, que irão demandar ferramentas inovadoras de filtragem, organização, armazenamento e análise dos dados. Além disso, a ciência apresentará uma maior proporção de perguntas guiadas pelos dados (“data driven”) e uma menor parcela guiada por hipóteses, utilizará inteligência artificial, demandará conhecimento de linguagem de programação e de ferramentas digitais ainda não apresentadas aos nossos alunos. 

De forma a suprir essa carência, esta disciplina busca apresentar para os nossos alunos alguns destes novos paradigmas, municiando-os também com parte das ferramentas necessárias para a execução de tarefas dentro desta nova perspectiva. Especialmente irei abordar questões relacionadas com a obtenção e organização de grandes bancos de dados, análise de grandes conjuntos de dados através de scripts, colaboração científica através do compartilhamento de dados, códigos de análises e programas, organização de projetos, escrita colaborativa, controle de versões de códigos e textos. Além disso, abordarei questões relacionadas à ciência aberta e revisão de artigos abertos, a questão de licenças e as discussões sobre os potenciais avanços das publicações científicas.

 

Objetivos Gerais: Ao final da disciplina o aluno terá sido exposto à práticas e ferramentas para a condução de ciência com grandes quantidades de dados (“big data”), baseada em análises com “scripts” e programação, colaborativa, com controle de versões, aberta e reprodutível. 

 

Proposta de Ementa: A ciência aberta, “Open Lab Notebooks (OLN)”, “pré-prints”, disponibilização dos dados, códigos, erros e acertos ao longo do processo de descoberta científica, publicação aberta; Obtenção de dados através de sensores remotos, armazenamento, manuseio, organização e recuperação de dados; A linguagem de programação R; desenvolvimento de scripts para organização, análise e geração de figuras e gráficos; boas práticas na computação científica; ferramentas digitais para fomentar a colaboração entre cientistas; formas de organização de projetos científicos; controle de versões - git e gitHub; “double blind” e “open peer review”; categorias de softwares livres e diferentes tipos de licenças; mídias sociais para divulgação de trabalhos, colaboração online, discussões científicas, perguntas e respostas na internet (por ex. StackOverflow, R-sig-geo, R-igraph, entre outros); presença online; perspectivas para a divulgação e comunicação científica nos próximos anos, entre outros temas relacionados.