Melhores livros e recursos sobre ciência de dados biomédicos e da saúde
O que é ciência de dados biomédicos?
A ciência de dados biomédicos abrange uma variedade de desafios de pesquisa biológica e médica que usam muitos dados e se concentram na criação de novas metodologias para o avanço da descoberta da ciência biomédica. - Annual Review of Biomedical Data Science
Aqui está uma lista de alguns recursos que encontrei ao pesquisar e estudar o campo da ciência e análise de dados biomédicos. Infelizmente, muitos livros e cursos listados aqui são pagos, mas tentei o meu melhor para listar alguns recursos gratuitos e de código aberto também. Vamos a eles!
Lista de Conteúdos
Aviso de não afiliação e isenção de responsabilidade
Estatística e matemática
Um bom entendimento de estatística e matemática é fundamental para qualquer análise de ciência de dados ou aprendizado de máquina. Os conceitos mais básicos e principais incluem distribuições de probabilidade, significância estatística, teste de hipóteses e regressão. Aqui estão alguns recursos dedicados a ensinar tudo isso (e muito mais) com exemplos das ciências biomédicas.
Modern Statistics for Modern Biology
Susan Holmes, Wolfgang Huber
Livro 📘 | Código: | Gratuito: ✅ | Link ↗️
O objetivo deste livro é permitir que os cientistas que trabalham em pesquisa biológica aprendam rapidamente muitas das ideias e métodos importantes de que precisam para tirar o melhor proveito de seus experimentos e de outros dados disponíveis. O livro tem uma abordagem prática.
Este livro não é pesado em matemática, ele vai direto aos conceitos básicos e tem muitos exemplos de código R e exercícios! Ele vai desde o básico de distribuição de dados e teste de hipóteses até tópicos mais avançados, como análise multivariada e aprendizado supervisionado.
Statistics for Biomedical Engineers and Scientists
Andrew King, Robert Eckersley
Livro 📘 | Código: MATLAB | Gratuito: ❌ | Link ↗️
Os leitores aprenderão como compreender os conceitos fundamentais da estatística descritiva e inferencial, analisar dados e escolher um teste de hipótese apropriado para responder a uma determinada pergunta, calcular medidas estatísticas numéricas e realizar testes de hipótese “manualmente” e visualizar dados e realizar análises estatísticas usando o MATLAB.
Isso é exatamente o que você esperaria de um livro de nível de graduação sobre probabilidade e estatística. Não é pesado em matemática e tem muitos exercícios.
Applied Mathematics for the Analysis of Biomedical Data: Models, Methods, and MATLAB
Peter J. Costa
Livro 📘 | Código: MATLAB | Gratuito: ❌ | Link ↗️
Apresenta uma abordagem prática para a análise de dados biomédicos por meio de métodos matemáticos e fornece uma toolbox do MATLAB® para a coleta, visualização e avaliação de dados experimentais e da vida real.
Este é mais pesado em matemática e presume que você esteja familiarizado com equações diferenciais elementares, álgebra linear e estatística.
Data-Handling in Biomedical Science
Peter White
Livro 📘 | Código: ❌ | Gratuito: ❌ | Link ↗️
Repleto de exemplos e problemas trabalhados, este livro ajudará o leitor a melhorar sua confiança e habilidade no manuseio de dados.
Este é um pouco diferente dos anteriores, mas vale a pena listar. O livro não tem exemplos de código e não se trata de métodos computacionais de manipulação e análise de dados. Ele ensina matemática básica e estatística necessária para experimentos de bioquímica e microbiologia.
Engenharia de dados
Tão importante quanto analisar dados, também é preciso saber como projetar e manter pipelines de dados. Os dados biomédicos podem ser confusos, heterogêneos e grandes, mas felizmente esses autores estão aqui para nos ajudar!
Data Warehousing for Biomedical Informatics
Richard E. Biehl
Livro 📘 | Código: SQL | Gratuito: ❌ | Link ↗️
Um guia passo a passo de como fazer para projetar e construir um data warehouse para toda a empresa em uma instituição biomédica ou de saúde, usando um ciclo de vida de quatro iterações e um padrão de design.
Este livro é uma joia. Conteúdo clássico sobre data warehousing e ETL, mas realmente focado em dados biomédicos e de saúde. Muitos trechos de código SQL!
Big Biomedical Data Engineering
Ripon Patgiri, Sabuzima Nayak
Livro chapter 📄 | Código: ❌ | Gratuito: ✅ | Link ↗️
Este capítulo explora o papel do Big Data na engenharia de dados biomédica e seu dilema de armazenamento.
Um pequeno capítulo de livro que discute alguns cenários de aplicações de big data e o futuro possível.
Manipulação de dados, análise de dados e aprendizado de máquina
É aqui que a maioria das pessoas se diverte. Vamos ver como lidar, limpar, analisar e extrair insights de dados biomédicos.
Data Science and Predictive Analytics: Biomedical and Health Applications using R
Ivo D. Dinov
Livro e MOOC 📘 💻 | Código: | Gratuito: ✅ ❌ | Link ↗️ | Material gratuito ↗️
Tratamento completo e independente da teoria, modelagem experimental, desenvolvimento de sistema e validação de análises preditivas de saúde.
Um livro abrangente de ciência de dados: introdução ao R, manipulação de dados, visualização de dados, classificação, regressão, NLP e até mesmo um pouco de Deep Learning! Tudo isso com código R bem documentado. O livro não é gratuito, mas você pode encontrar os vídeos, notas de aula e códigos na página do autor no link acima.
Computational Learning Approaches to Data Analytics in Biomedical Applications
Khalid Al-Jabery Tayo Obafemi-Ajayi Gayla Olbricht Donald Wunsch
Livro 📘 | Código: , MATLAB | Gratuito: ❌ | Link ↗️
Apresenta insights sobre processamento de dados biomédicos, algoritmos e técnicas de clustering inovadoras e conexões entre análise estatística e clustering.
Uma abordagem interessante e mais teórica para algoritmos de pré-processamento e agrupamento de dados. Os exemplos são dados em pseudocódigo e alguns conhecimentos matemáticos são necessários. O último capítulo tem uma abordagem prática usando códigos MATLAB e Python.
Statistical Learning for Biomedical Data
James D. Malley, Karen G. Malley, Sinisa Pajevic
Livro 📘 | Código: MATLAB | Gratuito: ❌ | Link ↗️
Este livro é para qualquer pessoa que tenha dados biomédicos e precise identificar variáveis que predizem um resultado, para resultados de dois grupos, como tumor/não-tumor, sobrevivência/morte ou resposta ao tratamento.
Não é pesado em matemática e não tem muitos exemplos de código. Grandes explicações teóricas cobrindo regressão, árvores de decisão única e florestas aleatórias.
Case Studies in Neural Data Analysis
Mark Kramer, Uri Eden
Livro 📘 | Código: | Gratuito: ✅ | Link ↗️
O público-alvo é o neurocientista praticante - por exemplo, os alunos, pesquisadores e médicos que coletam dados neuronais no hospital ou laboratório. O material pode ficar bastante pesado em matemática, mas tentamos delinear os conceitos principais da forma mais direta possível, com implementações práticas de todos os conceitos.
Excelente material prático para neurocientistas interessados em analisar trens de pulso e campos elétricos. Todos os notebooks são em Python e possuem uma pequena explicação sobre os conceitos e objetivos da análise.
Neural Data Science: A Primer with MATLAB and Python
Erik Lee Nylen, Pascal Wallisch
Livro 📘 | Código: , MATLAB | Gratuito: ❌ | Link ↗️
Uma introdução para iniciantes aos princípios de computação e análise de dados em neurociência, usando Python e MATLAB, dando aos leitores a capacidade de transcender o tribalismo de plataforma e permitir versatilidade de codificação.
Este livro é lindamente organizado e repleto de imagens. O mais legal disso é o código MATLAB e Python escrito lado a lado. O conteúdo varia desde o básico da programação até técnicas avançadas, como processamento analógico de sinais, modelagem biofísica, agrupamento e classificação.
Computational Genomics with R
Altuna Akalin
Livro 📘 | Código: | Gratuito: ✅ | Link ↗️
O objetivo deste livro é fornecer os fundamentos para a análise de dados em genômica. Queremos que este livro seja um ponto de partida para estudantes de genômica computacional e um guia para análises adicionais de dados em tópicos mais específicos em genômica.
Este livro tem uma ótima introdução à genômica que o ajudará muito se você não estiver vindo de um campo relacionado à biologia. Ele cobre muitos tópicos, como introdução ao R, estatística, análise exploratória de dados, aprendizagem supervisionada, RNA-Seq e muito mais!
Bioinformatics: The Machine Learning Approach
Pierre Baldi, Søren Brunak
Livro 📘 | Código: ❌ | Gratuito: ❌ | Link ↗️
O livro é dirigido a biólogos e bioquímicos que precisam entender novos algoritmos baseados em dados e àqueles com formação primária em física, matemática, estatística ou ciência da computação que precisam saber mais sobre aplicações em biologia molecular.
Este é um pouco pesado em matemática, você provavelmente precisará saber cálculo, álgebra e teoria da probabilidade. O livro é realmente sobre os aspectos teóricos do aprendizado de máquina aplicado à bionformática, incluindo definições dos principais conceitos e provas dos principais teoremas.
Biomedical Image Analysis in Python
DataCamp
Vídeos e código interativo 💻 | Código: | Gratuito: ❌ | Link ↗️
Neste curso introdutório, você aprenderá os fundamentos da análise de imagens usando NumPy, SciPy e Matplotlib. Você navegará por uma tomografia computadorizada de corpo inteiro, segmentará uma série temporal de ressonância magnética cardíaca e determinará se a doença de Alzheimer altera a estrutura do cérebro.
Ótimo conteúdo e segue a estrutura de um curso DataCamp: vídeos curtos e exercícios práticos de codificação diretamente no navegador!
Conjuntos de dados
Aqui estão alguns lugares onde você pode encontrar conjuntos de dados para explorar e exercitar suas habilidades:
Synthea: Synthetic Patient Generation
MITRE Corporation
Link ↗️
SyntheaTM é um gerador de paciente sintético de código aberto que modela o histórico médico de pacientes sintéticos. Os dados resultantes são isentos de restrições de custo, privacidade e segurança, permitindo a pesquisa com dados de TI de saúde que, de outra forma, estão praticamente indisponíveis.
PhysioNet: The Research Resource for Complex Physiologic Signals
MIT Laboratory for Computational Physiology
Link ↗️
PhysioNet é um repositório de dados de pesquisa médica disponíveis gratuitamente, gerenciado pelo Laboratório de Fisiologia Computacional do MIT.
Computational Biology Datasets Suitable For Machine Learning
Ben Lengerich
Link ↗️
Esta é uma lista selecionada de conjuntos de dados de biologia computacional que foram pré-processados para aprendizado de máquina.
Kaggle: Healthcare tag
Link ↗️
Kaggle é a maior comunidade de ciência de dados do mundo, com ferramentas poderosas e conjuntos de dados públicos.
NIH: Data Sharing Resources
Trans-NIH BioMedical Informatics Coordinating Committee
Link ↗️
Para ajudar os pesquisadores a localizar um recurso apropriado para compartilhar seus dados, bem como para promover a conscientização dos recursos onde os conjuntos de dados podem ser localizados para reutilização, o BMIC mantém listas de vários tipos de recursos de compartilhamento de dados.
Conclusões
É isso! Esta lista abrangente cobre muitas áreas da ciência e análise de dados biomédicos, mas existem muitos outros recursos excelentes por aí! Você acha que eu posso ter deixado de fora algo importante? Compartilhe com a gente nos comentários!