Skip to content

gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

54 Commits
 
 
 
 

Repository files navigation

Guideline-for-Computational-Biology-and-Bioinformatics

avatar Fig from Bioinformatics Curriculum Guidelines: Toward a Definition of Core Competencies, 2014, Plos Compbio

目的: 在原来的 GCCS2019 基础上对组内培养方案更具体的完善,大概会包括如何达到 GCCS2019 中的要求中的basic,advanced skills。

Ps. 对于一开始进组开始 intern 的同学建议全部掌握 Basic skills 且最好掌握部分 Advanced skills,basic skills 是能开始工作的基础,Advanced skills 是能做出原创性工作的前提。

Table of contents

Basic Skills

这部分是能够开展工作的基础,至少需要了解的部分。

Linux Foundation

对于 Linux 需要掌握一些最基础的基本操作,以及关于服务器的一些基本的常识。

  • Linux basiclinux shortenned 都是基本的 Linux 知识,建议快速的看一遍,然后上手试一试,北大未名有免费的学生账号,可以申请

Python

Basic 的 Python ,只需要掌握基本的语法,以及常见的 package 比如 numpy, pandas 的基础用法即可。

R

Writing

  • Markdown/Rmarkdown Markdown 感觉是轻量级 LaTeX,最主要的就是也能支持数学公式。推荐 typora!来写 Markdown。
  • LaTeX LaTeX 基础的话推荐 Basic latex 看完这个,LaTeX 的基本的使用不成问题!如果想要尝试的话可以推荐使用 Overleaf,上面有很多的 template 可以直接用。

Basic Math

  • 高等数学
  • 线性代数
  • 概率论与数理统计

Advanced skill

Advanced skill 是在 Basic skill 的基础上的进阶,包括机器学习,统计学习,深度学习,贝叶斯理论,概率图模型,同学们按照自己的兴趣挑选学习即可。

ps. 如何做出有价值的,其他人没想到的工作呢 1.你比人家聪明,2.你比人家知道的多。相比第一条,第二条是更容易实现的

Machine Learning

使用机器学习/统计学习方法挖掘组学数据其实就是生物信息做的事情,所以machine learning某种程度上也是 basic skill! 这部分资料其实非常多,Google 随便搜索一下就能找到很多,下面简单的罗列一下我知道的,或者我看过觉得不错的的资料。

  • Mooc
    • Coursera 上 Andrew Ng 的 Machine learning,深入浅出相当不错,建议快速刷完。machine learning ,另外国内网易云上,bilibili上都有搬运的资料。
    • machine-learning-notes 只要是里面有视频的部分讲的都非常清楚(Variational Inference, MC等)!而且中文格外亲切。
  • Book
    • Pattern recognition and machine learning(PRML)

Statistical Learning

统计学习和机器学习其实没什么区别吧.

Deep Learning

Bayes

贝叶斯学派和频率学派的本质区别就是认为 parameter 没有确定的值,有的是分布。

Reinforce Learning

Bioinformatics Analysis

Some Courses

Related links

People

Releases

No releases published

Packages

No packages published