网上药店
您现在的位置: 科学管理原理 >> 科学管理原理价格 >> 正文 >> 正文

Day32生信数据分析从业者代码管理

来源:科学管理原理 时间:2021/12/21

生信数据分析从业者项目管理系列回顾

Day31我们聊了生信数据分析从业者如何做好课题管理和记录,才能保证项目的跨时空高校访问且在团队沟通和协作中不卡壳。

这一期我们聊聊生信数据分析从业者代码管理

变量命名

变量命名有两个原则,一个是短,一个是信息量要大。但是这两个是矛盾的。

一部分初学者往往命名变量的时候var1var2var3,一直到varn。

这种变量名没有任何信息量,所以在用到这个变量的时候很难想起来。这个习惯对于写大的项目来说非常不好,因为时间跨度大,每次用到一个变量都要回去找找当时用了啥名字。

也有一部分命名信息量很大,但是太长。比如,TopSNPChr1Ft

我个人不推荐变量命名大小写混用,如果需要间隔下划线就好。

例如,以上例子可以写成top_snp_chr1_ft,因为大小写混用,容易出拼写方面的bug。但是不要用点来间隔因为很多语言里点意味着call一个object的attribute或者method,所以即便是写R这类下划线和点都一样的语言,尽量用下划线,这样合作的时候大家读起来容易些。

重复性和函数

很多语言其实都是程式化、模块化的编程。

所以只要一段代码今后还可能被用到,就把它写成一个函数,这样读起来比较容易,而且下次用到的时候直接调用函数就好,代码非常简洁,重复利用率很高。

代码注释

一般来说如果一个课题写的代码有行的话,有行是都废物,都是为了探索各种方法和参数的无效代码。

这行代码的意义只是告诉课题大致该往哪个方向走。所以一旦任务完成,这部分要与剩下的那行分开。因为如果这个时候不分开,再回头用的时候,就很难分开了。

剩下的那行,差不过有50行的结果虽然有点意思,但是无法组成故事写入文章。所以剩下的那50行,需要做好注释,每一步在干什么,输入是什么。

代码文件命名

命名代码文件的时候,尽量把功能上一致的代码分开,加上功能和时间戳作为文件名。不要把一天做了20个功能的代码放在一起,成为一个文件。一来这样命名时比较难,二来以后回来用到某一个功能时候很难在找到。

VersionControl

如果与人协作,很多个人同时在往一个文件里写东西,必须要用Versioncontrol,我个人习惯了Git,关于git有很多博主有很好的教程,我这里就不介绍了。

即便是不与别人合作,我也经常会把一些自己那些不需要见人的代码草稿,push到git作为一种云端备份的手段。

总之,代码这里要做到简洁、易懂(主要是别人在没有你介绍的情况下,能读得懂),有备份。

好了明天开始我们聊聊数据备份。

关于博主

大家好,我是山石,山西农业大学(本)、天津大学(硕)、瑞典乌普萨拉大学(博),瑞典农业科学大学(博士后)。

在生命科学领域学习工作了15年,目前为瑞典农业大学生物大数据分析ResearchFellow。

从普通二本院校到世界百强大学,一路踉跄走到了求学路的尽头。虽未获得成功,但是心中的小火苗还没有熄灭。此刻怀着仅剩的执着,开启了职场终身学习的征程。

我同时是知乎、

转载请注明:http://www.baoshijiec.com/yljg/11725.html

  • 上一篇文章:
  • 下一篇文章: 没有了