biostar handbook: 第一周笔记汇总+第二周任务布置

  1. 云栖社区>
  2. 博客>
  3. 正文

biostar handbook: 第一周笔记汇总+第二周任务布置

徐洲更 2017-10-22 09:15:00 浏览556
展开阅读全文

第一周笔记汇总

昨天和一位也在自学生信的同学交流自学的心境,他在我的唆使之下也在简书更新自己的笔记,可以搜索小郑的学习笔记。期间,他说道

非常庆幸自己能够坚持把自己学到的知识和困惑以文字的形式记录下来。以前导师让我搞网页的时候折腾过Apache,当时一边学习一边记录。几个月过去后,导师又让我重新负责,尽管我已经忘记了具体的步骤,但是看到自己的笔记就全部想起来了。

这也就是为什么我鼓励学习小组记录笔记的原因。你不需要把笔记写的多么好,只需要记录自己遇到的问题以及当时的解决方法就行了。就比如说我这次的笔记就主要写的是”如何用虚拟机安装Linux和Xshell连接服务器的方法“。并且我也从别人的笔记中看到如何保证数据的可重复,以及详细虚拟机安装方法。

笔记的意义就在于未来出现的问题,或许现在已经解决了,于是通过笔记你就能瞬间穿越到写笔记的那一刻了。

以下为已经上交且和第一周任务关联度较大的笔记:

第二周任务

从某种意义而言,不掌握Linux或者Unix系统就无法顺利的进行生信学习,原因就是大部分流程都是运行Linux服务器上,结果就是绝大部分生信软件也都只能在Linux下运行。你可以尝试进行源码编译,移植到Windows平台。

为此,你需要把Linux用的像Windows那样熟练,把所有Windows的相关操作都用命令映射,因此作业1就是

把自己Windows下的操作记录下来,然后在Linux下找到对应的指令实现。

案例1,文件移动 :Windows的文件移动需要右击文件,选择剪切,然后到目录路径下粘贴,在Linux下则是mv SRC DEST

案例2, 软件安装: Windows都是先百度软件名,然后去官网下载,双击exe,选择安装路径,不断下一步,或者去某软件管理器下搜索,之后自动安装。在Linux下的软件安装有哪些方法,请记录。

案例3, 数据压缩: Windows是下载一款压缩软件,然后压制成ZIP或者RAR或者7z等。在Linux下则是用gzip等压缩,不过一般还要先用tar打包。

作业二: 用管道命令分析数据

We should have some ways of connecting program likes [a] garden hose -- screw in another segment when it becomes necessary to massage data in another way.
--Doug McIlory(1964)

用好Linux的管道命令, 这个是从Linux新手进阶的必须理解的理念,结果是大家都能够理解下面这段命令,它的功能是计算 input.txt(input.txt里面存放的是一篇英语文章。) 里面出现频率最多的单词。

cat input.txt | tr -cs A-Za-z '\n' | tr A-Z a-z | sort | uniq -c | sort -rn | sed 10q

正所谓熟能生巧,所以请保证自己能够在不看Data analytics with Unix的情况下,也能熟练提出问题和解决问题。

更多题目见 http://rosalind.info/problems/topics/string-algorithms/ , 尝试用管道命令解决这个问题。

其他作业

第三个作业 是了解一下正则表达式(regular expression),知道它的用途即可。
第四个作业: 这个仅对自己有超高要求,并且能够毫无压力完成前面三个作业的人,也就是掌握grep,sed,awk的用法,至于要学习到什么程度,取决于你自己的能力。

以下为和第二周相关,但在第一周上交的作业:

参考资料

Google is your friend. If you are not able to contact this friend due to some reason, you can baidu how to find google.
--by xuzhougeng

网友评论

登录后评论
0/500
评论
徐洲更
+ 关注