生信文件格式:FASTQ/SAM/BAM/VCF/GFF/BED
FASTQ、SAM/BAM、VCF、GFF/GTF、BED等七种生信核心文件格式的结构解析与互转方法。
生物信息学数据库全景:序列/表达/功能/变异
生信必备免费数据库全景整理,按序列、表达、功能、变异和表观五大类别梳理NCBI、Ensembl、GEO等15个核心资源。
ENSEMBL BioMart批量数据导出:REST API与biomaRt
ENSEMBL BioMart基因注释批量导出指南,覆盖REST API与biomaRt两种方式获取GO、KEGG和同源基因信息。
curl/wget下载技巧:断点续传、API交互、批量下载
curl与wget的断点续传、批量下载、API交互和认证鉴权的实战技巧,覆盖NCBI、Ensembl等生信下载场景。
SRA数据下载:SRA-toolkit与国内镜像加速
NCBI SRA数据库的下载全流程,覆盖prefetch断点续传、fasterq-dump转换和国内镜像加速方案。