diff --git a/pages.it/common/bedtools.md b/pages.it/common/bedtools.md new file mode 100644 index 0000000000..66e511e2b0 --- /dev/null +++ b/pages.it/common/bedtools.md @@ -0,0 +1,28 @@ +# bedtools + +> Un coltellino svizzero di strumenti per analisi genomica. +> Usato per intersecare, raggruppare, convertire e contare dati in formato BAM, BED, GFF/GTF, VCF. + +- Interseca i fili genetici delle sequenze contenute in due file diversi e salva il risultato: + +`bedtools intersect -a {{percorso/al/file_1}} -b {{percorso/al/file_2}} -s > {{percorso/al/file_output}}` + +- Interseca due file unendo il risultato a sinistra, ovvero riporta ogni feature da {{file_1}} e NULL dove non c'è sovrapposizione con {{file_2}}: + +`bedtools intersect -a {{percorso/al/file_1}} -b {{percorso/al/file_2}} -lof > {{percorso/al/file_output}}` + +- Usa un algoritmo più efficiente per intersecare due file precedentemente ordinati: + +`bedtools intersect -a {{percorso/al/file_1}} -b {{percorso/al/file_2}} -sorted > {{percorso/al/file_output}}` + +- Raggruppa file in base alle prime tre e la quinta colonna e raggruppa la sesta colonna sommandola: + +`bedtools groupby -i {{percorso/al/file}} -c 1-3,5 -g 6 -o sum` + +- Converti da formato BAM a BED: + +`bedtools bamtobed -i {{percorso/al/file}}.bam > {{percorso/al/file}}.bed` + +- Trova per tutte le proprietà in {{file_1}} la più vicina in {{file_2}} e scrivi la loro distanza in una ulteriore colonna (i file in input devono essere ordinati): + +`bedtools closest -a {{percorso/al/file_1}}.bed -b {{percorso/al/file_2}}.bed -d`