Bioinfo Blog!

blog di bioinformatica e di esperienze di studio all’estero

Un trucco per GREP – coloriamo i risultati

Pubblicato da dalloliogm su maggio 5, 2007

Devo ringraziare l’utente che sul portale di debianitalia.org ha postato questa guida:

per il trucchetto che vi vado a presentare adesso, che ormai uso quasi tutti i giorni.

grep e’ un programma da linea di comando preinstallato praticamente in tutti i sistemi operativi Unix, e che e’ molto utilizzato sia dai programmatori che dai bioinformatici.

A che serve? Grep é un filtro, in due parole:

  • Dato un file o un insieme di files, grep permette di identificare tutte le righe all’interno di questi che contengano un determinato termine o frase.

Per esempio immaginate di avere un file contenente tutti i termini nel dizionario italiano; potete utilizzarlo per sapere quali contengono una particolare parola al loro interno:

  • grep scienza /usr/share/dict/italian
    • -> scienza
    • -> coscienza

Grep e’ molto utile anche in bioinformatica, perche’ si tratta di un campo molto spesso ci si trova a lavorare con parecchi file di testo (sequenze, annotazioni, strutture proteiche, etc.).

unalias1.png alias1.png 2B3Y.pdb
(nelle illustrazioni: funzionamento di grep prima e dopo aver applicato il trucchetto segnalato, e un file .pdb di esempio)

Infatti molti formati utilizzati in bioinformatica al giorno d’oggi sono ancora sotto forma di file di testo semplice, sebbene si stiano facendo degli sforzi per passare all’XML.

Esempi di formati in solo testo usati in bioinformatica sono il .pdb per le strutture cristallografiche di proteine, genbank ed embl per i geni annotati, e così via.

Il trucchetto segnalato suggerisce semplicemente di aggiungere queste due righe:

  • alias grep=”grep –color=auto”
  • export GREP_COLOR=’0;30;43′

al file ~/.bashrc del vostro profilo (potete editarlo con un qualsiasi editor di testo, es. gedit ~/.bashrc).

Dopo aver effettuato il cambio potete riaggiornare il comportamento della shell aprendo un altro terminale, o digitanto ‘source ~/.bashrc’, e d’ora in poi grep, oltre a stamparvi a schermo le righe corrispondenti alla vostra ricerca, colorera’ in arancione tutti i termini che corrispondono alla vostra query.

Questo é un trucchetto molto comodo per imparare ad utilizzare le espressioni regolari, perchè vi mostra in maniera chiara quali stringhe corrispondono al pattern che state cercando.

Pur essendo un comando molto vecchio grep continua a rimanere uno dei più utili, specie se usate la linea di comando ;).
Se imparate ad usarlo al meglio, potrete utilizzare delle caratteristiche molto avanzate, come la ricerca ricorsiva in sottocartelle, le espressioni regolari avanzate (parametro -E), e le ricerche fuzzy (agrep).

Buon divertimento!

About these ads

Al momento l'inserimento di commenti non è consentito.

 
Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.

%d blogger cliccano Mi Piace per questo: