Skip to content

Mega Workflow Genomic - Step by Step - Genomic WGS 220825 + Genomic WGS 220825 Fasta

Sur usegalaxy.fr

  • Import des 5 sous-workflows
Workflow Name Version selected WorkflowHub Dockstore
Quality and Contamination control workflow for paired-end data 1.1.10 ID 1881 quality-and-contamination-control-raw-reads/main
Bacterial genome assembly workflow for paired-end data 2.0 ID 1043 bacterial-genome-assembly/main
Quality and Contamination control post assembly workflow 1.0 ID 1882 bacterial-quality-and-contamination-control-post-assembly/main
Bacterial genome annotation workflow 1.1.11 ID 1050 bacterial_genome_annotation/main
AMR gene detection workflow in an assembled bacterial genome 1.1.5 ID 1049 amr_gene_detection/main
  • dans l’onglet TRS ID, mettre l’ID du workflow sur WorkflowHub Capture_d_écran_du_2025-04-01_14-25-21
  • puis sélectionner la version qui nous intéresse (la dernière version)
    • Q&CC raw reads 1.1.10
    • Assembly 2.0
    • Q&CC post assembly 1.0
    • Annotation 1.1.11
    • AMR 1.1.5 mais vaut mieux 1.1.6 (si dispo)

  • Créer un nouveau workflow :Genomic WGS [dateDuJour - ddmmyy]
  • Ajouter les métadonnées du workflow
    • Annotation : Short paired-end read analysis to provid, assembly, annotation and antimicrobial gene detection. Version ssWF : QCC [versionImportée], Assembly [versionImportée], Annotation [versionImportée], AMR [versionImportée]
    • Licence : GNU General Public License v3.0 or later
    • Creator :
      • Person : ABRomics + Email : abromics-support@groupes.france-bioinformatique.fr
      • Organization : abromics-consortium + URL : https://www.abromics.fr/
      • Person : Pierre Marin + Identifier (typically an orcid.org ID) : https://orcid.org/0000-0002-8304-138X
      • Person : Clea Siguret + Identifier (typically an orcid.org ID) : https://orcid.org/0009-0005-6140-0379
    • Tags : Genomics, fastq, bacterial-genomics, ABRomics, paired-end, short-reads, AMR-detection, assembly, genomic, genome-annotation, antibiotic-resistance, antimicrobial-resistance-genes, AMR
  • Insérer les 5 sous-workflows

image

  • Mettre des labels aux sous-workflows:
    • quality_and_contamination_control_raw_reads
    • bacterial_genome_assembly
    • quality_and_contamination_post_assembly
    • bacterial_genome_annotation
    • amr_gene_detection
  • Vérifier que les labels des ouputs de ToolDistillator sont bien différents :
    • tooldistillator_[results|summarize]_control_fastq
    • `tooldistillator_[results|summarize]_assembly
    • tooldistillator_[results|summarize]_control_fasta
    • tooldistillator_[results|summarize]_annotation
    • tooldistillator_[results|summarize]_amr

  • Relier les 5 sous-workflows ensemble
QCC & Assembly Assembly & Annotation Assembly & AMR
image image image
  • Ajouter 2 outils :
    • Merge collections : les input collections sont les 5 tooldistillator_results_[control_raw_reads|assembly|control_raw_reads|annotation|amr]
      • Label : merge_tooldistillator_results
      • Label output : tooldistillator_results
      • Tag : tooldistillator_results
    • Tooldistillator summarize : prend en input la collection de Merge collections
      • Label : tooldistillator_summarize
      • Label output : tooldistillator_summarize
      • Tag : tooldistillator_summarize

image


  • Ajouter 2 Input Dataset et les relier au ssWF QCC
    • Input Dataset 1 :
      • Label : paired_r1
      • Annotation : abromics,genomic,input,raw_reads,forward,fastq
      • Format(s) : fastq,fastq.gz,fastqsanger,fastqsanger.gz
    • Input Dataset 2 :
      • Label : paired_r2
      • Annotation : abromics,genomic,input,raw_reads,reverse,fastq
      • Format(s) : fastq,fastq.gz,fastqsanger,fastqsanger.gz

image

  • Ajouter 2 Text Input et les relier au ssWF QCC
    • Text Input 1 :
      • Label : kraken_bracken_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • 2023-08-24T153645Z_standard_prebuilt_pluspf_16gb_2022-06-07 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : 2023-08-24T153645Z_standard_prebuilt_pluspf_16gb_2022-06-07 Si version dispo sur usegalaxy.fr
    • Text Input 2 :
      • Label : recentrifuge_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • 2024-06-11 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : 2024-06-11 Si version dispo sur usegalaxy.fr

image


  • Ajouter 3 Text Input et les relier au ssWF Annotation
    • Text Input 1 :
      • Label : plasmidfinder_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • plasmidfinder_81c11f4_2023_12_04 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : plasmidfinder_81c11f4_2023_12_04 Si version dispo sur usegalaxy.fr
    • Text Input 2 :
      • Label : bakta_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • V5.1_2024-01-19 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : V5.0light_2023-02-20,V5.1_2024-01-19 Si version dispo sur usegalaxy.fr
    • Text Input 3 :
      • Label : bakta_amrfinderplus_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • amrfinderplus_V3.12_2024-05-02.2 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : amrfinderplus_V3.12_2024-05-02.2 Si version dispo sur usegalaxy.fr

image


  • Ajouter 3 Text Input et les relier au ssWF AMR
    • Text Input 1 :
      • Label : taxonomy_group_point_mutation
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • Enterococcus_faecalis Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : Acinetobacter_baumannii,Burkholderia_cepacia,Burkholderia_pseudomallei,Campylobacter,Citrobacter_freundii,Clostridioides_difficile,Enterobacter_cloacae,Enterococcus_faecalis,Enterococcus_faecium,Escherichia,Klebsiella_aerogenes,Klebsiella_oxytoca,Klebsiella_pneumoniae,Neisseria_gonorrhoeae,Neisseria_meningitidis,Pseudomonas_aeruginosa,Salmonella,Serratia_marcescens,Staphylococcus_aureus,Staphylococcus_pseudintermedius,Streptococcus_agalactiae,Streptococcus_pneumoniae,Streptococcus_pyogenes,Vibrio_cholerae Si version dispo sur usegalaxy.fr
    • Text Input 2 :
      • Label : amrfinderplus_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • amrfinderplus_V3.12_2024-05-02.2 Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : amrfinderplus_V3.12_2024-05-02.2 Si version dispo sur usegalaxy.fr
    • Text Input 3 :
      • Label : abricate_database
      • Parameter type : Text
      • Optional : No
      • Specify a default value : Yes
        • vfdb Si version dispo sur usegalaxy.fr
      • Restrict Text Values : Provide list all possible values
      • Restricted Values : vfdb Si version dispo sur usegalaxy.fr

image


Mega wf Genomic WGS 220825 for FASTA

  • Faire une copie du wf Bacterial Genome Assembly with Shovill
  • le renommer Bacterial Genome Assembly for FASTA
  • modifier la description From WF Bacterial Genome Assembly using Shovill (Version Assembly 1.1.7) whitout Shovill and Bandage, and with Reads option disabled for QUAST
  • Ajouter 1 Input Dataset et les relier à CheckM2, RefSeqMasher et Quast
    • Input Dataset :
      • Label : Input fasta from assembly
      • Format(s) : fasta
  • Enregistrer

image

  • Faire une copie du mega Wf Genomic WGS 300625
  • Editer cette copie
    • name : Genomic WGS 300625 for FASTA
    • description : Fasta analysis to provid assembly quality, annotation and antimicrobial gene detection. Version ssWF : Assembly for FASTA 1.1.7, Annotation 1.1.9, AMR 1.1.5
    • tag : enlever fastq et mettre fasta
  • enlever les sswf Q&CC Bacterial Genome Assembly with Shovill
  • Insérer le ss wf Bacterial Genome Assembly for FASTA
  • Mettre un label au nouveau ssWF : bacterial_genome_assembly
  • Vérifier que les labels des ouputs de ToolDistillator sont bien différents : tooldistillator_[results|summarize]_assembly
  • Ajouter 1 Input Dataset et le relier aux 3 ss WF
    • Input Dataset :
      • Label : fasta
      • Annotation : abromics,genomic,input,contigs,fasta
      • Format(s) : fasta

image

  • relier Merge collections avec les 3 tooldistillator_results_[assembly|annotation|amr]
  • suprimer toutes les briques qui ne servent à rien
  • Enregistrer

image


Sur plateforme ABRomics - Via le panel administrateur

  • Import du MetaWF créé précédement sur usegalaxy.fr (action dans la table GalaxyUser)

image

  • Ajout de la configuration associée au MetaWF (ajout dans la table WorkflowConfig)

  • Worflow Config: Attention, la configuration des schemas diffère selon les résultats que l'on souhaite récupérer (voir .json de Tooldistillator)

    • Workflow : Genomic WGS [dateDuJour - ddmmyy]
    • Template : Template #[id]: Genomic WGS [version du template de métadonnées associées]
    • Type : genomic_[version]
    • Extractor name : tooldistillator_summarize
    • Parsing schema : le json de parsing devra être updaté avec les informations suivantes
      • Clé tool_infos : rajouter chaque outil sauvegardé dans la bdd dans une liste sous la forme [["nom_de_l'outil", "version de l'outil", booléen si l'outil nécessite une bdd, booléen si l'outil est obligatoire]]
      • Clé tool_items : dans un sous-dictionnaire, rajouter par outil les fichiers et valeurs à récupérer du json de tooldistillator sous la forme "nom de l'outil":[{"file": "nom du fichier","values":["valeur1","valeur2"]}]
      • Clé dbfields_hash : dans un sous-dictionnaire, rajouter par outil la correspondance entre le nom de l'attribut côté modèle ABRomics et le nom de la valeur dans le json de tooldistillator sous la forme "nom de l'outil":{"nom du fichier":{"nom de l'attribut côté ABRomics": "nom de l'attribut côté Tooldistillator",...}}
      • Clé workflow_name : genomic_[version]
    • Report schema : voir le schéma dans le fichier report_schema_genomic.json

image image image

  • Attention, FastP dans sa nouvelle version ne prend plus les fichiers de format fastq.gz ! Il faudra éditer la table TemplateInput pour que le format fastqsanger.gz soit le format par défaut pour les R1/R2 d'un WF WGS.

** Ces WFs seront à rajouter sur l'environnement de production lorsque les développements pour l'ajout du QC côté abromics seront terminés. **

Edited by Hugo Lefeuvre