Mega Workflow Genomic - Step by Step - Genomic WGS 220825 + Genomic WGS 220825 Fasta
Sur usegalaxy.fr
-
Import des 5 sous-workflows
Workflow Name | Version selected | WorkflowHub | Dockstore |
---|---|---|---|
Quality and Contamination control workflow for paired-end data | 1.1.10 | ID 1881 | quality-and-contamination-control-raw-reads/main |
Bacterial genome assembly workflow for paired-end data | 2.0 | ID 1043 | bacterial-genome-assembly/main |
Quality and Contamination control post assembly workflow | 1.0 | ID 1882 | bacterial-quality-and-contamination-control-post-assembly/main |
Bacterial genome annotation workflow | 1.1.11 | ID 1050 | bacterial_genome_annotation/main |
AMR gene detection workflow in an assembled bacterial genome | 1.1.5 | ID 1049 | amr_gene_detection/main |
- dans l’onglet TRS ID, mettre l’ID du workflow sur WorkflowHub
- puis sélectionner la version qui nous intéresse (la dernière version)
- Q&CC raw reads 1.1.10
- Assembly 2.0
- Q&CC post assembly 1.0
- Annotation 1.1.11
- AMR 1.1.5 mais vaut mieux 1.1.6 (si dispo)
-
Créer un nouveau workflow : Genomic WGS [dateDuJour - ddmmyy]
-
Ajouter les métadonnées du workflow - Annotation :
Short paired-end read analysis to provid, assembly, annotation and antimicrobial gene detection. Version ssWF : QCC [versionImportée], Assembly [versionImportée], Annotation [versionImportée], AMR [versionImportée]
- Licence :
GNU General Public License v3.0 or later
- Creator :
- Person :
ABRomics
+ Email :abromics-support@groupes.france-bioinformatique.fr
- Organization :
abromics-consortium
+ URL :https://www.abromics.fr/
- Person :
Pierre Marin
+ Identifier (typically an orcid.org ID) :https://orcid.org/0000-0002-8304-138X
- Person :
Clea Siguret
+ Identifier (typically an orcid.org ID) :https://orcid.org/0009-0005-6140-0379
- Person :
- Tags :
Genomics
,fastq
,bacterial-genomics
,ABRomics
,paired-end
,short-reads
,AMR-detection
,assembly
,genomic
,genome-annotation
,antibiotic-resistance
,antimicrobial-resistance-genes
,AMR
- Annotation :
-
Insérer les 5 sous-workflows
-
Mettre des labels aux sous-workflows: quality_and_contamination_control_raw_reads
bacterial_genome_assembly
quality_and_contamination_post_assembly
bacterial_genome_annotation
amr_gene_detection
-
Vérifier que les labels des ouputs de ToolDistillator sont bien différents : tooldistillator_[results|summarize]_control_fastq
- `tooldistillator_[results|summarize]_assembly
tooldistillator_[results|summarize]_control_fasta
tooldistillator_[results|summarize]_annotation
tooldistillator_[results|summarize]_amr
-
Relier les 5 sous-workflows ensemble
QCC & Assembly | Assembly & Annotation | Assembly & AMR |
---|---|---|
![]() |
![]() |
![]() |
-
Ajouter 2 outils : -
Merge collections : les input collections sont les 5
tooldistillator_results_[control_raw_reads|assembly|control_raw_reads|annotation|amr]
- Label :
merge_tooldistillator_results
- Label output :
tooldistillator_results
- Tag :
tooldistillator_results
- Label :
-
Tooldistillator summarize : prend en input la collection de Merge collections
- Label :
tooldistillator_summarize
- Label output :
tooldistillator_summarize
- Tag :
tooldistillator_summarize
- Label :
-
Merge collections : les input collections sont les 5
-
Ajouter 2 Input Dataset et les relier au ssWF QCC -
Input Dataset 1 :
- Label :
paired_r1
- Annotation :
abromics,genomic,input,raw_reads,forward,fastq
- Format(s) :
fastq,fastq.gz,fastqsanger,fastqsanger.gz
- Label :
-
Input Dataset 2 :
- Label :
paired_r2
- Annotation :
abromics,genomic,input,raw_reads,reverse,fastq
- Format(s) :
fastq,fastq.gz,fastqsanger,fastqsanger.gz
- Label :
-
Input Dataset 1 :
-
Ajouter 2 Text Input et les relier au ssWF QCC -
Text Input 1 :
- Label :
kraken_bracken_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
2023-08-24T153645Z_standard_prebuilt_pluspf_16gb_2022-06-07
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
2023-08-24T153645Z_standard_prebuilt_pluspf_16gb_2022-06-07
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 2 :
- Label :
recentrifuge_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
2024-06-11
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
2024-06-11
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 1 :
-
Ajouter 3 Text Input et les relier au ssWF Annotation -
Text Input 1 :
- Label :
plasmidfinder_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
plasmidfinder_81c11f4_2023_12_04
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
plasmidfinder_81c11f4_2023_12_04
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 2 :
- Label :
bakta_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
V5.1_2024-01-19
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
V5.0light_2023-02-20,V5.1_2024-01-19
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 3 :
- Label :
bakta_amrfinderplus_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
amrfinderplus_V3.12_2024-05-02.2
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
amrfinderplus_V3.12_2024-05-02.2
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 1 :
-
Ajouter 3 Text Input et les relier au ssWF AMR -
Text Input 1 :
- Label :
taxonomy_group_point_mutation
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
Enterococcus_faecalis
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
Acinetobacter_baumannii,Burkholderia_cepacia,Burkholderia_pseudomallei,Campylobacter,Citrobacter_freundii,Clostridioides_difficile,Enterobacter_cloacae,Enterococcus_faecalis,Enterococcus_faecium,Escherichia,Klebsiella_aerogenes,Klebsiella_oxytoca,Klebsiella_pneumoniae,Neisseria_gonorrhoeae,Neisseria_meningitidis,Pseudomonas_aeruginosa,Salmonella,Serratia_marcescens,Staphylococcus_aureus,Staphylococcus_pseudintermedius,Streptococcus_agalactiae,Streptococcus_pneumoniae,Streptococcus_pyogenes,Vibrio_cholerae
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 2 :
- Label :
amrfinderplus_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
amrfinderplus_V3.12_2024-05-02.2
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
amrfinderplus_V3.12_2024-05-02.2
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 3 :
- Label :
abricate_database
- Parameter type :
Text
- Optional :
No
- Specify a default value :
Yes
-
vfdb
Si version dispo sur usegalaxy.fr
-
- Restrict Text Values :
Provide list all possible values
- Restricted Values :
vfdb
Si version dispo sur usegalaxy.fr
- Label :
-
Text Input 1 :
Mega wf Genomic WGS 220825 for FASTA
-
Faire une copie du wf Bacterial Genome Assembly with Shovill
-
le renommer Bacterial Genome Assembly for FASTA
-
modifier la description From WF Bacterial Genome Assembly using Shovill (Version Assembly 1.1.7) whitout Shovill and Bandage, and with Reads option disabled for QUAST
-
Ajouter 1 Input Dataset et les relier à CheckM2
,RefSeqMasher
etQuast
-
Input Dataset :
- Label :
Input fasta from assembly
- Format(s) :
fasta
- Label :
-
Input Dataset :
- Enregistrer
-
Faire une copie du mega Wf Genomic WGS 300625
-
Editer cette copie - name :
Genomic WGS 300625 for FASTA
- description :
Fasta analysis to provid assembly quality, annotation and antimicrobial gene detection. Version ssWF : Assembly for FASTA 1.1.7, Annotation 1.1.9, AMR 1.1.5
- tag : enlever
fastq
et mettrefasta
- name :
-
enlever les sswf Q&CC Bacterial Genome Assembly with Shovill
-
Insérer le ss wf Bacterial Genome Assembly for FASTA
-
Mettre un label au nouveau ssWF : bacterial_genome_assembly
-
Vérifier que les labels des ouputs de ToolDistillator sont bien différents : tooldistillator_[results|summarize]_assembly
-
Ajouter 1 Input Dataset et le relier aux 3 ss WF -
Input Dataset :
- Label :
fasta
- Annotation :
abromics,genomic,input,contigs,fasta
- Format(s) :
fasta
- Label :
-
Input Dataset :
-
relier Merge collections avec les 3 tooldistillator_results_[assembly|annotation|amr]
-
suprimer toutes les briques qui ne servent à rien - Enregistrer
Sur plateforme ABRomics - Via le panel administrateur
-
Import du MetaWF créé précédement sur usegalaxy.fr (action dans la table GalaxyUser)
-
Ajout de la configuration associée au MetaWF (ajout dans la table WorkflowConfig) -
Worflow Config: Attention, la configuration des schemas diffère selon les résultats que l'on souhaite récupérer (voir .json de Tooldistillator)
- Workflow :
Genomic WGS [dateDuJour - ddmmyy]
- Template :
Template #[id]: Genomic WGS [version du template de métadonnées associées]
- Type :
genomic_[version]
- Extractor name :
tooldistillator_summarize
- Parsing schema : le json de parsing devra être updaté avec les informations suivantes
- Clé
tool_infos
: rajouter chaque outil sauvegardé dans la bdd dans une liste sous la forme[["nom_de_l'outil", "version de l'outil", booléen si l'outil nécessite une bdd, booléen si l'outil est obligatoire]]
- Clé
tool_items
: dans un sous-dictionnaire, rajouter par outil les fichiers et valeurs à récupérer du json de tooldistillator sous la forme"nom de l'outil":[{"file": "nom du fichier","values":["valeur1","valeur2"]}]
- Clé
dbfields_hash
: dans un sous-dictionnaire, rajouter par outil la correspondance entre le nom de l'attribut côté modèle ABRomics et le nom de la valeur dans le json de tooldistillator sous la forme"nom de l'outil":{"nom du fichier":{"nom de l'attribut côté ABRomics": "nom de l'attribut côté Tooldistillator",...}}
- Clé
workflow_name
:genomic_[version]
- Clé
- Report schema : voir le schéma dans le fichier report_schema_genomic.json
- Workflow :
-
Attention, FastP dans sa nouvelle version ne prend plus les fichiers de format fastq.gz ! Il faudra éditer la table TemplateInput pour que le format fastqsanger.gz soit le format par défaut pour les R1/R2 d'un WF WGS.
** Ces WFs seront à rajouter sur l'environnement de production lorsque les développements pour l'ajout du QC côté abromics seront terminés. **
Edited by Hugo Lefeuvre