Module ACMG

Les recommandations ACMG deviennent un module à part entière de SeqOne. En plus de proposer une refonte du filtre actuellement en place, nous vous proposons désormais une interprétation semi-automatisée de la classification de vos variants selon les règles et la terminologie standard ACMG afin de faciliter le processus d’évaluation.

Newsletter octobre 2019
Module ACMG

Un nouveau module ACMG est désormais disponible et introduit plusieurs nouvelles fonctionnalités dans le processus d’évaluation des variants.

Nouveautés

Une saisie semi-automatique des règles ACMG. SeqOne calcule automatiquement certains des critères de classification ACMG et propose un score.

Une classification visible depuis le variant viewer. La classification automatique ACMG des variants proposée par SeqOne apparait dans le tableau de variants sous la forme d’une nouvelle colonne.

Classification ACMG semi-automatique proposée par SeqOne dans le tableau de variants

Un nouveau filtre sur la base de la classification ACMG dans votre panel de filtres. Ce filtre remplace l’ancien filtre ACMG, et permet de filtres vos variants sur la base de leur classification automatique.

Nouveau filtre ACMG

Utilisation

Un nouvel onglet ACMG est désormais disponible à partir de la page variant. A partir de cet onglet, la sélection des règles ACMG générée par SeqOne peut être révisée et modifiée par l’utilisateur, certaines règles étant exclusivement sous édition manuelle.

Sélection semi-automatique des règles ACMG

L’utilisateur peut utiliser la classification ACMG pour émettre une évaluation sur un variant, auquel cas les règles ACMG sélectionnées pour émettre l’évaluation sont indiquées dans le champ commentaire associé.  

Cette fonctionnalité a pour but de guider l’évaluation des variants, que ce soit à des fins diagnostiques ou dans le but d’alimenter la base de connaissance utilisateur. C’est pourquoi dans sa version beta, la saisie manuelle des règles ACMG par l’utilisateur n’est pas sauvegardée, et n’est pas mise à jour dans le tableau de variants.

Rétrocompatibilité

Ce changement rend ineffectif le précédent score ACMG implémenté dans l’onglet filtres. Les profils de filtres le faisant intervenir ne sont donc plus fonctionnels. 

Le rapport technique fait peau neuve !

Dans notre démarche d’amélioration continue, nous avons repensé et enrichi le Technical Report afin d’en faire un outil complet. En plus des outils bioinformatiques, il recense désormais l’intégralité des ressources mobilisées par votre analyse ainsi que leurs versions respectives.

Newsletter octobre 2019
Rapport technique SeqOne

Le Technical report, accessible à partir du compte-rendu d’une analyse terminée (onglet Results), regroupe désormais des informations essentielles pour votre démarche qualité.

Il rassemble une description de l’intégralité des outils bioinformatiques et ressources utilisés lors de l’analyse, y compris certains modules développés par SeqOne.

Versionnage des outils et ressources

Logiciel SeqOne. La version de la plateforme SeqOne à la date de l’analyse figure en haut à droite du rapport technique.

Pipeline Bioinformatique. Chaque pipeline bioinformatique SeqOne est versionnée, de même que chacun des outils et modules bioinformatiques qui la composent.

Représentation graphique d’une pipeline bioinformatique SeqOne

Ressources. SeqOne interroge de multiples bases de données  en amont de la génération du tableau de variants, afin de vous accompagner dans le processus d’annotation. Chacune de ces ressources est désormais recensée dans le rapport technique, de même que la version interrogée par la plateforme.

Utilisation

L’information relative aux différentes versions des outils et ressources est figée dans le rapport technique une fois l’analyse terminée, et peut être consultée à tout moment. Ce rapport peut également être imprimé dans le cadre de votre démarche qualité.

SeqOne vous accompagne dans vos procédures d’accréditation Cofrac. Pour plus d’informations, contactez-nous à support@seq.one.

SeqOne nommée startup de l’année 2019 en Occitanie par Ernst & Young

SeqOne a été nommée startup de l’année pour l’édition 2019 du prix de l’”Entrepreneur de l’année” région Occitanie, proposé par Ernst & Young. Prochaine étape : le concours national le 15 octobre à Paris.

Newsletter octobre 2019

En lice avec 22 autres candidats pour la région Occitanie, Nicolas Philippe, Guillaume Buwalda et Jean-Marc Holder obtiennent le prix de l’Entrepreneur 2019 dans la catégorie start-up.

Découvrez SeqOne en vidéo

SeqOne – Startup de l’année 2019 région Occitanie

A propos

Le Prix de l’Entrepreneur de l’Année EY est un programme international unique qui a pour objectif de récompenser des parcours entrepreneuriaux d’hommes et de femmes remarquables ayant fait preuve d’innovation, de leadership et d’excellence mais qui ont également contribué à l’amélioration de la qualité de vie de leur région, de leur pays, à travers le monde. 

Pour plus d’informations : https://www.ey.com/fr/fr/about-us/entrepreneurship/entrepreneur-of-the-year/

Amélioration du rapport clinique

Afin de le rendre plus fonctionnel, nous avons amélioré le rapport clinique SeqOne. Cette nouvelle édition, compatible avec le format préconisé par l’INCa, inclut désormais un ensemble de métadonneés relatives à l’échantillon ainsi qu’à l’examen, la couverture par exon, et bien plus !

Newsletter octobre 2019
Rapport clinique SeqOne

Le rapport clinique, générable sous la forme d’un pdf à partir de vos inteprétations, est désormais disponible pour vos analyses génomiques constitutionnelles et somatiques. Nous l’avons enrichi de plusieurs éléments, détaillés dans les paragraphes suivants.

Nouvelles métadonnées importables

De nouvelles métadonnées issues des recommandations de l’INCa sont disponibles à la création du rapport clinique :

  • informations relatives à l’examen,
  • renseignements anatomo-cyto-pathologiques.
Types de métadonnées pouvant figurer dans le rapport clinique

En plus d’être éditables au niveau du rapport, ces informations peuvent être directement importées sous la forme d’un tableau au format TSV à partir de l’onglet échantillons de votre projet. 

Format de chargement des métadonnées échantillons sur la plateforme

Couverture des exons

Il est désormais possible d’importer directement dans le rapport clinique, sous la forme d’un graphique, la couverture par exon à partir de la page de création du rapport. Il suffit pour cela de sélectionner l’option Add gene coverage results in report. L’utilisateur peut alors choisir le type d’exon à afficher en fonction de leur seuil de couverture : exons en “Warning”, exons en “Failed and warning”, ou intégralité des exons du manifeste.

Cette fonctionnalité est particulièrement utile en cas de variants exoniques non-rendus par l’analyse, permettant de trancher entre un défaut de couverture et l’absence réelle d’un allèle muté.

Support des UMI

Les worksets SomaVar et SomaDuo sont maintenant compatibles avec les données UMI (Unique Molecular Identifier). Le mode UMI active la génération de reads consensus par index avant l’appel des variants.

SeqOne Newsletter Juin 2019

La méthode UMI (Unique Molecular Identifier) repose sur l’indexation de chaque fragment d’ADN avant l’étape de PCR. Elle permet de détecter avec précision des variants avec des fréquences alléliques (VAF) très faibles tout en en limitant le nombre de faux positifs liés aux biais de PCR [1].

À la création d’un projet vous pouvez maintenant cocher la case UMI, qui activera un pré-traitement des reads lors de l’analyse des données.

Comment ça fonctionne ?

Les données UMI sont pré-traités avec l’outil fgbio [2] afin d’extraire pour chaque read l’index UMI. Les reads sont ensuite alignés sur le génome de référence puis ré-analysés par fgbio afin d’établir pour chaque index UMI une séquence consensus. Ce consensus permet d’éliminer les mutations qui ne sont pas supportés par l’ensemble des reads séquencés avec le même index (voir illustration ci-dessous). Les reads consensus sont finalement analysés par le pipeline classique pour réaliser l’appel des variants et l’interprétation peut se faire, selon vos habitudes, sur l’interface SeqOne.

Utiliser les UMI pour discriminer les erreurs (PCR/Séquençage) des vraies mutations à faible fréquence allélique.

Avantages

  • Une séquence consensus est déduite de tous les reads portant la même UMI pour un fragment d’ADN donné. Ceci permet de corriger les erreurs de PCR et/ou de séquençage.
  • Une séquence consensus unique étant obtenu pour chaque fragment d’ADN initial, chaque molécule ne sera comptée qu’une seule fois lors de l’étape d’appel de variant. Ceci permet de réduire considérablement les biais liés à l’amplification.

Ainsi, vous pouvez interpréter sur SeqOne les variants avec une VAF faible (<5%).

Limitations actuelles

  • Seule le kit UMIs de Qiagen est supporté. Si vous utilisez un autre protocole, merci de nous contacter.
  • Seul le workset SomaVar est compatible avec les données UMI.
  • Pour les régions avec un faible signal de capture (<2 reads par UMI), la procédure de pré-traitement des UMIs est susceptible de filtrer l’ensemble des reads. Notez que pour obtenir 90% de sensibilité sur un appel de variants avec des VAF à 5%, Qiagen recommande une profondeur de séquençage de 7200x pour 10ng d’ADN frais ou de 3640x pour 20ng d’ADN frais. Quoi qu’il en soit, nous travaillons pour ajouter un mode “rescue” pour ces régions afin de réaliser le calling, même si le traitement des UMIs a échoué.

Bibliographie

[1] Kou, R. et al. Benefits and Challenges with Applying Unique Molecular Identifiers in Next Generation Sequencing to Detect Low Frequency Mutations. PLoS One 11, e0146638 (2016).
[2] http://fulcrumgenomics.github.io/fgbio/

Gene Cov, analyse QC de la couverture par exon!

Afin de valider facilement la qualité de couverture des régions d’intérêt, nous vous proposons Gene Cov, un module dynamique pour visualiser et d’explorer les régions peu ou mal couvertes.

SeqOne Newsletter 2019

Afin de faciliter l’interprétation des régions mal couvertes dans les données de capture, nous avons développé le module GeneCov.

L’information globale de couverture des gènes est présentée sous la forme de flags résumant :

  • le nombre de gènes bien couverts (covered), c’est à dire dont tous les exons répondent aux critères de qualité de couverture
  • le nombre de gènes présentant un défaut de couverture (warning ou failed) c’est à dire les gènes pour lesquels au moins un exon du gène présente un défaut de qualité de couverture.

Comment ça marche ?

Interface de GeneCov.

Un tableau général permet de visualiser l’ensemble des exons (UTR et CDS) pour chaque gène. Par défaut sont présentés uniquement les gènes avec un défaut de couverte (warning ou failed).

Dans ce tableau, les exons sont représentés en fonction de la qualité de leur couverture (taux et profondeur de couveture).

  • Un exon est annoté warning (avertissement) et affiché en orange si au moins une base présente une profondeur de séquençage inférieure au seuil de warning.
  • Un exon est annoté failed (échec) et affiché en rouge si au moins une base présente une profondeur de séquençage inférieure au seuil d’échec.
  • Si la couverture est au dessus de ces deux seuils, l’exon est annoté passed (validé).

Les seuils minimum et maximum utilisés correspondent aux recommandations de l’Inca (i.e. 30x/100x en génétique constitutionnelle et 300x/500x en génétique somatique).

Une vue détaillée de chaque gène permet d’afficher les métriques de couverture des exons: couverture moyenne, médiane, taux de couverture à 10x, 30x, 50x, 100X, 200x, 300X et 500X. Ces seuils ont été choisis suite à un sondage réalisé auprès des utilisateurs de Seqone.

Pour chaque exon, une fenêtre IGV vous permet de visualiser encore plus précisément la couverture et les reads associés.

La méthode de calcul

La couverture par position est calculée par l’outil Mosdepth et les métriques de couverture affichées par exon correspondent au taux de couverture remplissant le critère qualité correspondant (i.e. nombre de position de l’exon avec une profondeur de séquençage > au seuil considéré / nombre total de position de l’exon). Ce calcul est basé sur les coordonnées des exons Refseq avec un padding de +/-10pb.

Afin de limiter le nombre de faux positifs, lorsqu’un exon Refseq n’est que partiellement couvert par le manifeste utilisateur, cet exon n’est pas pris en compte pour l’annotation par flag et il est affiché en gris. Cependant, si le chevauchement entre les coordonnées refseq et le manifeste est supérieur à 80%, les métriques détaillées de l’exon seront tout de même proposées dans le tableau détaillé par exon.

Export de l’analyse

Le tableau de résultat GenCcov est téléchargeable dans l’onglet ‘Files’.

Conclusion

Le module GeneCov présente de nombreux avantages dont les principaux sont:

  • GeneCov permet de visualiser rapidement les exons mal couverts dans une analyse (pas de diagnostic)
  • GeneCov permet de vérifier, dans le cas d’une absence de variant, la bonne couverture de la région d’intérêt (diagnostic négatif)

Devant le succès de cet outil auprès des premiers utilisateurs, nous prévoyons de continuer à le développer. Les premiers points d’améliorations qui ont été soulevés sont les suivants:

  1. Une métrique de couverture par gène. Nous envisageons de rajouter une métrique générale de couverture pour l’ensemble du gène (moyenne de couverture et taux de couverture pour un seuil donné).
  2. GeneCov Amplicon. La version actuelle de GeneCov a été développée pour la capture. Nous prévoyons de développer une version qui permettra de rendre un résultat de couverture non pas à l’échelle de l’exon mais à l’echelle d’un amplicon. En attendant, nous proposons l’utilisation de la version capture pour les analyses d’amplicons.
  3. Integration dans le rapport clinique des résultats de l’analyse de couverture par gène.

N’hésitez pas à nous contacter pour nous faire part de votre expérience utilisateur et de vos remarques à support@seq.one

Automatisez l’import de vos FASTQ et le lancement des analyses

Afin de ne plus perdre de temps, nous vous proposons d’automatiser le transfert et le lancement de vos analyses dès que votre séquençage est terminé via le module SeqOne Runner (en option).

SeqOne Newsletter Juin 2019

Afin d’accélérer la vitesse de rendu des interprétations génétiques et limiter les erreurs de manipulations de fichier, nous vous proposons le module SeqOne Runner qui permet d’automatiser le transfert de données depuis la sortie du séquenceur vers SeqOne et de déclencher automatiquement les analyses.

Ce nouveau module est disponible en option uniquement, merci de prendre contact avec le service commercial pour obtenir un devis. Une phase de calibration est à prévoir pendant la mise en place du SeqOne runner.

Comment ça marche ?

Une fois installé et configuré sur vos serveurs, le module SeqOne runner récupère les données FASTQ placées sur un disque partagé ainsi que la SampleSheet illumina. Il s’occupe ensuite de réaliser :

  • L’upload (téléversement) des données FASTQ vers SeqOne
  • La création des projets et des échantillons
  • Le lancement des analyses.

Ainsi dès que votre run illumina se termine, le transfert et les analyses sont déclenchés automatiquement. Vous arrivez le matin sur SeqOne, prêts à interpréter vos données!

Quelques limitations

  • Le lancement des analyses est aujourd’hui limité aux worksets GermlineVar, SomaVar et CNVCapture.
  • Pas de gestion du format BCL (uniquement FASTQ).

Spécifications techniques

Machine (VM) Linux avec Docker (accès root) et port ouvert vers SeqOne. Minimum 4CPU et 8 Go de RAM.

Nouvelle visualisation des CNVs

Montpellier, le 3 Juin 2019

Le module graphique d’interprétation des CNV fait peau neuve et est désormais consultable depuis les pages analyses du workset GermlineVar permettant l’analyse conjointe avec les variants à l’échelle d’un patient.

Newsletter Juin 2019

Un nouvel onglet “CNV” est désormais disponible sur la page des analyses GermlineVar pour lesquelles une analyse CNVPanel a également été lancée. Ce nouveau module introduit trois grands changements dans l’interprétation des CNVs :

Nouveautés

  1. L’analyse centrée sur le patient : L’analyse des CNVs se fait désormais conjointement avec l’analyse des variants (SNV/Indel) à l’échelle d’un patient. Cela permet de regrouper l’information de variation génomique.
  2. Analyse au niveau du gène: Dans ce nouveau module l’analyse de CNVs est plus facile. Les CNVs multi-exoniques sont regroupées avec une visibilité à l’échelle du transcrit.
  3. Visibilité des régions en échec de calling : Dans la nouvelle interface il est désormais très facile d’identifier les régions pour lesquelles la recherche de CNVs n’as pu être réalisée et la raison de cet échec : signal insuffisant, manque de contrôles, etc…
  4. Nouvelle ergonomie du graphique de copy number avec les valeurs de copie des contrôles (pour chaque exon) en filigrane.
New CNV Viewer Interface

Utilisation

Le CNV Viewer V2 est composé de deux panneaux où le premier propose une liste des gènes pour lesquels ont été identifiées des CNVs. Chaque ligne est cliquable et permet d’afficher, dans le panneau inférieur, des informations détaillées sur le/les CNV(s) par région (exon, intron, etc.) comme le nombre de copies, le z-score, des warnings, etc…

Par défaut le CNV Viewer indique la liste de CNVs identifiées pour le patient. Si aucun CNV n’est identifiée, un message indique que le calling n’a pas relevé de variation du nombre de copies (voir ci-dessous). Une case à cocher située dans le coin inférieur gauche du viewer permet d’afficher les gènes présentant des régions en échec de calling et les gènes pour lesquels toutes les régions sont en statut Normal pour le nombre de copies.

Résultat négatif: Aucun CNV détectés.

Il est également possible de filtrer la liste des résultats en utilisant un manifest ou un nom de gène.

Rétrocompatibilité

En parallèle du CNV Viewer V2, une nouvelle version du Workset CNVPanel (en savoir plus) a été déployée. Elle dispose d’un nouveau module de calling et permet de s’affranchir des seuils sur le ‘copy_ratio’ et le ‘coeff_variation’ qui étaient précédemment utilisés pour filtrer les régions concernées par des CNVs.

Le CNV Viewer V2 est cependant rétrocompatible avec les anciennes analyses CNVPanel si vous utilisez les seuils suivants :

  • Amplification : copy_ratio >= 1.3 et coeff_variation <= 0.1
  • Deletion : copy_ratio <= 0.7 et coeff_variantion <= 0.1
  • Failed : coeff_variation > 0.1

Ancienne version

L’ancienne version du CNV Viewer reste disponible sur SeqOne jusqu’à la fin de l’année 2109. Il permet de consulter l’ensemble des analyses CNVPanel.

Nouvelle version du Workset CNVCapture (v2)

Le pipeline d’analyse CNVCapture (germline) évolue : nouvel algorithme de calling, meilleure gestion de la sélection des contrôles pour une amélioration significative des performances (sensibilité et précision).

SeqOne Newsletter Juin 2019
Logo CNV-Panel-V2

Dans le cadre de notre processus d’amélioration continue, nous vous proposons aujourd’hui une nouvelle version du workset CNVCapture (v2) permettant la recherche de CNVs constitutionnels dans les données de captures. Cette nouvelle version fait suite au développement en interne d’un nouveau moteur de détection des CNVs (CNV-Panel-V2) qui améliore significativement les résultats (sensibilité et précision) grâce notamment à une nouvelle méthodologie de sélection des échantillons contrôles. Nous allons passer en revue les changements majeurs et discuter des améliorations apportées.

Meilleurs sélection des contrôles

Une étape critiques dans l’analyse de CNVs dans les données de capture est de sélectionner, pour chaque échantillon, une liste de contrôles parmi les autres échantillons du même run. Ces contrôles permettront de détecter si une région présente un excès (amplification) ou une carence (délétion) de signal. Le problème posé par cette méthode d’analyse par couverture concerne la sélection des contrôles. Il s’agit de choisir le plus grand nombre possible de contrôles (puissance statistique) sachant qu’ils doivent posséder des caractéristiques globales de couverture les plus proches possible (limitation de la variabilité) de celles de l’échantillon pour lequel nous recherchons les CNVs.

Pour ce faire, nous avons introduit une procédure de sélection des meilleurs contrôles parmi les échantillons du même run en utilisant une combinaison des scores de corrélation de Pearson (corrélation linéaire) et de Spearman (corrélation de rang). Ces tests statistiques donnent des indications complémentaires sur la relation entre deux échantillons. Afin de ne pas biaiser le choix des contrôles, nous avons également introduit une autre méthode statistique, la distance de malhanobis, qui permet d’exclure les régions “outliers” (ex: un CNV) avant de calculer les corrélations. Nous avons également défini deux seuils: un seuil minimal de 6 échantillons contrôles nécessaires pour la recherche des CNVs et un seuil maximum de 12 (les mieux corrélés parmi l’ensemble des contrôles).

De plus, pour chaque région considérée, nous avons introduit une sous-sélection des contrôles basée sur l’écart inter-quartile (IQR). Cette procédure permet de supprimer les outliers par région. Par exemple, si un des contrôles sélectionnés présente une variation du nombre de copies pour la région concernée, il ne participera pas au calcul des métriques de cette région (copy-ratio, z-score, etc…)

L’ensemble de ces nouvelles procédures de sélection des contrôles permet de garantir une meilleure estimation du nombre de copies (et autres métriques, zscore ..) et ainsi d’améliorer les performances de sensibilité et de précision pour la recherche des CNVs.

Découpage plus précis des régions

Afin de mieux identifier les régions du gène impliquées dans la variation du nombre de copie, l’annotation des régions étudiées (couvertes par le manifest) a été affinée avec la création de 4 sous-catégories :

  • les régions exoniques sont divisées en exon-UTR et exon-CDS
  • les régions bordant les exons sont divisées en upstream et downstream (jusqu’à 1000pb)

Nouvel procédure de calling: plus besoin de hard-filter

Dans cette nouvelle version nous avons également introduit un score de probabilité de détection de CNV qui combine le copy-ratio, le z-score et la variabilité des contrôles. Il permet de catégoriser automatiquement les régions dans l’une des quatre classes suivantes :

  • Normal : Pas de variation du nombre de copies par rapport aux contrôles
  • Amplification : Gain de copie(s)
  • Deletion : Perte de copie(s)
  • Failed : Echec de détection du nombre de copies (variabilité trop grande)

Ce score permet de s’affranchir des procédures de “hard-filtering”qui impliquent de fixer des valeurs seuils arbitraires sur les différentes métriques. Pour conclure, les performances de détections des CNVs sont grandement augmentées.

Importer vos BAM/VCF du séquenceur Ion Torrent sur SeqOne

SeqOne est désormais compatible avec les fichiers BAM et VCF produits par les séquenceurs utilisant la technologie Ion Torrent. Créez un nouveau projet avec la metadata “ion torrent”, importez vos données et bénéficiez de l’environnement SeqOne pour interpréter vos variants.

SeqOne Newsletter Juin 2019

Suite à de nombreuses sollicitations pour rendre SeqOne compatible avec la technologie ion torrent, nous vous proposons aujourd’hui un module d’importation des fichier BAM et VCF générés par le pipeline d’analyse des séquenceurs Ion Torrent (PGM, S5). Depuis cette MàJ, vous pouvez interpréter vos données Illumina et Ion Torrent sur SeqOne avec la même simplicité!

Il est important de préciser que ce nouveau module, à la différence des autres worksets de SeqOne, ne réalise pas d’étape secondaire de traitement des données (alignement et variant calling). Les variants sont directement extraits du VCF fourni puis annotés et injectés dans SeqOne. De plus, les métriques qualité liées à la couverture sont calculées à partir du fichier BAM.

Importez vos données dans SeqOne en quelques minutes!

Pour importer des données Ion Torrent il faut tout d’abord :

  1. Créer un nouveau projet en indiquant le séquenceur Ion Torrent et en déposant le manifest associé au panel séquencé.
  2. Une fois le projet créé, la modale d’ajout d’échantillon indique qu’il faut déposer les fichiers BAM et VCF dans la boite de téléchargement.
  3. Une fois les données chargées sur SeqOne, il est ensuite possible de lancer une analyse “PGM”, qui va permettre d’importer les variants depuis le VCF dans votre base de données et calculer les métriques qualité.

Quelques limitations …

Aujourd’hui le workset “PGM”, ne permet pas l’analyse conjointe de plusieurs échantillons comme c’est le cas de SomaDuo et GermlineFamilly. Dans une prochaine version du pipeline, nous vous proposerons de pouvoir conjointement analyser dans le Variant Viewer plusieurs échantillons.