Replacing genome variant annotation, filtering and interpretation software
Stichting Amsterdam UMC TenderNed
AI Samenvatting
Stichting Amsterdam UMC zoekt een oplossing voor het vervangen van software voor de annotatie, filtering en interpretatie van genoomvarianten. De opdracht omvat het ontwikkelen of implementeren van een bioinformatica-tool die VCF-bestanden verwerkt, waarbij varianten worden geannoteerd, gefilterd op basis van kwaliteitsparameters en laboratoriumcriteria, en vervolgens geïnterpreteerd met behulp van diverse tools en databases. Een belangrijk aspect van de software is de integratie van een AI-tool die helpt bij het identificeren van de meest waarschijnlijke causale variant voor genetische aandoeningen.
Voor deze opdracht zijn vaardigheden in bioinformatica, data-analyse en softwareontwikkeling cruciaal. Ervaring met VCF-bestanden, annotatieprocessen en filteringstechnieken is vereist, evenals kennis van AI-toepassingen in de genomica. Dit project biedt een interessante kans voor BI- en data-freelancers die hun expertise willen inzetten in de gezondheidszorg en bij willen dragen aan baanbrekend onderzoek in de genetica. De combinatie van geavanceerde technologieën en de impact op patiëntenzorg maakt deze opdracht bijzonder aantrekkelijk voor professionals in het veld.
Voor deze opdracht zijn vaardigheden in bioinformatica, data-analyse en softwareontwikkeling cruciaal. Ervaring met VCF-bestanden, annotatieprocessen en filteringstechnieken is vereist, evenals kennis van AI-toepassingen in de genomica. Dit project biedt een interessante kans voor BI- en data-freelancers die hun expertise willen inzetten in de gezondheidszorg en bij willen dragen aan baanbrekend onderzoek in de genetica. De combinatie van geavanceerde technologieën en de impact op patiëntenzorg maakt deze opdracht bijzonder aantrekkelijk voor professionals in het veld.
Volledige omschrijving
Data from the sequencer is processed through a bioinformatics pipeline (currently GATK, soon transitioning to DRAGEN), which outputs all possible variants relative to the reference genome in tabular form in a VCF file. This VCF file is imported into the software, where annotation first takes place: all valid variants are separated from invalid variants based on quality parameters.
Because this results in a large number of variants, they are subsequently filtered based on laboratory defined criteria, such as genomic position, population frequency, known pathogenicity based on literature or insilico prediction tools.
All remaining variants must then be interpreted using various tools/databases. The software supports the use and visualisation of data from these tools, enabling fast and efficient interpretation — including through an AI tool that proposes the most likely causal variant for the disorder.
Because this results in a large number of variants, they are subsequently filtered based on laboratory defined criteria, such as genomic position, population frequency, known pathogenicity based on literature or insilico prediction tools.
All remaining variants must then be interpreted using various tools/databases. The software supports the use and visualisation of data from these tools, enabling fast and efficient interpretation — including through an AI tool that proposes the most likely causal variant for the disorder.
