[Home bibliotech]
Home > Les thèses en ligne de l'INP

Développement d’une méthodologie d’analyse de la conservation de synténie chez les plantes. Du génome d’Arabidopsis à celui du Tournesol

Muller, Cédric (2005) Développement d’une méthodologie d’analyse de la conservation de synténie chez les plantes. Du génome d’Arabidopsis à celui du Tournesol. (Development of a methodology of analysis of the synteny conservation in plants. From the Arabidopsis genome to the sunflower genome.)

Full text available as:

PDF - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
6.99 Mo

Abstract

Le tournesol (Helianthus annuus L) est l’une des principales plantes oléagineuses cultivées. L’étude des gènes sous tendant les principaux caractères agronomiques est difficile en raison de son grand génome pour lequel peu d’informations existent. Par ailleurs, les moyens financiers et techniques sont loin d’être comparables à ceux mis en place pour les céréales ou d’autres végétaux (carte physique, séquençage en masse de génome, d’ARNm, recherche des duplications, des transposons. . .). Pour étudier l’organisation du génome du tournesol, il a donc été envisagé une approche différente basée sur la conservation de synténie avec la plante modèle Arabidopsis thaliana. Les informations relatives aux gènes de la plante modèle transférées aux séquences EST et ARNm du tournesol permettent d’optimiser l’exploitation de ces séquences. Mon travail de thèse a donc consisté à mettre au point une méthode d’analyse massive du grand nombre de séquences de tournesol puis de tester expérimentalement les résultats de cette analyse afin d’obtenir de nouvelles informations sur l’organisation du génome du tournesol et d’estimer la conservation de synténie avec Arabidopsis. La mise en place de la méthodologie a abouti à la création d’un serveur web appelé Iccare. Cet outil bioinformatique permet la comparaison et l’analyse d’un grand nombre de séquences de différents organismes végétaux ou animaux avec les séquences codantes des gènes de l’organisme modèle respectif, Homo sapiens pour les animaux et Arabidopsis thaliana pour les végétaux. Les résultats sont présentés sous forme graphique en combinant les informations de similitudes aux informations structurales des gènes de l’organisme modèle (introns, régions UTR). La combinaison de ces informations permet ainsi d’optimiser l’exploitation de ces séquences en utilisant les outils couplés à Iccare (définir des amorces ou des sondes). En complément de Iccare, Synteny Search (en cours d’achèvement) est un site web qui permet de rechercher les relations existantes entre les gènes d’Arabidopsis et du riz (conservation de synténie) ainsi que les relations de ces gènes au sein d’un même génome (ils sont uniques, dupliqués ou appartiennent à des familles multigéniques). Cet outil donne des informations complémentaires sur les gènes sélectionnés à partir d’Iccare afin de vérifier et d’interpréter les résultats expérimentaux (nombre de fragments amplifiés ou de clones BAC positifs). Iccare a permis de sélectionner, parmi 60 200 séquences de tournesol, 20 691 séquences présentant des similitudes avec 3 635 gènes d’Arabidopsis. L’organisation du génome du tournesol et la conservation de synténie avec Arabidopsis ont été étudiées en utilisant des séquences EST de tournesol qui présentaient des similitudes avec 195 gènes localisés sur le chromosome 5 de la plante modèle. Cent cinquante neuf d’entre elles ont servi à définir des sondes Overgo dans deux régions différentes. Le criblage d’une banque de clones BAC avec ces sondes présente une efficacité supérieure à 70%. Des amplifications PCR sur une quarantaine de clones BAC positifs ont permis de confirmer la présence des séquences EST. Ce criblage a aussi démontré que la banque utilisée était peu couvrante pour les régions étudiées ne permettant pas le regroupement en contig des clones BAC de sondes voisines chez la plante modèle. Par contre, le regroupement des clones BAC positifs à une même sonde montre qu’il existe plusieurs localisations pour cette sonde, conformément aux informations préalables fournies par Synteny Search. Parallèlement aux hybridations, 51 séquences EST ont servi de matrice à la définition de couples d’amorces spécifiques de régions conservées de part et d’autre d’introns. L’amplification par PCR sur différents cultivars de tournesol présente une efficacité de 90% et le taux de polymorphisme de taille observé et vérifié sur gel d’agarose est de 15%, ce qui a permis d’intégrer 7 nouveaux marqueurs moléculaires à une carte génétique issue de lignées recombinantes (Rachid Al-chaarani et al., 2004). Ces 7 marqueurs ne sont pas liés entre eux et n’ont donc pas permis de définir de conservation de synténie entre tournesol et Arabidopsis. En conclusion, Iccare permet de facilement et rapidement traiter un grand nombre de données, de transférer les informations structurelles des gènes pour faciliter et optimiser la définition d’amorces et de sondes et d’interpréter les résultats expérimentaux à l’aide de Synteny Search. En revanche, l’organisation du génome du tournesol et la synténie existant avec Arabidopsis n’ont pas pu être évaluées clairement. Les données préliminaires obtenues laissent à penser que l’espace entre les gènes du tournesol semble proportionnel à la différence de taille observée avec le génome d’Arabidopsis, expliquant ainsi la difficulté à regrouper les clones BAC en contig. Un mode d’évolution du génome du tournesol possible est donc l’augmentation de distance intergénique pouvant être due à des transposons et rétrotransposons. ABSTRACT : The sunflower (Helianthus annuus L) is one of most cultivated oil-seed plant. His great genome size makes difficult the study of gene of interest (agronomic traits) especially that few information about it are available. Others plants or crops have more technical an financial means than for sunflower (physical map, massive genome and mRNA sequencing, duplication search, transposons. . .). In order to study the sunflower genome organization, we have developped a new method based ont synteny conservation with the model plant Arabidopsis thaliana. The transfert of gene information to the EST ou mRNA sequences of the sunflower permits to optimize the sequence exploitation. My thesis works consist in developping a new methology of massive analysis of sunflower sequences then test experimentally the results in order to get new information about the genome organization of the sunflower and to estimate the degree of synteny with the Arabidopsis genome. The methodology leads to the creation of a web server called Iccare. This bioinformatic tool permits to compare and analyse a high number of sequences from differents plants or animals organisms with the coding sequences of gene from the model organism which is respectively Homo sapiens for the animals and Arabidopsis thaliana for the plants. The results are displayed according to the location of the genes on the chromosomes of the reference organism. Genes structure information and sequence similarities are combined in a graphical representation in order to optimize the sequence exploitation by designing primers or probes. The Synteny Search web site (not finished yet) complete the Iccare web server, it permits to search the relation existing between the Arabidopsis genes and those of the rice (synteny conservation) and the relation between the genes within a genome (lonely genes, duplicated genes or genes belonging to multigenic family). This tool allows the access the information about the selected genes on Iccare in order to verify and interpret the experimental results (amplified fragment number or hybrided BAC clones). The Iccare web server had permit to select among 60,200 sunflower sequences, 20,691 sequences presenting similarities with 3,635 Arabidopsis genes. The genome organization of the sunflower and the synteny conservation with Arabidopsis had been studied by using EST sequences of the sunflower wich present some similarities to 195 genes located on the chromosome 5 of the model plant. One hundred and fifty nine EST sequences had been used to design Overgo probes in two differents regions of the fifth chromosome. These probes have been screened on a BAC clones library and over 70% were efficient. PCR amplification on forty BAC clones had confirmed the screening. The screening had also shown that the BAC clones library is less covering than expected in the studied regions. Some BAC clones had been fingerprinted and contig had been made showing different location for some Overgo probes according to the Synteny Search web site results. In addition to the screening, fifty one EST sequences had been used to design primer couple on conserved exons regions on both sides of an intron. PCR amplification on different sunflower cultivar with the primer couples presents 90% of efficiency and the size polymorphism rate on agarose is about 15%. Seven primer couples are used as molecular marker and are assigned on a genetic map (Recombinant Inbreed Lines). These molecular markers are not linked and any syntenic blocks can be defined between the sunflower genome and the Arabidopsis genome. In conlusion, the Iccare web server permits to facilitate and accelerate the traitement of high number data, to transfert structural information of genes in order to optimize the primer design and the probe design and to interpret experimental results aided by the Synteny Search web site. In spite of these new tools, the genome organization of the sunflower and the synteny conservation with the Arabidopsis genome are not elucidated. The preliminary data leave with thoughts that space between the sunflower genes seems proportional to the differente genome size between the sunflower genome and the Arabidopsis genome. These data can explain the difficulty to contig BAC clones. One evolution of the sunflower genome possibility is the increase of intergenic length due to transposons and retrotransposons.

Department or laboratory:Laboratoire de Biotechnologie et Amélioration des Plantes - BAP (Castanet-Tolosan, France)
Directeur de thèse:Gentzbittel, Laurent
Uncontrolled Keywords:Synthénie – Organisation de génome – Bioinformatique – Comparaison de génome – Sondes Overgo – Banque de clones BAC – Carte génétique - Tournesol
Subjects:Biology > Molecular and cellular biology and genetics - Biotechnology
Agronomy > Plant sciences
Deposited On:23 December 2005

Archive Staff Only: edit this record


Contacts | Infos légales | Plan du site | Intranet

(c)INP de Toulouse 2012 - Tous droits réservés. -  INP Communication