Version française

Tuesday October 21 2008

Systèmes complexes

Un chercheur du LPCV en collaboration avec une équipe du laboratoire TIMC-IMAG utilise les propriétés des systèmes auto-organisés pour définir de nouveaux systèmes calculatoires inspirés des systèmes vivants.


Après avoir développé de nouvelles approches théoriques pour l'analyse de séquences biologiques afin de comprendre l'évolution du groupe des apicomplexa (groupe d'unicellulaires parasites contenant notamment Plasmodium falciparum, agent de la malaria, et Toxoplasma gondii, agent de la toxoplasmose) au sein du laboratoire PCV, Olivier Bastien s'est tourné vers l'étude des systèmes complexes possédant la capacité de s'auto-organiser. En collaboration avec une équipe du laboratoire TIMC-IMAG et avec un soutien financié de l'institut des systèmes complexes (IXXI), il évalue l'avantage que procure l'auto-organisation par rapport à la fonction de ces systèmes. Cette étude se place dans le cadre du bioputing, discipline visant à s'inspirer de systèmes vivants pour le développement de nouvelles procédures, au sens large, de calculs.

De la comparaison de séquences protéines...

Pouvoir comparer des séquences biologiques telles que les protéines est crucial à plusieurs niveaux. Du point de vue de l'expérimentateur, c'est avoir la possibilité d'obtenir des informations sur sa protéine d'intérêt à partir d'un transfert de connaissances obtenues par identification d'une protéine dite homologue (protéine ayant un ancêtre commun avec celle d'intérêt). Le théoricien va s'intéresser à la double question : qu'est-ce qui permet de dire qu'une protéine est proche d'une autre ou non (notion de distance dans un « espace de protéines »), comment peut on relier cette distance avec l'histoire évolutive des organismes (la phylogénie moléculaire).

La recherche d’homologies se fait par comparaison (on parle d’alignement) des séquences primaires d’acides aminés en utilisant une fonction de similarité. Chaque alignement est alors quantifié par un score et une probabilité attachée à ce score. En effet, le score en lui-même n’est pas indicatif car il s’agit d’une mesure absolue, sans objet de référence. Une manière de le rendre pertinent est de le comparer aux valeurs de scores qui sont engendrées par des séquences de type « aléatoires », c’est à dire sans fonctions biologiques a priori.
Olivier Bastien, biologiste théoricien et chercheur au laboratoire Physiologie Cellulaire Végétale développe des modèles permettant aux chercheurs expérimentaux de mieux comprendre les mécanismes cellulaires fondamentaux. Durant ces trois dernières années il a travaillé sur les ponts existant entre la théorie de l’analyse de séquences et les théories mathématiques de la communication (théorie de l’Information) et de la fiabilité. Cette dernière permet d'aborder une séquence protéique comme un système complexe formé d'entités semblables (les acides aminés) et dont on peut, à partir de leurs propriétés, déduire celle du système entier (notion d'émergence).
L’approche originale développée par O. Bastien a entre autre permit d’établir que la loi de distribution des scores, loi indispensable pour établir une parenté possible entre deux séquences, est reliée à l’histoire évolutive entre les séquences et peut en être déduite.

Cette étude a été mis à profit pour mieux comprendre l’évolution du groupe des apicomplexa (unicellulaires parasites dont Plasmodium falciparum, agent de la malaria, et Toxoplasma gondii, agent de la toxoplasmose). Ses travaux ouvrent la voie à une possible augmentation de la sensibilité des méthodes de détection de séquences homologues.

FOCUS : L’approche originale choisie par Olivier Bastien pour calculer la forme de la loi de probabilités de scores d’alignements entre une protéine a et b a été la suivante : Partant d’une protéine a, on calcule la probabilité d’alignement avec b comme étant la probabilité pour que a se transforme en b suite à différents scenarii évolutifs. Le calcul de la loi se fait en utilisant (i) les résultats obtenus par Bastien et al. et qui démontrent que les scores entre acides aminés correspondent aux Informations Mutuelles entre les résidus dans la théorie de l’information et (ii) de nouveaux théorèmes ayant trait à la théorie de la fiabilité. Ce travail a également fait l’objet d’une généralisation utilisant le fait que l’Information Mutuelle entre séquences est quantifiée : c’est à dire qu’une séquence biologique ne peut évoluer que par pas discrets (mutation, etc…).



...à l'étude de systèmes auto-organisés pour la bio-computation.

En collaboration avec Nicolas Glade, un chercheur du laboratoire TIMC-IMAG de l'Université Joseph Fourier et grâce à un soutien financier de l'Institut des Systèmes Complexes (IXXI), Olivier Bastien étudie également une classe particulière de systèmes complexes : les assemblages fibrillaires se comportant comme des agents capables de s'auto-organiser par des phénomènes de taxie (déplacements au sens large). Leur objectif est de formaliser leur comportement, en particulier les 'collisions' entre agents. Ces chercheurs ont pour but de quantifier l'efficacité de la structuration microscopique de ces systèmes auto-organisés macroscopiques, en fonction de leur type, de leur échelle et des conditions environnementales.

La nature encode des procédures (une réaction métabolique, une recherche de nourriture…) sous la forme de fonctions intrinsèques d'éléments processeurs discrets tels que des molécules isolées, des hyper structures moléculaires, des cellules ou des organismes (des enzymes, des fourmis…). Lorsque ces fonctions ont pour origine la dynamique collective des éléments processeurs, elles sont dites émergentes. Tout système physique ou biologique est potentiellement assimilable à un système computationnel. De tels systèmes alternatifs à l'électronique classique (peu flexible, non adaptative) sont vus massivement parallèles, non fondés sur le silicium, sans architecture prédéfinie et reconfigurables.
Les « trail systems » sont une classe particulière de systèmes collectifs. Ce sont des agents individuels qui se meuvent dans leur environnement, modifiant ce dernier le long de leur trajectoire en relâchant des composés chimiques qu'ils produisent ou en 'gravant' une sorte de chemin. Leurs 'traînées' sont de nature variable (régions concentrées de composés chimiques, chemins gravés physiquement, sillages hydrodynamiques) et peuvent avoir divers effets sur les autres agents présents dans leur voisinage, causant une inhibition ou un accroissement de leurs activités ou encore le changement de leurs trajectoires. Bien que de nature et d'échelle très hétérogènes, ces systèmes ont en commun un certain nombre de propriétés et de comportements : ils sont composés d'agents et de traînées diffuses, et leur comportement souvent non linéaire dépend d’un grand nombre de paramètres mais en tirent avantage pour optimiser leurs taches (recherche de trajectoires, la chasse). Parmi ces système, on peut citer plusieurs systèmes connus comme les insectes sociaux, les oiseaux en vol en formation, les bactéries chimiotactiques… Il existe aussi des systèmes naturels microscopiques se comportant ainsi tel que les fibres biologiques du cytosquelette (microtubules, les filaments d'actine). Certains peuvent aussi être conçus artificiellement (nano-tubes d'ADN, nano-tubes dynamiques de carbone). De tels systèmes sont assimilables à des processeurs constitués de populations de machines de Turing s'auto-organisant et qui traitent, de façon massivement parallèle, l'information. Ainsi, les taches d'optimisation telles que la recherche de trajectoires leurs sont naturelles et ils peuvent établir par auto-organisation des circuits dynamiques auto-adaptatif et reconfigurables.

La preuve de concept a déjà été validée et est en cours de soumission (Glade and Bastien), l'objectif de cette étude étant de développer une approche inspirée de ces systèmes pour proposer des solutions alternatives à la computation. Pour cela, il est nécessaire de bien comprendre comment fonctionnent les « trail systems ». Ainsi, ces chercheurs souhaitent étudier leurs capacités à s'auto-organiser aux différentes échelles et dans des conditions diverses.


> CONTACT : Olivier Bastien
Laboratoire de Physiologie
Cellulaire Végétale
(iRTSV/PCV)





RÉFÉRENCES

  1. Bastien et al. Bioinformatics, 2004, 20: 534-537
  2. Bastien et al. Comptes Rendus Biologies, 2005, 328: 445-453
  3. Bastien et al. BMC Bioinformatics, 2005, 6: 49
  4. Bastien O and Maréchal E. BMC Bioinformatics, 2008, 9: 332
  5. Bastien O. Evolutionnary Bioinformatics, 2008, 4: 41-45 (2nd Article le plus lu de l'année)