Les chercheurs fabriquent leur propre génome d'E. Coli, compressent son code génétique

Le code génétique est la base de toute vie, permettant de traduire les informations présentes dans l'ADN en protéines qui assurent la plupart des fonctions d'une cellule. Et pourtant, c'est… une sorte de désordre. La vie utilise généralement une suite d'environ 20 acides aminés, alors que le code génétique dispose de 64 combinaisons possibles. Cette inadéquation signifie que la redondance est généralisée et que de nombreuses espèces ont évolué vers des variantes de ce qui serait autrement un code génétique universel.

Le code lui-même est-il significatif ou s'agit-il d'un accident historique bloqué par des événements survenus dans un lointain passé? Répondre à cette question n'était pas une option jusqu'à récemment, car des codes individuels apparaissent à des centaines de milliers d'endroits dans le génome d'organismes, même les plus simples. Mais à mesure que notre capacité à fabriquer de l'ADN s'est développée, il est devenu possible de synthétiser des génomes entiers à partir de rien, permettant ainsi une réécriture complète du code génétique.

Maintenant, les chercheurs annoncent qu'ils ont refait le génome de la bactérie E. coli se débarrasser d'une partie de la redondance du code génétique. Les bactéries qui en résultent se développent un peu plus lentement qu'une souche normale mais sont difficiles à distinguer de leurs homologues non synthétiques.

Codes et redondance

Le code génétique est énoncé dans des ensembles de trois bases ADN. Chacune des trois positions peut contenir n'importe laquelle des quatre bases, ce qui signifie qu'il y a 4 x 4 x 4 combinaisons possibles, ou 64. En revanche, il n'y a que 20 acides aminés, tandis qu'au moins un des codons restants doit être utilisé pour dites à la cellule d'arrêter de traduire le code. Cela laisse une inadéquation de 43 codes qui ne sont pas strictement nécessaires. Les cellules utilisent ces codes supplémentaires comme redondance; au lieu d'un code stop, la plupart des génomes en utilisent trois. Dix-huit des 20 acides aminés sont codés par plus d'un ensemble de trois bases; deux ont jusqu'à six codes possibles.

Cette redondance est-elle utile? La réponse est "parfois". Par exemple, de nombreuses séquences d'ADN remplissent une double fonction, codant à la fois une protéine et des informations régulatrices qui contrôlent l'activité des gènes ou permettent à des structures spécifiques d'ARN de se former. La flexibilité de la redondance permet à une séquence de remplir plus facilement deux objectifs. La redondance peut également permettre d'affiner l'activité des gènes, car certains codes sont traduits en protéines plus efficacement que d'autres. Ces facteurs suggèrent que la redondance du code génétique aurait pu devenir essentielle pour un organisme.

Tester si tel est le cas, cependant, est un peu un cauchemar. Même les génomes les plus compacts ont des centaines de gènes (E. coli 4 000 à 5 500 souches différentes) et tous les codes individuels peuvent apparaître plusieurs fois dans chacune d’elles. Éditer chacun de ces éléments est possible mais prend énormément de temps.

Les chercheurs ont donc simplement recodé les choses sur un ordinateur. Se concentrant sur l'un des acides aminés comportant de multiples codes redondants, ils ont peaufiné les séquences afin que plus de 18 000 utilisations individuelles de deux codes soient remplacées par une option redondante. Avec le génome synthétique conçu, il suffisait de le scinder en morceaux pouvant être commandés à partir d’un synthétiseur d’ADN.

C'est plus facile qu'il n'y paraît, selon l'un des chercheurs impliqués (et lecteur habituel d'Ars), Wolfgang Schmied. "Avec un projet comme celui-là, où vous posez des questions sur les règles du code génétique, vous devez vous engager à commander un génome d'ADN synthétique", a-t-il déclaré à Ars, "qui est un engagement financier plutôt important et non bouton facile à appuyer. " Pourtant, appuyez sur ce qu'ils ont fait.

Assemblage requis

Malheureusement, il existe un grand fossé entre ce qu'une machine de synthèse d'ADN peut produire et le génome long de plusieurs millions de bases. Le groupe devait effectuer tout un processus d'assemblage, assembler de petits morceaux en un grand segment dans une cellule, puis les transférer dans une cellule différente dont le grand segment se chevauchait. "Personnellement, ma plus grande surprise a été la qualité du processus d'assemblage", a déclaré Schmied. "Le taux de réussite à chaque étape était très élevé, ce qui signifie que nous pouvions effectuer la majorité du travail avec des techniques de banc standard."

Au cours du processus, il y a eu quelques problèmes où le génome synthétique s'est retrouvé avec des problèmes - dans au moins un cas, il s'agissait de la superposition de deux gènes essentiels. Mais les chercheurs ont pu peaufiner leur version pour résoudre les problèmes identifiés. Le génome final comportait également une poignée d'erreurs qui se sont produites au cours du processus d'assemblage, mais aucune d'elles n'a modifié les trois codes de base ciblés.

En fin de compte, cela a fonctionné. Plutôt que d’utiliser 61 des 64 codes potentiels pour les acides aminés, le nouvel organisme, baptisé Syn61, en utilise seulement 59. Les chercheurs ont ensuite été en mesure de supprimer les gènes qui permettent normalement E. coli utiliser les codes redirigés. Normalement, ces gènes sont essentiels. dans Syn61, ils pourraient être supprimés sans problème. Cela ne veut pas dire que la souche Syn61 est très bien; il a grandi plus lentement que ses pairs normaux. Mais ceci est probablement le résultat de tous les cas décrits précédemment, dans lesquels les séquences d'ADN remplissaient plus d'une fonction. Avec le temps, il est possible que la contrainte revienne à un taux de croissance normal.

En plus de répondre à des questions sur la biologie fondamentale, la souche Syn61 pourrait finalement être utile. Il y a beaucoup plus d'acides aminés que ceux utilisés dans la vie, et beaucoup d'entre eux ont des propriétés chimiques intéressantes. Pour les utiliser, cependant, nous avons besoin de codes génétiques en réserve pouvant être redirigés vers les acides aminés artificiels - précisément ce que ce nouveau travail a fourni.

La nature, 2019. DOI: 10.1038 / s41586-019-1192-5 (À propos des DOI).