En plus de révolutionner l’industrie et la médecine, l’ADN pourrait bien offrir le réceptacle idéal pour stocker nos données numériques.
En plus de révolutionner l’industrie et la médecine, l’ADN pourrait bien offrir le réceptacle idéal pour stocker nos données numériques.
Et si à l’avenir, nos données informatiques n’étaient plus stockées dans des serveurs informatiques géants, mais dans des molécules d’ADN ? L’idée peut sembler surprenante, voire carrément tirée d’une œuvre de science-fiction. Pourtant, la DARPA, agence du département de la Défense américaine chargée de la recherche dans les nouvelles technologies, étudietrès sérieusement cette piste. Elle possède même un programme dédié au stockage de données informatiques dans des molécules (qui incluent l’ADN, mais pas seulement), le Molecular Informatics Program (Programme d’informatique moléculaire).
Lancé l’année dernière, celui-ci a déjà investi plusieurs millions de dollars dans des projets de recherche menés par diverses facultés américaines, dont Brown, Harvard, ainsi que les universités de l’Illinois et de Washington. En 2016, cette dernière est parvenue, en collaboration avec Microsoft, à stocker un morceau de musique entier sur de l’ADN, battant ainsi le record de la plus grosse quantité de données jamais hébergée sur ce support. Pour révolutionner la manière dont nous conservons l’information, les chercheurs de Microsoft et de l’université de Washington peuvent également compter sur l’aide d’une jeune pousse installée à San Francisco, et spécialisée dans la création d’ADN de synthèse, Twist Bioscience.

Les locaux de la start-up sont installés dans le Dogpatch, vieux quartier industriel situé à l’est de San Francisco. De l’autre côté de la Baie, par-delà la grande étendue céruléenne aux reflets d’argent, les bâtiments de la ville d’Oakland ressemblent à des maisons de poupées aux contours indécis, tremblotants sous les rayons du Soleil. Les usines et entrepôts qui façonnent le paysage du Dogpatch, provisoirement laissés à l’abandon durant la seconde moitié du XXesiècle, connaissent aujourd’hui une nouvelle jeunesse grâce à l’essor des nouvelles technologies. Les anciennes usines désaffectées accueillent une foule de start-up, les entrepôts sont retapés en bars branchés, cafés haut de gamme et restaurants de sushis, les dockers ont cédé la place aux hipsters à chemises à carreaux.
Ultime signe du vent de dynamisme qui souffle sur le quartier : les chantiers de construction, omniprésents. Pour se rendre jusqu’au bâtiment où loge Twist Bioscience, on slalome ainsi entre les hommes casqués, les bétonneuses et les camions, au milieu du vacarme des marteaux piqueur. Fort contraste avec les larges bureaux que Twist Bioscience partage avec différentes start-up, où règne, en cette heure matinale, un calme olympien, seulement rythmé par le bruit des touches enfoncées sur les claviers. Par la grande baie vitrée, on dispose d’une vue surplombante sur la baie. Les derniers nuages de brume matinale s’évaporent à la surface de l’eau.
1-L’art de la synthèse
Coïncidence amusante : Twist Bioscience a récemment été plébiscité pour avoir stocké le morceau « Smoke on the Water » de Deep Purple (ainsi que « Tutu » de Miles Davis) sur de l’ADN, en collaboration avec ses partenaires de Microsoft et de l’université de Washington. Car la start-up met son ADN créé en laboratoire au service d’une foule de projets révolutionnaires. Avant de les passer en revue, effectuons un rapide bond dans les années 1960.

Emily leproust PDG Twist Bioscience
Emily leproust PDG Twist Bioscience
Au début du film Le Lauréat, M. McGuire, homme d’affaires prospère, prend à part Benjamin, jeune diplômé ingénu joué par Dustin Hoffman. Sans tergiverser, il lui conseille de faire carrière dans « le plastique », industrie selon lui promise à un grand avenir. Non seulement la scène est devenue culte, mais le flair de M. McGuire ne l’avait pas trompé : le plastique est aujourd’hui omniprésent. Or, il est essentiellement fabriqué à partir de pétrole, une énergie fossile, donc épuisable, et de surcroît nuisible pour l’environnement. Mais selon Emily Leproust, PDG de Twist Bioscience, les choses pourraient bientôt changer. « Si vous avez accès à de l’ADN de synthèse, vous pouvez manipuler le génome de la levure, de façon à ce que, lorsque cette dernière fermente le sucre, vous obteniez de l’acide adipique en lieu et place de l’alcool. Et à partir de cet acide adipique, vous pouvez ensuite fabriquer du nylon ! » explique-t-elle.
Il devient donc possible d’obtenir du plastique par fermentation, comme on fabrique de la bière. Bienvenue à l’ère de l’ingénierie bio. On peut ainsi fabriquer des tapis, mais aussi des pneus ou encore des bouteilles en plastique sans avoir recours au pétrole. Cerise sur le gâteau : cette méthode de production est non seulement plus écologique, mais aussi moins coûteuse que les techniques traditionnelles. L’ADN de synthèse permet également de générer de nouveaux matériaux, existants dans la nature mais jusqu’ici inutilisables par l’homme.
C’est notamment le cas de la soie d’araignée. Ce matériau possède des propriétés étonnantes : à la fois très léger et plus résistant que l’acier, il serait capable, à l’échelle humaine, de stopper un train lancé à pleine vitesse. Mais il est impossible d’élever des araignées pour récolter leur soie : les bestioles s’entre-tuent systématiquement. Grâce à l’ADN de synthèse, on peut, selon Emily Leproust, isoler le gène qui permet aux araignées de fabriquer de la soie et, en recourant au même procédé de fermentation, fabriquer de la soie d’araignée artificielle.
Les variations sur ce thème sont infinies. L’un des clients de Twist Bioscience, Gingko Bioworks, est parvenu à isoler le gène qui génère le parfum des roses. En ajoutant levures et sucres au mélange, on obtient ainsi de l’extrait de rose plus vrai que nature qu’on peut incorporer dans des fragrances haut de gamme. Un autre client, Evolva, recourt à un procédé similaire pour fabriquer de l’extrait de vanille.
Mais l’usage de l’ADN de synthèse ne s’arrête pas là. Les applications sont également prometteuses dans la santé, notamment pour la découverte de nouveaux médicaments. « Les laboratoires testent des millions d’anticorps différents, pour trouver celui qui permet de résister le mieux à la maladie », indique Emily Leproust. « Or, pour chaque anticorps testé, il faut un échantillon d’ADN. En diminuant le coût de ces échantillons, on accélère la recherche. » Twist Bioscience travaille actuellement avec neuf grands laboratoires pharmaceutiques.
Troisième usage possible de l’ADN de synthèse : lutter contre la faim dans le monde, en générant des récoltes qui ne soient plus dépendantes de l’usage d’engrais. Ces derniers reposent sur un principe simple : il s’agit notamment d’alimenter la plante en azote, pour accélérer sa croissance. On recourt pour cela à divers procédés chimiques, qui impliquent souvent de brûler du pétrole.

Twist Bioscience
Twist Bioscience
Afin d’éviter cette étape nuisible à l’environnement, un client de Twist Bioscience emploie l’ADN de synthèse pour modifier l’une des bactéries situées dans le sol, de façon à ce que cette bactérie capture automatiquement l’azote dans l’air et le transmette ensuite à la plante. On obtient ainsi des récoltes qui n’ont besoin ni d’engrais, ni d’OGM, puisqu’elles tirent directement leur azote du sol. À la clé, une agriculture plus saine et susceptible de nourrir davantage de personnes. Tout cela est fascinant, mais reste à comprendre comment ça marche.
2-Grammaire de l’ADN
Les progrès réalisés en matière d’ingénierie génétique ont été fulgurants au cours des dernières décennies. Tout commence en 1953, lorsque James Watson et Francis Crick, deux jeunes chercheurs en biologie, identifient pour la première fois la structure en double hélice de l’ADN. Cette découverte permet de comprendre comment l’information génétique se copie et se transmet. En d’autres termes, le code génétique peut désormais être décrypté.
Dans les années 1970 sont mises au point les premières méthodes permettant de séquencer l’ADN, c’est-à-dire de décoder l’information nécessaire aux êtres vivants pour survivre et se reproduire. En 1977, on parvient ainsi à séquencer le tout premier génome, celui du virus Phi X174. Il faut toutefois attendre l’an 2000 pour parvenir pour la première fois à séquencer l’intégralité du génome humain. Voilà pour l’aspect « lecture » de l’ADN. Twist Bioscience, de son côté, est spécialisé dans « l’écriture », la création d’ADN de synthèse. « Pour lire l’ADN, on prend un échantillon, on l’analyse avec une machine, et on en extrait les données. L’écriture, c’est exactement l’inverse : on part des données, et, à l’aide d’une machine, on crée un échantillon d’ADN correspondant », explique Emily Leproust.

Dans le laboratoire de Twist Bioscience
Dans le laboratoire de Twist Bioscience
Si Twist Bioscience n’a pas inventé ce procédé, la jeune pousse affirme en revanche avoir considérablement accru son efficacité, en s’inspirant des progrès effectués dans le séquençage d’ADN. « Dans les années 2000, séquencer la totalité du génome humain coûtait trois milliards de dollars », relate Emily Leproust. « Aujourd’hui, le prix a chuté à environ 1 000 dollars. Cette baisse considérable a été permise par la miniaturisation : des entreprises comme 454 Life Sciences ou Illumina sont parvenues à réduire la taille des échantillons d’ADN utilisés, afin d’obtenir une technique plus efficace à un coût réduit. Nous avons fait la même chose côté écriture. »
Lancée en 2013, la start-up a eu recours à des techniques d’ingénierie de pointe. Là où l’on utilise traditionnellement des tablettes en plastique pour stocker les échantillons d’ADN, l’entreprise utilise du silicium. L’usage de ce minéral résistant à la chaleur, également employé dans la confection des ordinateurs (et qui, accessoirement, donne son nom à la Silicon Valley), permet de miniaturiser les échantillons.
Ainsi, alors qu’une plaquette traditionnelle contient 96 échantillons d’ADN, la version silicium confectionnée par Twist Bioscience recèle un million d’échantillons sur la même surface, ce qui permet de réduire considérablement les coûts. L’aspect innovant de la start-up se situe donc du côté de l’ingénierie plutôt que de la biologie pure et dure. Il s’agit, à proprement parler, d’une « innovation produit ». Mais les applications de cette innovation dans le domaine de la biologie sont, elles, stupéfiantes.
Car si Twist Bioscience a été fondée par des ingénieurs, ses clients sont bel et bien des laboratoires de recherche en biologie, pour qui la jeune pousse fabrique des échantillons d’ADN sur commande, au service de leurs expérimentations. « Lorsque vous faites de la recherche », explique Emily Leproust, « vous devez en permanence effectuer des expériences. Plus vous avez d’échantillons d’ADN à votre disposition, plus vous pouvez tester d’hypothèses différentes. En réduisant les coûts, nous leur permettons ainsi de tester davantage d’idées et de concrétiser davantage de projets. »
3-Le monde dans une séquence
Ces fulgurants progrès dans la maîtrise de l’ADN suscitent aujourd’hui de nombreux espoirs autour de l’usage de cette molécule pour stocker les données numériques. Ce qui nous ramène à Deep Purple. Car de tous les projets évoqués, celui-ci est peut-être à la fois le plus important et le plus complexe. Avec le développement d’Internet et des objets connectés, nous produisons aujourd’hui une quantité de données sans précédent. Ainsi, plus de données ont été générées durant la seule année 2017 qu’au cours des 5 000 années précédentes de l’histoire de l’humanité. Elles sont aujourd’hui stockées sur de gigantesques serveurs.
L’ADN du mammouth a traversé des milliers d’années pour parvenir jusqu’à nous totalement intacte.
Mais cette méthode a plusieurs défauts. Elle prend de la place et pollue : Internet est ainsi aujourd’hui responsable de 3 % des émissions de carbone mondiales. En outre, elle n’est pas durable. Les données stockées sur une cassette électromagnétique doivent être réenregistrées en moyenne tous les sept ans. Enfin, la miniaturisation de l’informatique (exprimée par la loi de Moore) – qui, au cours des soixante dernières années, nous a permis de réduire continuellement la taille du matériel nécessaire pour stocker l’information – ne pourra se poursuivre éternellement. Il adviendra forcément un moment où notre ingénierie se heurtera aux lois de la physique.
C’est ici que l’ADN entre en jeux. « Un fichier informatique est composé de 0 et de 1 », explique Emily Leproust. « Mais ce code en base 2 peut être facilement converti en un code en base 4, comprenant donc les chiffres 0, 1, 2 et 3. Et à partir de ce code en base quatre, on peut ensuite convertir le fichier en utilisant les quatre lettres de l’ADN, A, C, G, T. On peut ainsi prendre n’importe quel fichier numérique et le convertir sous forme d’ADN. »

Cette dernière possède plusieurs avantages. Elle est d’abord durable : l’ADN du mammouth et de l’homme de Neandertal ont ainsi traversé des milliers d’années pour parvenir jusqu’à nous totalement intactes. En outre, l’ADN est très économe en matière d’espace : stocker un petabyte de données, soit l’équivalent de mille disques durs, prendrait, sous forme d’ADN, la taille d’un grain de sable. On pourrait ainsi stocker l’intégralité des données disponibles dans le monde dans l’équivalent d’un semi-remorque. Les serveurs requièrent d’importantes quantités d’énergie pour refroidir les circuits et éviter la surchauffe. La taille de l’ADN étant négligeable, l’énergie mobilisée pour le refroidissement serait également bien plus faible : l’équivalent de la consommation d’une ampoule pour tout un centre de données. Enfin, la copie prend beaucoup moins de temps qu’en version numérique.
Le principal inconvénient réside pour l’heure dans le coût de cette méthode de stockage, qui demeure prohibitif. C’est pourquoi Twist Bioscience travaille aujourd’hui avec Microsoft, l’université de Washington et l’École polytechnique fédérale de Lausanne autour d’un projet de recherche visant à diminuer ce coût. C’est dans le cadre de celui-ci que les morceaux de Deep Purple et Miles Davis ont été stockés dans de l’ADN.

En 2012, des chercheurs de l’université Harvard avaient déjà fait de même avec le contenu d’un livre. Plus récemment, des chercheurs de cette université ont remis le couvert en sauvegardant les diapositives d’Eadweard Muybridge qui, mises bout à bout, montrent un cavalier au pas de course et constituent l’ancêtre de la vidéo, sur une séquence d’ADN. C’est aussi pourquoi, depuis l’an passé, le DARPA mobilise d’importantes ressources financières pour développer le stockage ADN.
Un autre danger pèse toutefois sur cette méthode de stockage révolutionnaire. Si l’ADN n’est pas un support numérique, elle n’est pas pour autant à l’abri des hackers. Ainsi, l’an passé, des chercheurs de l’université de Washington ont démontré qu’il est possible d’encoder un logiciel malveillant dans une séquence ADN. Lorsque cette dernière est lue et téléchargée sous forme de données par un ordinateur, le logiciel n’a plus qu’à infecter celui-ci.
Les chercheurs affirment toutefois que ce type de menace demeure pour l’heure cantonnée à un horizon lointain. À condition que l’on parvienne à compresser les coûts et à se prémunir des biohackers, le stockage des données sur l’ADN pourrait donc bel et bien s’imposer comme le moyen le plus efficace et responsable de sauvegarder nos informations numériques dans un monde post-serveurs. En 2018, Emily Leproust a été bien avisée de choisir de faire carrière dans l’ADN plutôt que dans le plastique.