Una investigación internacional en la que participa el Instituto de Biología Integrativa de Sistemas (I2SysBio), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universitat de València, ha conseguido completar las versiones 4 y 5 del genoma de referencia de la vid (Vitis vinifera) en las que se encuentran una gran cantidad de genes relacionados con la respuesta al estrés por plagas, por la falta de agua o genes determinantes de la capacidad aromática de los frutos. La información obtenida permitirá diseñar un viñedo más resistente al cambio climático y a los problemas fitosanitarios.

Si bien la secuenciación de la vid se completó, por primera vez, en 2007, esta primera versión y las que le siguieron estaban incompletas, con muchas regiones aún desconocidas. Muchos de estos fragmentos del genoma, que ahora han sido correctamente ensamblados, corresponden a regiones centroméricas y teloméricas (es decir, del centro y los extremos de los cromosomas), que estaban constituidas de un considerable número de repeticiones que hacía difícil su lectura, motivo por el cual no se tenían en versiones anteriores del genoma.

Contar con la mejor versión de un genoma abre las puertas a conocer la totalidad de los genes de una especie. Ahora, y gracias a esta investigación, se podrá estudiar la función de todos ellos y se podrá asociar a caracteres de interés para la industria vitivinícola, mediante la utilización de herramientas de la biología computacional. En este sentido, la mejora genética, mediante métodos tradicionales (breeding), también se podrá beneficiar.

La versión 4 del genoma demostró el pedigrí del cultivo utilizado llamado PN40024. Inicialmente se creía que correspondía a la variedad Pinot Noir, cruzada nueve veces por endogamia, pero el análisis genómico posterior demostró que era en realidad la variedad Helfnsteiner (un cruce entre Pinot Noir y Schiava Grossa). Esta versión también permitió generar un recurso muy valorado: una anotación de todos los genes del genoma manualmente curada por miembros de la comunidad científica. Con la versión 5 del genoma, ya está disponible la secuencia completa del genoma de la vid.

La tecnología empleada se basa en la secuenciación de fragmentos largos (long read sequencing). Se trata de una técnica de secuenciación de ADN que permite secuenciar fragmentos de ADN mucho más largos que los métodos tradicionales de lectura corta. Mientras que la versión 4 utiliza la tecnología estándar de PacBio de secuencias largas, la versión 5 utiliza la tecnología HIFi o de alta fidelidad, que proporcionan una alta resolución con una precisión de lectura de una sola molécula del 99,9%.

Los dos trabajos científicos, publicados en las revistas Horticulture Research y G3 Genes|Genomes|Genetics, han sido desarrollados en el marco del proyecto Cost Grapedia, una base de datos federativa propuesta como una plataforma de acceso abierto destinada a abordar los desafíos en el acceso y utilización de los datos genéticos, ómicos y de fenotipado relacionados con la vid. José Tomás Matus, investigador del Programa Ramón y Cajal de la Universitat de València y el I2SysBio (CSIC – UV), es el coordinador de esta iniciativa financiada por la Oficina Europea Cost (Cooperation in Science and Technology).

Los autores de estas dos publicaciones científicas forman parte de un consorcio formado por varios institutos, que incluyen, entre otros, al I2SysBio, el Instituto Nacional para la Investigación Agronómica de Francia, la Academia China de Ciencias Agrícolas y el Centro de Investigación y Tecnología Agroalimentaria de Aragón (CITA).