En julio de 2022, lanzamos predicciones de estructuras proteicas de AlphaFold para casi todas las proteínas catalogadas científicamente hasta ahora. En nuestro último blog aquí. Estoy extraordinariamente orgulloso y emocionado de anunciar que DeepMind está haciendo una importante contribución a este tema. Una semana atrás, publicamos un documento científico y el código fuente explicando cómo hemos creado este sistema innovador.
Hoy en día estamos compartiendo predicciones de alta calidad sobre la forma de cada una de las proteínas en nuestro cuerpo humano, así como para las proteínas de 20 organismos más confiables para la investigación de enfermedades y otros grandes problemas que enfrenta el mundo, como la resistencia a los antibióticos, la contaminación microplástica y el cambio climático. Estas nuevas conocidas sobre la estructura de las proteínas beneficiarán al ser humano. Las proteínas son como pequeñas máquinas biológicas que se encargan de realizar tareas específicas en nuestro cuerpo y una vez que sabemos su estructura, podemos comprender mejor cómo funcionan. Hoy estamos compartiendo un trove de información que duplica la comprensión de la humanidad sobre el proteoma humano e incluye las estructuras proteicas encontradas en otros 20 organismos biológicamente significativos, desde E.coli hasta levadura y la mosca de la fruta hasta el ratón. Hemos mejorado la precisión media de las predicciones en el modelado libre para el equipo mejor clasificado de cada CASP, medido por el mejor GDT de los 5. Este mes hemos cumplido con nuestra promesa enorme de trabajo duro al publicar dos artículos revisados por pares en Nature (1,2) y código abierto AlphaFold. Hoy estamos asociados con EMBL-EBI para lanzar la base de datos AlphaFold Protein Structure Database, que ofrece la imagen más completa y precisa del proteoma humano hasta la fecha y duplica el conocimiento acumulado sobre estructuras proteicas humanas de alta precisión. Además del proteoma humano (todas las ~20,000 proteínas expresadas por el genoma humano), estamos proporcionando acceso abierto a la Proteomas de otros 20 organismos biológicamente relevantes, con un total de más de 350.000 estructuras proteicas. En los próximos meses planeamos ampliar enormemente la cobertura a casi todas las proteínas secuenciadas conocidas. A lo largo del mundo se espera que esta nueva base de datos permita y acelere la investigación sobre estos bloques de construcción de la vida, dando como resultado avances en el desarrollo de fármacos para enfermedades desatendidas, en ingeniería enzimas rápidas para reciclar plásticos contaminantes y en el estudio de la resistencia a los antibióticos. Además, un grupo en la Universidad de California San Francisco ha utilizado las predicciones de AlphaFold para aumentar su comprensión de la biología SARS-CoV-2. Existe un tesoro de datos que ahora esperan ser transformados en avances futuros. AlphaFold abre nuevos horizontes de investigación, y es inspirador ver una IA avanzada que permite trabajar en enfermedades inusuales. Ben Perry, líder del equipo de innovación abierta de la Iniciativa sobre Enfermedades (DNDi) de Descubierto Drogas, comentó sobre este trabajo que representa la culminación de cinco años de esfuerzo, incluyendo superar obstáculos desafiantes, resultando en una serie de innovaciones algorítmicas sofisticadas. Estas innovaciones se basan en los descubrimientos de generaciones de científicos, desde las primeras imágenes de proteínas y cristalografía hasta miles de especialistas en predicción y biólogos estructurales que han pasado años trabajando.
Nuestro sueño es que AlphaFold ayude a muchos más científicos en su trabajo, abriendo completamente nuevas vías de investigación científica. Lo que llevó meses y años hacer, AlphaFold fue capaz de hacerlo en un fin de semana. El Dr. Mark Lorch, director del Centro de Innovación de Enzimas (CEI) de la Universidad de Portsmouth, también comentó sobre esto.