Información

Cómo encontrar el aminoácido en la proteína del ADN

Cómo encontrar el aminoácido en la proteína del ADN



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

3 'A T A G T A C C G C A T G T A C G G G C G A G A C A T T C G A G C A T T C A T 5'

Esto un Plantilla de ADN.

¿Cómo encontrar la cantidad de aminoácidos aminoácidos en la proteína codificada por el gen anterior?

La respuesta es $ 7 $.

Mi intento:

Primero convertí el ADN anterior en ARN y obtuve

5 'U A U C A U G G C G U A C A U G C C C G C U C U G U A A G C U C G U A A G U A 3'

Luego encontré el codón de inicio que es A U G

5 'U A U C | A U G | G C G U A C A U G C C C G C U C U G U A A G C U C G U A A G U A 3 '

A partir de aquí no entiendo cómo proceder.

¿Alguien puede explicar cómo resolver esto?


Entonces solo tienes que leer el codón hasta llegar a un codón de parada. Hay tres codones de paradaUAA,UGAyUAG. Entonces, en tu ejemplo ...

Inicio Parada 5 'U A U C | A U G | G C G | U A C | A U G | C C C | G C U | C U G | U A A | G C U C G U A A G U A 3 '

Por lo tanto, su proteína tiene 7 aminoácidos de longitud (incluida la metionina inicial). El código genético es

Por lo tanto, los 7 aminoácidos son

Met Ala Tyr Met Pro Ala Leu

En caso de que esté confundido acerca de tener unAGOcodón en el medio de un marco de lectura abierto, entonces debería echar un vistazo al efecto posterior de una duplicación del codón de inicio en un gen.

Por supuesto, asumí que la región está efectivamente transcrita y que la primeraAGOes de hecho el codón de inicio y no solo una metionina en medio de un marco de lectura abierto.


Cada gen codificante de proteínas consta de regiones codificantes y no codificantes. La región de codificación, también conocida como CDS (ver: región de codificación y marco de lectura abierto), se extiende entre el sitio de inicio de la traducción (TIS) y uno de los codones de parada. Las regiones no codificantes incluyen intrones y regiones no traducidas (5'UTR o 3'UTR) en los exones.

Primero necesita saber si (y dónde) su plantilla de ADN contiene la información sobre la secuencia de aminoácidos. ¿Su plantilla de ADN es solo la región codificadora de proteínas o tiene algunas partes no codificantes (por ejemplo, intrones)?

(Comentario breve: la metionina también se puede encontrar dentro de la cadena de aminoácidos, no solo en TIS = no todas las metioninas son TIS)


Cómo encontrar el aminoácido en la proteína del ADN - Biología

En nuestro estudio publicado en Nature, demostramos cómo la investigación en inteligencia artificial puede impulsar y acelerar nuevos descubrimientos científicos. Hemos creado un equipo interdisciplinario dedicado con la esperanza de utilizar la inteligencia artificial para impulsar la investigación básica: reunir a expertos de los campos de la biología estructural, la física y el aprendizaje automático para aplicar técnicas de vanguardia para predecir la estructura 3D de una proteína basada en únicamente en su secuencia genética.

Nuestro sistema, AlphaFold, que se describe en artículos revisados ​​por pares que ahora se publican en Nature y PROTEINS, es la culminación de varios años de trabajo y se basa en décadas de investigación previa utilizando grandes conjuntos de datos genómicos para predecir la estructura de las proteínas. Los modelos 3D de proteínas que genera AlphaFold son mucho más precisos que los anteriores, lo que marca un progreso significativo en uno de los desafíos centrales de la biología. El código AlphaFold utilizado en CASP13 está disponible en Github aquí para cualquier persona interesada en aprender más o replicar nuestros resultados. También nos entusiasma el hecho de que este trabajo ya haya inspirado otras implementaciones independientes, incluido el modelo descrito en este documento, y una implementación de código abierto creada por la comunidad, que se describe aquí.

¿Cuál es el problema del plegamiento de proteínas?

Las proteínas son moléculas grandes y complejas esenciales para toda la vida. Casi todas las funciones que realiza nuestro cuerpo (contraer los músculos, sentir la luz o convertir los alimentos en energía) dependen de las proteínas y de cómo se mueven y cambian. Lo que puede hacer una proteína determinada depende de su estructura 3D única. Por ejemplo, las proteínas de anticuerpos que utiliza nuestro sistema inmunológico tienen "forma de Y" y forman ganchos únicos. Al adherirse a virus y bacterias, estas proteínas de anticuerpos pueden detectar y marcar microorganismos causantes de enfermedades para su eliminación. Las proteínas de colágeno tienen forma de cordones, que transmiten la tensión entre el cartílago, los ligamentos, los huesos y la piel. Otros tipos de proteínas incluyen Cas9, que, usando secuencias CRISPR como guía, actúan como tijeras para cortar y pegar secciones de proteínas anticongelantes de ADN, cuya estructura 3D les permite unirse a cristales de hielo y evitar que los organismos se congelen y los ribosomas, que actúan como una línea de ensamblaje programada, ayudando a construir proteínas por sí mismas.

Las recetas de esas proteínas, llamadas genes, están codificadas en nuestro ADN. Un error en la receta genética puede resultar en una proteína malformada, lo que podría resultar en una enfermedad o la muerte de un organismo. Muchas enfermedades, por tanto, están fundamentalmente ligadas a las proteínas. Pero el hecho de que conozca la receta genética de una proteína no significa que sepa automáticamente su forma. Las proteínas se componen de cadenas de aminoácidos (también denominados residuos de aminoácidos). Pero el ADN solo contiene información sobre el secuencia de aminoácidos, no cómo se pliegan en forma. Cuanto más grande es la proteína, más difícil es modelar, porque hay más interacciones entre los aminoácidos a tener en cuenta. Como lo demuestra la paradoja de Levinthal, se necesitaría más que la edad del universo conocido para enumerar al azar todas las configuraciones posibles de una proteína típica antes de alcanzar la verdadera estructura 3D; sin embargo, las proteínas mismas se pliegan espontáneamente, en milisegundos. Predecir cómo estas cadenas se plegarán en la intrincada estructura 3D de una proteína es lo que se conoce como el "problema del plegamiento de proteínas", un desafío en el que los científicos han trabajado durante décadas. Este problema sin resolver ya ha inspirado innumerables desarrollos, desde estimular los esfuerzos de IBM en supercomputación (BlueGene), nuevos esfuerzos de ciencia ciudadana (Folding @ Home y FoldIt) hasta nuevos dominios de ingeniería, como el diseño racional de proteínas.

¿Por qué es importante el plegamiento de proteínas?

Creo que podremos obtener una comprensión más profunda de la naturaleza de la enfermedad en general investigando las moléculas que componen el cuerpo humano, incluidas las moléculas anormales, y esta comprensión lo permitirá. el problema de la enfermedad debe ser atacado de una manera más directa, de modo que se desarrollen nuevos métodos de terapia.

Los científicos han estado interesados ​​durante mucho tiempo en determinar las estructuras de las proteínas porque se cree que la forma de una proteína dicta su función. Una vez que se comprende la forma de una proteína, se puede adivinar su función dentro de la célula y los científicos pueden desarrollar fármacos que funcionen con la forma única de la proteína.

Durante las últimas cinco décadas, los investigadores han podido determinar formas de proteínas en laboratorios utilizando técnicas experimentales como microscopía crioelectrónica, resonancia magnética nuclear y cristalografía de rayos X, pero cada método depende de una gran cantidad de ensayo y error, que puede tomar años de trabajo y cuestan decenas o cientos de miles de dólares por estructura proteica. Es por eso que los biólogos están recurriendo a los métodos de IA como una alternativa a este largo y laborioso proceso para proteínas difíciles. La capacidad de predecir computacionalmente la forma de una proteína a partir de su código genético solo, en lugar de determinarla mediante una experimentación costosa, podría ayudar a acelerar la investigación.

¿Cómo puede la IA marcar la diferencia?

Afortunadamente, el campo de la genómica es bastante rico en datos gracias a la rápida reducción del coste de la secuenciación genética. Como resultado, los enfoques de aprendizaje profundo para el problema de la predicción que se basan en datos genómicos se han vuelto cada vez más populares en los últimos años. Para catalizar la investigación y medir el progreso en los métodos más nuevos para mejorar la precisión de las predicciones, en 1994 se estableció una competencia mundial bienal denominada CASP (Evaluación crítica de la predicción de la estructura de las proteínas), que se ha convertido en el estándar de oro para evaluar las técnicas predictivas. Estamos en deuda con décadas de trabajo previo de los organizadores del CASP, así como con los miles de experimentalistas cuyas estructuras permiten este tipo de evaluación.

El trabajo de DeepMind en este problema resultó en AlphaFold, que enviamos a CASP13. Estamos orgullosos de ser parte de lo que los organizadores de CASP han llamado "progreso sin precedentes en la capacidad de los métodos computacionales para predecir la estructura de las proteínas", colocándonos en primer lugar en la clasificación entre los equipos que ingresaron (nuestra entrada es A7D).

Nuestro equipo se centró específicamente en el problema de modelar formas objetivo desde cero, sin utilizar proteínas previamente resueltas como plantillas. Logramos un alto grado de precisión al predecir las propiedades físicas de una estructura de proteína y luego usamos dos métodos distintos para construir predicciones de estructuras de proteína completas.

Usar redes neuronales para predecir propiedades físicas

Ambos métodos se basaron en redes neuronales profundas que están capacitadas para predecir las propiedades de la proteína a partir de su secuencia genética. Las propiedades que predicen nuestras redes son: (a) las distancias entre pares de aminoácidos y (b) los ángulos entre los enlaces químicos que conectan esos aminoácidos. El primer desarrollo es un avance en las técnicas de uso común que estiman si los pares de aminoácidos están cerca unos de otros.

Entrenamos una red neuronal para predecir una distribución de distancias entre cada par de residuos en una proteína (visualizada en la Figura 2). Estas probabilidades se combinaron luego en una puntuación que estima la precisión de la estructura de una proteína propuesta. También entrenamos una red neuronal separada que usa todas las distancias en conjunto para estimar qué tan cerca está la estructura propuesta de la respuesta correcta.

Figura 2: dos formas de visualizar la precisión de las predicciones de AlphaFold. La figura superior presenta las matrices de distancia para tres proteínas. El brillo de cada píxel representa la distancia entre los aminoácidos en la secuencia que comprende la proteína: cuanto más brillante es el píxel, más cerca está el par. En la fila superior se muestran las distancias reales determinadas experimentalmente y, en la fila inferior, el promedio de las distribuciones de distancia predichas por AlphaFold. Es importante destacar que estos combinan bien tanto a escala global como local. Los paneles inferiores representan la misma comparación utilizando modelos 3D, con las predicciones de AlphaFold (azul) versus los datos de la verdad del terreno (verde) para las mismas tres proteínas.

Usando estas funciones de puntuación, pudimos buscar en el paisaje de proteínas para encontrar estructuras que coincidieran con nuestras predicciones. Nuestro primer método se basó en técnicas comúnmente utilizadas en biología estructural y reemplazó repetidamente partes de una estructura de proteína con nuevos fragmentos de proteína. Entrenamos una red neuronal generativa para inventar nuevos fragmentos, que se utilizaron para mejorar continuamente la puntuación de la estructura de la proteína propuesta.

El segundo método optimizó las puntuaciones a través del descenso de gradientes, una técnica matemática comúnmente utilizada en el aprendizaje automático para realizar pequeñas mejoras incrementales, lo que resultó en estructuras altamente precisas. Esta técnica se aplicó a cadenas de proteínas completas en lugar de a piezas que deben doblarse por separado antes de ensamblarse en una estructura más grande, para simplificar el proceso de predicción.

La versión AlphaFold utilizada en CASP13 está disponible en Github para cualquier persona interesada en aprender más o replicar nuestros resultados de plegamiento de proteínas.

¿Qué pasa después?

Si bien estamos encantados con el éxito de nuestro modelo de plegamiento de proteínas, todavía queda mucho por hacer en el ámbito de la biología de las proteínas y estamos entusiasmados de continuar nuestros esfuerzos en este campo. Estamos comprometidos a establecer formas en que la IA pueda contribuir al descubrimiento científico básico, con la esperanza de lograr un impacto en el mundo real. Este enfoque podría servir para, en última instancia, mejorar nuestra comprensión del cuerpo y cómo funciona, permitiendo a los científicos enfocarse y diseñar curas nuevas y efectivas para enfermedades de manera más eficiente. Los científicos solo han mapeado las estructuras de aproximadamente la mitad de todas las proteínas producidas por las células humanas. Algunas enfermedades raras involucran mutaciones en un solo gen, lo que resulta en una proteína malformada que puede tener efectos profundos en la salud de todo un organismo. Una herramienta como AlphaFold podría ayudar a los investigadores de enfermedades raras a predecir la forma de una proteína de interés de forma rápida y económica. A medida que los científicos adquieren más conocimiento sobre las formas de las proteínas y cómo operan a través de simulaciones y modelos, este método puede eventualmente ayudarnos a contribuir al descubrimiento eficiente de fármacos, al tiempo que reduce los costos asociados con la experimentación. Nuestra esperanza es que la IA sea útil para la investigación de enfermedades y, en última instancia, mejore la calidad de vida de millones de pacientes en todo el mundo.

Pero los beneficios potenciales no se limitan solo a la salud: comprender el plegamiento de proteínas ayudará en el diseño de proteínas, lo que podría desbloquear una gran cantidad de beneficios. Por ejemplo, los avances en las enzimas biodegradables, que pueden ser habilitadas por el diseño de proteínas, podrían ayudar a manejar contaminantes como el plástico y el aceite, ayudándonos a descomponer los desechos de manera más amigable con nuestro medio ambiente. De hecho, los investigadores ya han comenzado a diseñar bacterias para que secreten proteínas que harán que los desechos sean biodegradables y más fáciles de procesar.

El éxito de nuestra primera incursión en el plegamiento de proteínas es indicativo de cómo los sistemas de aprendizaje automático pueden integrar diversas fuentes de información para ayudar a los científicos a encontrar rápidamente soluciones creativas a problemas complejos. Así como hemos visto cómo la IA puede ayudar a las personas a dominar juegos complejos a través de sistemas como AlphaGo y AlphaZero, también esperamos que algún día, los avances de la IA sirvan como plataforma para avanzar en nuestra comprensión de los problemas científicos fundamentales.

Es emocionante ver estos primeros signos de progreso en el plegamiento de proteínas, lo que demuestra la utilidad de la IA para el descubrimiento científico. Aunque hay mucho más trabajo por hacer antes de que podamos tener un impacto cuantificable en el tratamiento de enfermedades, la gestión de desechos y más, sabemos que el potencial es enorme. Con un equipo dedicado centrado en profundizar en cómo el aprendizaje automático puede hacer avanzar el mundo de la ciencia, esperamos ver las muchas formas en que nuestra tecnología puede marcar la diferencia.

Escuche nuestro podcast con los investigadores detrás de este trabajo.

Esta publicación de blog se basa en el siguiente trabajo:

La versión AlphaFold utilizada en CASP13 está disponible en Github para cualquier persona interesada en aprender más o replicar nuestros resultados de plegamiento de proteínas.

Este trabajo se realizó en colaboración con Andrew Senior, Richard Evans, John Jumper, James Kirkpatrick, Laurent Sifre, Tim Green, Chongli Qin, Augustin Žídek, Sandy Nelson, Alex Bridgland, Hugo Penedones, Stig Petersen, Karen Simonyan, Steve Crossan, Pushmeet Kohli, David Jones, David Silver, Koray Kavukcuoglu y Demis Hassabis


Composición de aminoácidos

A un nivel bajo de resolución, podemos determinar la composición de aminoácidos de la proteína hidrolizando la proteína en HCl 6 N, 100oC, al vacío durante varios intervalos de tiempo. Después de eliminar el HCl, el hidrolizado se aplica a una columna de intercambio iónico o de interacción hidrófoba, y los aminoácidos se eluyen y cuantifican con respecto a los estándares conocidos. Se agrega un aminoácido no natural como la norleucina en cantidades conocidas como patrón interno para monitorear la recuperación cuantitativa durante las reacciones. Los aminoácidos separados a menudo se derivan con ninhidrina o fenilisotiociantato para facilitar su detección. Por lo general, se deja que la reacción se desarrolle durante 24, 36 y 48 horas, ya que los aminoácidos con OH (como ser) se destruyen. Un curso temporal permite extrapolar la concentración de Ser en el tiempo t = 0. Trp también se destruye durante el proceso. Además, los enlaces amida en las cadenas laterales de Gln y Asn se hidrolizan para formar Glu y Asp, respectivamente.


Índice de hidrofobicidad para aminoácidos comunes

El índice de hidrofobicidad es una medida de la hidrofobicidad relativa o cuán soluble es un aminoácido en agua. En una proteína, es probable que se encuentren aminoácidos hidrófobos en el interior, mientras que es probable que los aminoácidos hidrófilos estén en contacto con el medio acuoso.

Los valores de la siguiente tabla están normalizados de modo que al residuo más hidrófobo se le da un valor de 100 en relación con la glicina, que se considera neutral (valor 0). Las escalas se extrapolaron a residuos que son más hidrófilos que la glicina.

Valores de pH 2: normalizados de Sereda et al., J. Chrom. 676: 139-153 (1994).
Valores B pH 7: Monera et al., J. Protein Sci. 1: 319-329 (1995).


Proteínas

Las proteínas son las biomoléculas más diversas y juegan un papel importante en varios procesos biológicos. Las enzimas son las proteínas funcionales más importantes que catalizan reacciones biológicas. Las proteínas son sensibles al calor y a los cambios de pH. A menudo sufren cambios irreversibles en la estructura, llamados desnaturalización de proteínas, debido a cambios extremos de temperatura o pH. Los aminoácidos son los monómeros de proteínas complejas.

Enlaces peptídicos y polipéptidos

El grupo carboxilo de un aminoácido reacciona con el grupo amino de otro aminoácido para formar un dipéptido unido a través de un enlace peptídico. Cuando 100 o más aminoácidos se unen a través de enlaces peptídicos, la cadena de aminoácidos resultante se denomina polipéptido. Una o más cadenas polipeptídicas constituyen una proteína.

Estructura de proteinas

Las proteínas tienen cuatro niveles de organización estructural que incluyen estructuras primarias, secundarias, terciarias y cuaternarias. La cadena de aminoácidos unidos por un enlace peptídico que forma un polipéptido se conoce como la estructura primaria de la proteína. Las cadenas polipeptídicas se pueden doblar o doblar más para formar la estructura secundaria. Hay dos tipos de estructuras secundarias que incluyen hélice α y láminas β. La α-hélice es una cadena de aminoácidos que se enrolla en forma de hélice y se estabiliza mediante la formación de enlaces de hidrógeno entre los grupos C = O y NH de varios aminoácidos. Las láminas β se forman cuando las cadenas polipeptídicas se colocan una al lado de la otra y se mantienen juntas mediante enlaces de hidrógeno entre los grupos C = O y NH.

Los grupos R de la cadena lateral de aminoácidos en la cadena polipeptídica interactúan a través de varias fuerzas interatómicas como enlaces de hidrógeno, enlaces hidrofóbicos, enlaces disulfuro o fuerzas de van der Waals. Este nivel de organización se conoce como estructura terciaria. Dos o más cadenas polipeptídicas pueden interactuar a través de enlaces de hidrógeno, enlaces covalentes y / o interacciones hidrofóbicas para formar la estructura cuaternaria. Esta es la estructura más estable de las proteínas y da una forma tridimensional final a las proteínas.


Los nanoporos pueden identificar los aminoácidos en las proteínas, el primer paso para la secuenciación.

En la representación de este artista, una porción de una proteína se mueve a través de un nanoporo de aerolisina. Crédito: Aleksei Aksimentiev

Si bien la secuenciación del ADN es una herramienta útil para determinar lo que sucede en una célula o en el cuerpo de una persona, solo cuenta una parte de la historia. La secuenciación de proteínas pronto podría dar a los investigadores una ventana más amplia sobre el funcionamiento de una célula. Un nuevo estudio demuestra que los nanoporos se pueden usar para identificar los 20 aminoácidos en las proteínas, un paso importante hacia la secuenciación de proteínas.

Investigadores de la Universidad de Illinois en Urbana-Champaign, la Universidad Cergy-Pontoise en Francia y la Universidad de Friburgo en Alemania publicaron los hallazgos en la revista. Biotecnología de la naturaleza.

"El ADN codifica para muchas cosas que pueden suceder, nos dice lo que es potencialmente posible. El producto real que sale, las proteínas que hacen el trabajo en la célula, no se puede saber solo a partir del ADN", dijo el profesor de física de Illinois Aleksei. Aksimentiev, codirector del estudio. "Se producen muchas modificaciones durante el proceso de fabricación de proteínas a partir del ADN. Las proteínas se empalman, modifican químicamente, se pliegan y más".

Una molécula de ADN es en sí misma una plantilla diseñada para la replicación, por lo que hacer copias para secuenciar es relativamente fácil. En el caso de las proteínas, no existe una maquinaria natural con la que hacer copias o leerlas. Además de la dificultad, 20 aminoácidos forman las proteínas, en comparación con las cuatro bases del ADN, y se pueden realizar numerosas modificaciones pequeñas en cada aminoácido durante la producción y el plegamiento de las proteínas.

"Muchos aminoácidos son muy similares", dijo Aksimentiev. "Por ejemplo, si observa la leucina y la isoleucina, tienen los mismos átomos, el mismo peso molecular y la única diferencia es que los átomos están conectados en un orden ligeramente diferente".

Los nanoporos, pequeños canales de proteínas incrustados en una membrana, son una herramienta popular para la secuenciación del ADN. Anteriormente, los científicos pensaban que las diferencias en los aminoácidos eran demasiado pequeñas para registrarlas con la tecnología de nanoporos. El nuevo estudio muestra lo contrario.

Los investigadores utilizaron un canal de membrana producido naturalmente por bacterias, llamado aerolisina, como su nanoporo. Tanto en el modelado por computadora como en el trabajo experimental, cortaron proteínas y usaron un portador químico para conducir los aminoácidos al nanoporo. La molécula portadora también mantuvo los aminoácidos dentro del poro el tiempo suficiente para que registrara una diferencia medible en la firma eléctrica de cada aminoácido, incluso leucina e isoleucina, los gemelos casi idénticos.

"Este trabajo genera confianza y asegura a la comunidad de nanoporos que la secuenciación de proteínas es realmente posible", dijo Abdelghani Oukhaled, profesor de biofísica en Cergy-Pontoise, cuyo equipo llevó a cabo gran parte del trabajo experimental.

Los investigadores descubrieron que podían diferenciar aún más las formas modificadas de aminoácidos utilizando un aparato de medición más sensible o tratando la proteína con una sustancia química para mejorar la diferenciación. Las mediciones son lo suficientemente precisas como para identificar potencialmente cientos de modificaciones, dijo Aksimentiev, e incluso se pueden reconocer más si se ajustan los poros.

"Este es un estudio de prueba de concepto que muestra que podemos identificar los diferentes aminoácidos", dijo. "El método actual para la caracterización de proteínas es la espectrometría de masas, pero eso no determina la secuencia que compara una muestra con lo que ya está en la base de datos. Su capacidad para caracterizar nuevas variaciones o mutaciones es limitada. Con los nanoporos, finalmente pudimos ver esas modificaciones que aún no han sido estudiados ".

El nanoporo de aerolisina podría integrarse en configuraciones estándar de nanoporos, dijo Aksimentiev, haciéndolo accesible a otros científicos. Los investigadores ahora están explorando enfoques para leer los aminoácidos en orden secuencial a medida que se cortan de la proteína. También están considerando otras aplicaciones para el sistema.

"Una aplicación potencial sería combinar esto con inmunoensayos para extraer proteínas de interés y luego secuenciarlas. La secuenciación nos dirá si están modificadas o no, y eso podría conducir a una herramienta de diagnóstico clínico", dijo Aksimentiev.

"Este trabajo muestra que realmente no hay límite para la precisión con la que podemos caracterizar las moléculas biológicas", dijo. "Es muy probable que algún día podamos decir la composición molecular de la célula, de qué estamos hechos, hasta el nivel de átomos individuales".


Traducción (avanzado)

La molécula amarilla es ARN mensajero (ARNm) sale del núcleo en el ribosoma, ARN ribosómico (ARNr) se une al ARN de transferencia de ARN o ARNt (en verde) puede leer el código de tres letras en el ARNm o codón, cada codón codifica para un animoácido (molécula roja unida al ARNt) la secuencia de codones en el ARNm determina la secuencia de aminoácidos en la proteína, que a su vez determina la estructura y función de la proteína.

Duración: 3 minutos, 3 segundos

El trabajo de este ARNm es llevar el mensaje de genes del ADN fuera del núcleo a un ribosoma para la producción de la proteína particular que codifica este gen. Puede haber varios millones de ribosomas en una célula eucariota típica. Estas complejas máquinas catalíticas utilizan la copia del mrna de la información genética para ensamblar los componentes de aminoácidos en las proteínas tridimensionales que son esenciales para la vida. Vamos a ver cómo funciona. El ribosoma está compuesto por una subunidad grande y una pequeña que se ensamblan alrededor del ARN mensajero, que luego pasa a través del ribosoma como una cinta de computadora. Los bloques de construcción de aminoácidos (que son las pequeñas moléculas de color rojo brillante) se transportan al ribosoma unido a ARN de transferencia específicos. Esas son las moléculas verdes más grandes, también conocidas como ARNt. La pequeña subunidad del ribosoma posiciona el ARNm de modo que pueda leerse en grupos de tres letras conocidas como codón. Cada codón del ARNm coincide con el correspondiente anticodón en la base de una molécula de ARN de transferencia. La subunidad más grande del ribosoma elimina cada aminoácido y lo une a la cadena de proteínas en crecimiento. A medida que el ARNm pasa por el ribosoma, la secuencia de ARNm se traduce en una secuencia de aminoácidos. Hay tres ubicaciones dentro del ribosoma, denominadas sitio A, sitio P y sitio E. La adición de cada aminoácido es un ciclo de tres pasos: Primero, el ARNt ingresa al ribosoma en el sitio A y se prueba para detectar una coincidencia de codón / anti-codón con el ARNm. A continuación, siempre que haya una coincidencia correcta, el ARNt se desplaza al sitio P y el aminoácido que lleva se agrega al final de la cadena de aminoácidos. El ARNm también está trincado en tres nucleótidos o en un codón. En tercer lugar, el ARNt gastado se mueve al sitio E y luego se expulsa del ribosoma para ser reciclado. A medida que avanza la síntesis de proteínas, la cadena terminada emerge del ribosoma. Se pliega en una forma precisa, determinada por el orden exacto de los aminoácidos. Así, el Dogma Central explica cómo el código de ADN de cuatro letras, literalmente, se convierte en carne y hueso.

mesanger rna, traducción de proteínas, ribosomal rna, secuencia de aminoácidos, codones, trna, rrna, estructura y función, molécula


12 proteínas

Al final de esta sección, podrá hacer lo siguiente:

  • Describir las funciones que realizan las proteínas en la célula y en los tejidos.
  • Discutir la relación entre aminoácidos y proteínas.
  • Explicar los cuatro niveles de organización de las proteínas.
  • Describir las formas en las que la forma y la función de las proteínas están relacionadas.

Las proteínas son una de las moléculas orgánicas más abundantes en los sistemas vivos y tienen la gama de funciones más diversa de todas las macromoléculas. Las proteínas pueden ser estructurales, reguladoras, contráctiles o protectoras. Pueden servir en transporte, almacenamiento o membranas o pueden ser toxinas o enzimas. Cada célula de un sistema vivo puede contener miles de proteínas, cada una con una función única. Sus estructuras, al igual que sus funciones, varían mucho. Sin embargo, todos son polímeros de aminoácidos dispuestos en una secuencia lineal.

Tipos y funciones de las proteínas

Las enzimas, que producen las células vivas, son catalizadores de reacciones bioquímicas (como la digestión) y suelen ser proteínas complejas o conjugadas. Cada enzima es específica del sustrato (un reactivo que se une a una enzima) sobre el que actúa. La enzima puede ayudar en las reacciones de descomposición, reordenamiento o síntesis. A las enzimas que descomponen sus sustratos las llamamos enzimas catabólicas. Aquellas que forman moléculas más complejas a partir de sus sustratos son las enzimas anabólicas, y las enzimas que afectan la velocidad de reacción son las enzimas catalíticas. Tenga en cuenta que todas las enzimas aumentan la velocidad de reacción y, por lo tanto, son catalizadores orgánicos. Un ejemplo de enzima es la amilasa salival, que hidroliza su sustrato amilosa, un componente del almidón.

Las hormonas son moléculas de señalización química, generalmente pequeñas proteínas o esteroides, secretadas por células endocrinas que actúan para controlar o regular procesos fisiológicos específicos, incluidos el crecimiento, el desarrollo, el metabolismo y la reproducción. Por ejemplo, la insulina es una hormona proteica que ayuda a regular el nivel de glucosa en sangre. (Figura) enumera los tipos y funciones principales de las proteínas.

Tipos de proteínas y funciones
Escribe Ejemplos de Funciones
Enzimas digestivas Amilasa, lipasa, pepsina, tripsina Ayuda en los alimentos catabolizando los nutrientes en unidades monoméricas.
Transporte Hemoglobina, albúmina Transportan sustancias en la sangre o la linfa por todo el cuerpo.
Estructural Actina, tubulina, queratina Construye diferentes estructuras, como el citoesqueleto.
Hormonas Insulina, tiroxina Coordinar diferentes sistemas corporales y actividad # 8217
Defensa Inmunoglobulinas Protege el cuerpo de patógenos extraños.
Contractible Actina, miosina Efecto contracción muscular
Almacenamiento Proteínas de almacenamiento de leguminosas, clara de huevo (albúmina) Proporcionar nutrición en el desarrollo temprano del embrión y la plántula.

Las proteínas tienen diferentes formas y pesos moleculares. Algunas proteínas tienen forma globular, mientras que otras son de naturaleza fibrosa. Por ejemplo, la hemoglobina es una proteína globular, pero el colágeno, ubicado en nuestra piel, es una proteína fibrosa. La forma de la proteína es fundamental para su función, y muchos tipos diferentes de enlaces químicos mantienen esta forma. Los cambios en la temperatura, el pH y la exposición a productos químicos pueden provocar cambios permanentes en la forma de la proteína, lo que lleva a la pérdida de función o desnaturalización. Las diferentes disposiciones de los mismos 20 tipos de aminoácidos comprenden todas las proteínas. Recientemente se descubrieron dos nuevos aminoácidos raros (selenocisteína y pirrolisina), y es posible que se agreguen nuevos descubrimientos a la lista.

Aminoácidos

Los aminoácidos son los monómeros que componen las proteínas. Cada aminoácido tiene la misma estructura fundamental, que consiste en un átomo de carbono central, o el alfa (α) carbono, unido a un grupo amino (NH2), un grupo carboxilo (COOH) y un átomo de hidrógeno. Cada aminoácido también tiene otro átomo o grupo de átomos unidos al átomo central conocido como grupo R ((Figura)).


Los científicos usan el nombre & # 8220aminoácido & # 8221 porque estos ácidos contienen tanto el grupo amino como el grupo ácido carboxílico en su estructura básica. Como mencionamos, hay 20 aminoácidos comunes presentes en las proteínas. Nueve de estos son aminoácidos esenciales en el ser humano porque el cuerpo humano no puede producirlos y los obtenemos de nuestra dieta. Para cada aminoácido, el grupo R (o cadena lateral) es diferente ((Figura)).


¿Qué categorías de aminoácidos esperaría encontrar en una proteína soluble & # 8217s en la superficie y cuáles esperaría encontrar en el interior? ¿Qué distribución de aminoácidos esperaría encontrar en una proteína incrustada en una bicapa lipídica?

La naturaleza química de la cadena lateral determina la naturaleza del aminoácido (es decir, si es ácido, básico, polar o no polar). Por ejemplo, el aminoácido glicina tiene un átomo de hidrógeno como grupo R. Los aminoácidos como la valina, la metionina y la alanina son de naturaleza no polar o hidrófoba, mientras que los aminoácidos como la serina, la treonina y la cisteína son polares y tienen cadenas laterales hidrófilas. Las cadenas laterales de lisina y arginina están cargadas positivamente y, por lo tanto, estos aminoácidos también son aminoácidos básicos. La prolina tiene un grupo R que está unido al grupo amino, formando una estructura similar a un anillo. La prolina es una excepción a la estructura estándar de aminoácidos, ya que su grupo amino no está separado de la cadena lateral ((Figura)).

Una sola letra mayúscula o una abreviatura de tres letras representa los aminoácidos. Por ejemplo, la letra V o el símbolo val de tres letras representan valina. Así como algunos ácidos grasos son esenciales para una dieta, también son necesarios algunos aminoácidos. Estos aminoácidos esenciales en humanos incluyen isoleucina, leucina y cisteína. Los aminoácidos esenciales se refieren a los necesarios para construir proteínas en el cuerpo, pero no a los que produce el cuerpo. Los aminoácidos esenciales varían de un organismo a otro.

La secuencia y el número de aminoácidos determinan en última instancia la forma, el tamaño y la función de la proteína. Un enlace covalente, o enlace peptídico, se une a cada aminoácido, que forma una reacción de deshidratación. Un grupo carboxilo de aminoácidos y # 8217s y el grupo amino de aminoácidos entrantes se combinan, liberando una molécula de agua. El enlace resultante es el enlace peptídico ((Figura)).


Los productos que forman tales enlaces son péptidos. A medida que se unen más aminoácidos a esta cadena en crecimiento, la cadena resultante es un polipéptido. Cada polipéptido tiene un grupo amino libre en un extremo. Este extremo es el N terminal, o el amino terminal, y el otro extremo tiene un grupo carboxilo libre, también el C o carboxilo terminal. Si bien los términos polipéptido y proteína a veces se usan indistintamente, un polipéptido es técnicamente un polímero de aminoácidos, mientras que el término proteína se usa para un polipéptido o polipéptidos que se han combinado, a menudo tienen grupos prostéticos no peptídicos unidos, tienen una forma distinta. y tienen una función única. Después de la síntesis de proteínas (traducción), la mayoría de las proteínas se modifican. Estos se conocen como modificaciones postraduccionales. Pueden sufrir escisión, fosforilación o pueden requerir la adición de otros grupos químicos. Solo después de estas modificaciones la proteína es completamente funcional.

Haga clic en los pasos de la síntesis de proteínas en este tutorial interactivo.

El significado evolutivo del citocromo c El citocromo c es un componente importante de la cadena de transporte de electrones, una parte de la respiración celular, y normalmente se encuentra en el orgánulo celular, la mitocondria. Esta proteína tiene un grupo protésico hemo, y el ión central hemo & # 8217s se reduce y oxida alternativamente durante la transferencia de electrones. Debido a que el papel de esta proteína esencial en la producción de energía celular es crucial, ha cambiado muy poco durante millones de años. La secuenciación de proteínas ha demostrado que existe una cantidad considerable de homología de secuencia de aminoácidos del citocromo c entre diferentes especies. En otras palabras, podemos evaluar el parentesco evolutivo midiendo las similitudes o diferencias entre las secuencias de proteínas o ADN de varias especies.

Los científicos han determinado que el citocromo c humano contiene 104 aminoácidos. Para cada molécula de citocromo c de diferentes organismos que los científicos han secuenciado hasta la fecha, 37 de estos aminoácidos aparecen en la misma posición en todas las muestras de citocromo c. Esto indica que puede haber un ancestro común. Al comparar las secuencias de proteínas humanas y de chimpancés, los científicos no encontraron una diferencia de secuencia. Cuando los investigadores compararon las secuencias de humanos y monos rhesus, la única diferencia estaba en un aminoácido. En otra comparación, la secuenciación de humano a levadura muestra una diferencia en la posición 44.

Estructura proteica

Como comentamos anteriormente, la forma de una proteína es fundamental para su función. Por ejemplo, una enzima puede unirse a un sustrato específico en un sitio activo. Si este sitio activo se altera debido a cambios locales o cambios en la estructura general de la proteína, es posible que la enzima no pueda unirse al sustrato. Para comprender cómo la proteína adquiere su forma o conformación final, necesitamos comprender los cuatro niveles de estructura de la proteína: primario, secundario, terciario y cuaternario.

Estructura primaria

La secuencia única de aminoácidos # 8217 en una cadena polipeptídica es su estructura primaria. Por ejemplo, la hormona pancreática insulina tiene dos cadenas polipeptídicas, A y B, y están unidas por enlaces disulfuro. El aminoácido N terminal de la cadena A es glicina, mientras que el aminoácido C terminal es asparagina ((Figura)). Las secuencias de aminoácidos en las cadenas A y B son exclusivas de la insulina.


El gen que codifica la proteína determina en última instancia la secuencia única de cada proteína. Un cambio en la secuencia de nucleótidos de la región codificante del gen puede llevar a agregar un aminoácido diferente a la cadena polipeptídica en crecimiento, provocando un cambio en la estructura y función de la proteína. En la anemia de células falciformes, la hemoglobina β La cadena (una pequeña porción de la cual mostramos en la (Figura)) tiene una sustitución de un solo aminoácido, lo que provoca un cambio en la estructura y función de la proteína. Específicamente, la valina en el β la cadena sustituye al aminoácido glutámico. Lo más notable de considerar es que una molécula de hemoglobina se compone de dos cadenas alfa y dos beta, cada una de las cuales consta de unos 150 aminoácidos. La molécula, por tanto, tiene unos 600 aminoácidos. La diferencia estructural entre una molécula de hemoglobina normal y una molécula de células falciformes, que disminuye drásticamente la esperanza de vida, es un solo aminoácido de los 600. Lo que es aún más notable es que tres nucleótidos cada uno codifica esos 600 aminoácidos y un solo cambio de base (mutación puntual), 1 en 1800 bases causa la mutación.


Debido a este cambio de un aminoácido en la cadena, las moléculas de hemoglobina forman fibras largas que distorsionan los glóbulos rojos bicóncavos, o en forma de disco, y hacen que adopten una forma de media luna o "hoz", que obstruye los vasos sanguíneos ((Figura )). Esto puede provocar una gran cantidad de problemas de salud graves, como dificultad para respirar, mareos, dolores de cabeza y dolor abdominal para los afectados por esta enfermedad.


Estructura secundaria

El plegamiento local del polipéptido en algunas regiones da lugar a la estructura secundaria de la proteína. Los más comunes son los α-hélice y β-Estructuras de láminas plegadas ((Figura)). Ambas estructuras se mantienen en forma mediante enlaces de hidrógeno. Los enlaces de hidrógeno se forman entre el átomo de oxígeno en el grupo carbonilo en un aminoácido y otro aminoácido que está cuatro aminoácidos más adelante en la cadena.


Cada giro de una hélice alfa tiene 3,6 residuos de aminoácidos. El polipéptido y los grupos R # 8217s (los grupos variantes) sobresalen del α-cadena de hélice. En el β-hoja plegada, enlaces de hidrógeno entre átomos en la cadena polipeptídica & # 8217s de la estructura principal & # 8220pleats & # 8221. Los grupos R están unidos a los carbones y se extienden por encima y por debajo de los pliegues y pliegues. Los segmentos plegados se alinean paralelos o antiparalelos entre sí, y se forman enlaces de hidrógeno entre el átomo de nitrógeno parcialmente positivo en el grupo amino y el átomo de oxígeno parcialmente negativo en la estructura del péptido y el grupo carbonilo. los α-hélice y βLas estructuras de láminas plegadas se encuentran en la mayoría de las proteínas globulares y fibrosas y desempeñan un papel estructural importante.

Estructura terciaria

La estructura tridimensional única del polipéptido # 8217 es su estructura terciaria ((Figura)). Esta estructura se debe en parte a las interacciones químicas que actúan sobre la cadena polipeptídica. Principalmente, las interacciones entre los grupos R crean la estructura terciaria tridimensional compleja de la proteína. La naturaleza de los grupos R en los aminoácidos involucrados puede contrarrestar la formación de los enlaces de hidrógeno que describimos para las estructuras secundarias estándar. Por ejemplo, los grupos R con cargas similares se repelen entre sí y aquellos con cargas diferentes se atraen entre sí (enlaces iónicos). Cuando tiene lugar el plegamiento de proteínas, los aminoácidos no polares y los grupos R hidrófobos se encuentran en el interior de la proteína, mientras que los grupos R hidrófilos se encuentran en el exterior. Los científicos también denominan interacciones hidrofóbicas a los tipos de interacción anteriores. La interacción entre las cadenas laterales de cisteína forma enlaces disulfuro en presencia de oxígeno, el único enlace covalente que se forma durante el plegamiento de proteínas.


Todas estas interacciones, débiles y fuertes, determinan la forma tridimensional final de la proteína. Cuando una proteína pierde su forma tridimensional, es posible que ya no sea funcional.

Estructura cuaternaria

En la naturaleza, algunas proteínas se forman a partir de varios polipéptidos o subunidades, y la interacción de estas subunidades forma la estructura cuaternaria. Las interacciones débiles entre las subunidades ayudan a estabilizar la estructura general. Por ejemplo, la insulina (una proteína globular) tiene una combinación de enlaces de hidrógeno y disulfuro que hacen que se aglutine en su mayoría en forma de bola. La insulina comienza como un único polipéptido y pierde algunas secuencias internas en presencia de una modificación postraduccional después de formar los enlaces disulfuro que mantienen unidas las cadenas restantes. La seda (una proteína fibrosa), sin embargo, tiene β-estructura de hoja plegada que es el resultado del enlace de hidrógeno entre diferentes cadenas.

(Figura) ilustra los cuatro niveles de estructura proteica (primaria, secundaria, terciaria y cuaternaria).


Desnaturalización y plegamiento de proteínas

Cada proteína tiene su propia secuencia y forma únicas que las interacciones químicas mantienen unidas. Si la proteína está sujeta a cambios de temperatura, pH o exposición a sustancias químicas, la estructura de la proteína puede cambiar y perder su forma sin perder su secuencia primaria en lo que los científicos llaman desnaturalización. La desnaturalización es a menudo reversible porque la estructura primaria del polipéptido se conserva en el proceso si se elimina el agente desnaturalizante, lo que permite que la proteína reanude su función. A veces, la desnaturalización es irreversible y conduce a la pérdida de función. Un ejemplo de desnaturalización irreversible de proteínas es freír un huevo. La proteína de albúmina en la clara de huevo líquida se desnaturaliza cuando se coloca en una sartén caliente. No todas las proteínas se desnaturalizan a altas temperaturas. Por ejemplo, las bacterias que sobreviven en aguas termales tienen proteínas que funcionan a temperaturas cercanas al punto de ebullición. El estómago también es muy ácido, tiene un pH bajo y desnaturaliza las proteínas como parte del proceso de digestión, sin embargo, las enzimas digestivas del estómago retienen su actividad en estas condiciones.

El plegamiento de proteínas es fundamental para su función. Los científicos pensaron originalmente que las proteínas mismas eran responsables del proceso de plegado. Solo recientemente, los investigadores descubrieron que a menudo reciben ayuda en el proceso de plegado de los auxiliares de proteínas o chaperonas (o chaperoninas) que se asocian con la proteína objetivo durante el proceso de plegado. Actúan previniendo la agregación de polipéptidos que comprenden la estructura completa de la proteína y se disocian de la proteína una vez que se pliega la proteína diana.

Para obtener una perspectiva adicional sobre las proteínas, vea esta animación llamada "Biomoléculas: las proteínas".

Resumen de la sección

Las proteínas son una clase de macromoléculas que realizan una amplia gama de funciones para la célula. Ayudan en el metabolismo actuando como enzimas, portadores u hormonas y brindan apoyo estructural. Los componentes básicos de las proteínas (monómeros) son los aminoácidos. Cada aminoácido tiene un carbono central que se une a un grupo amino, un grupo carboxilo, un átomo de hidrógeno y un grupo R o cadena lateral. Hay 20 aminoácidos que ocurren comúnmente, cada uno de los cuales difiere en el grupo R. Un enlace peptídico une cada aminoácido a sus vecinos. Una cadena larga de aminoácidos es un polipéptido.

Las proteínas se organizan en cuatro niveles: primario, secundario, terciario y (opcional) cuaternario. La estructura primaria son los aminoácidos y la secuencia única # 8217. El polipéptido & # 8217s plegamiento local para formar estructuras como el α-hélice y β-La hoja plegada constituye la estructura secundaria. La estructura tridimensional general es la estructura terciaria. Cuando dos o más polipéptidos se combinan para formar la estructura proteica completa, la configuración es la estructura cuaternaria de la proteína. La forma y función de las proteínas están íntimamente ligadas. Cualquier cambio de forma causado por cambios de temperatura o pH puede provocar la desnaturalización de las proteínas y una pérdida de función.

Preguntas de conexión visual

(Figura) ¿Qué categorías de aminoácidos esperaría encontrar en la superficie de una proteína soluble y cuáles esperaría encontrar en el interior? ¿Qué distribución de aminoácidos esperaría encontrar en una proteína incrustada en una bicapa lipídica?


Los investigadores encuentran que el aminoácido arginina puede haber jugado un papel más importante en los orígenes químicos de la vida.

Crédito: Universidad de California - Santa Bárbara

La vida tal como la conocemos se originó hace aproximadamente 3,5 a 4 mil millones de años en la forma de una sopa prebiótica ("antes de la vida") de moléculas orgánicas que de alguna manera comenzaron a replicarse y transmitir una fórmula genética. O eso es lo que piensa el mundo del ARN, una de las hipótesis más sólidas sobre el origen de la vida.

Los investigadores de la Universidad de California en Santa Bárbara ahora han encontrado evidencia de que el aminoácido arginina (o su equivalente mundial prebiótico) puede haber sido un ingrediente más importante en esta sopa de lo que se pensaba anteriormente.

"La gente tiende a pensar que la arginina no es prebiótica", dijo Irene Chen, una biofísica cuya investigación se centra en los orígenes químicos de la vida. "Tienden a pensar que los aminoácidos más simples son plausibles, como la glicina y la alanina". La arginina, por el contrario, es relativamente más compleja y, por lo tanto, se pensó que había entrado en el juego en una etapa posterior.

La Tierra Primordial, según la teoría del mundo del ARN, tenía las condiciones para albergar varios tipos de biomoléculas, incluidos los ácidos nucleicos (que se convierten en material genético), los aminoácidos (que eventualmente se unen para formar las proteínas que son responsables de la estructura y función de las células). y lípidos (que almacenan energía y protegen las células). Bajo qué circunstancias y cómo estas biomoléculas trabajaron juntas es una fuente de investigación en curso para los investigadores de los orígenes de la vida.

Para su investigación, los científicos de UCSB analizaron un conjunto de datos de complejos de proteínas y aptámeros evolucionados in vitro (moléculas cortas de ARN y ADN que se unen a proteínas diana específicas).

"Buscábamos la interfaz para la que las propiedades favorecían la unión", dijo Celia Blanco, investigadora postdoctoral en el Chen Lab y autora principal de un artículo que aparece en la revista. Biología actual. La evolución in vitro fue un factor importante al seleccionar estos complejos evolutivamente independientes, señaló, para evitar los efectos de confusión resultantes de la evolución biológica y para imitar de cerca las condiciones de un mundo prebiótico.

"Hay tantas limitaciones en biología", dijo Chen, quien también es médico. "Las interacciones proteína-ADN o proteína-ARN evolucionadas biológicamente tienen que funcionar dentro de una célula que no va a ser exactamente el caso de los orígenes de la vida".

Lo que encontraron los investigadores fue que la arginina participaba en muchas de las interacciones químicas entre proteínas y aptámeros.

"Por supuesto, esperábamos que fuera muy importante para las interacciones electrostáticas porque tiene carga positiva", dijo Chen, "pero también era el aminoácido dominante para las interacciones hidrófobas, las interacciones de apilamiento y estos otros modos diferentes de interacción que otros aminoácidos son más conocido por ". En menor grado, la lisina (otro aminoácido cargado positivamente) también jugó un papel importante en estas interacciones.

Entre otras razones, es posible que se haya pasado por alto la arginina porque es un aminoácido relativamente más difícil de sintetizar.

"Por lo general, la gente basa el consenso de lo que es prebiótico y lo que no lo es en experimentos", dijo Blanco. "Y usando lo que la gente cree que son condiciones prebióticas, la arginina y la lisina parecen ser difíciles de sintetizar o detectar". Pero el hecho de que algo como la arginina no se haya producido en los experimentos de laboratorio realizados hasta ahora, continuó Blanco, no significa que no estuviera allí.

Los investigadores tienen cuidado de señalar que, aunque se descubrió que el aminoácido que llamamos arginina es importante en las interacciones de unión de aptámero-proteína que examinaron, hace miles de millones de años la biomolécula puede no haber sido necesariamente la arginina actual, sino quizás un equivalente primordial cargado positivamente. .

Este desarrollo arroja más luz sobre lo que podrían haber sido las condiciones ideales para el surgimiento de la vida. Hay una variedad de hipótesis, desde cometas hasta respiraderos hidrotermales y otros entornos, que pueden haber sido favorables para la eventual evolución de las células, así como varios experimentos emblemáticos que refuerzan la idea del mundo del ARN.

"Si hubiéramos descubierto que la glicina era realmente importante para las interacciones ARN-proteína, y que la glicina está en todas partes, eso no habría sido útil para determinar las condiciones plausibles", dijo Chen. "Pero encontrar que la arginina era importante limita el tipo de escenarios que podrían haber dado lugar al código genético".


Si una proteína tiene 450 aminoácidos, ¿cuántos pares de bases tiene el ADN que la codifica?

Cada aminoácido está codificado por un codón formado por un conjunto de 3 pares de ADN. Por lo tanto, se necesitarían 450 conjuntos de 3 pares de ADN para codificar una proteína con 450 aminoácidos.

# 450 xx 3 = 1350 # pares de ADN.

Además de los pares de ADN para codificar el aminoácido real, también debería haber un conjunto de tres pares de ADN para iniciar la transcripción y un conjunto de tres pares de ADN para detener la transcripción.

El ADN requiere una segunda hebra complementaria que se une a la hebra que codifica la proteína.

Sin embargo, la hebra complementaria no codifica la proteína. El ADN se puede leer de manera diferente en las dos hebras complementarias creando diferentes proteínas e instrucciones para los procesos celulares.De hecho, el ADN se puede leer en ambas direcciones para que la misma hebra o partes de la misma hebra que codifiquen la proteína deseada de 450 aminoácidos. leer de manera diferente puede crear una proteína o instrucción celular diferente.