遺傳密碼有64種,但是絕大多數(shù)生物傾向于利用這些密碼子中的一部分。那些被最頻繁利用的稱為最佳密碼子(optimal codons),那些不被經常利用的稱為稀有或利用率低的密碼子(rare or low-usage codons)。實際上用做蛋白表達或生產的每種生物(包括大腸桿菌,酵母,哺乳動物細胞,Pichia,植物細胞和昆蟲細胞)都表現(xiàn)出某種程度的密碼子利用的差異或偏愛。大腸桿菌、酵母、果蠅、靈長類等每種生物都有獨特的8個密碼子極少被利用。有趣的是,靈長類和酵母有6個同樣的利用率低的密碼子。大腸桿菌、酵母和果蠅中編碼豐度高的蛋白質的基因明顯避免低利用率的密碼子。因此,重組蛋白的表達可能受密碼子利用的影響(尤其在異源表達系統(tǒng)中)的事實并不很奇怪。你的基因利用的密碼子可能不是你正在利用的蛋白生產系統(tǒng)進行高水平表達所偏愛的密碼子,這種情況是可能的。利用偏愛密碼子(preferred codons)并避免利用率低的或稀有的密碼子可以合成基因,基因的這種重新設計叫密碼子最佳化。
在同源表達系統(tǒng)中,同較低水平表達的基因相比,較高表達的基因可能有很不同的密碼子偏愛。通過對密碼子利用的歸類分析,人們可以真正預測任何基因在酵母中的表達水平。在諸如Zea mays的其他生物中,大量高表達基因強烈偏愛以G或C結尾的密碼子。而且,在Dictyostelium中,同低水平表達的基因比較,高表達基因有較大數(shù)目的偏愛密碼子。
在大腸桿菌中表達哺乳動物基因是不可預測和具有挑戰(zhàn)的。例如直到最近才實現(xiàn)了人血紅蛋白的過表達。為了達到血紅蛋白的好的表達水平,Alpha-球蛋白cDNA不得不用大腸桿菌偏愛的密碼子進行重新合成。在異源宿主中實現(xiàn)象血紅蛋白這樣復雜的蛋白質的過表達可能需要最佳化密碼子,這些研究者為此提供了令人信服的資料。成簇的低利用率的密碼子抑制了核糖體的運動,這是基因不能以合適水平表達的一個明顯機制。核糖體翻譯由九個密碼子組成的信使(含幾個低利用率密碼子或全部為低利用率密碼子)時的運動速度要比翻譯不含低利用率密碼子的同樣長的信使的速度慢。即使低利用率密碼子簇位于3'端,信使最后也會被核糖體”擁擠”而損害,核糖體又回到5'端。3'端低利用率密碼子簇的抑制效應可以和全部信使都由低利用率密碼子組成的抑制效應一樣大。如果低利用率密碼子簇位于5'端,其效應是起始核糖體數(shù)目的全面減少,導致蛋白合成中信使的低效率。散在分布的稀有密碼子對翻譯的效應還未很好地研究,但是有證據(jù)表明這種情況的確對翻譯效率有負面效應。
其他因素也可以影響蛋白表達,包括使mRNA去穩(wěn)定的序列。重新設計合成基因可以去除或改變這些序列,導致高水平表達。消除稀有密碼子、去除任何去穩(wěn)定序列和利用最佳密碼子的基因的重新設計都可能增加蛋白產量,使的蛋白生產更有效和經濟。