銷售熱線

19126518388
  • 技術(shù)文章ARTICLE

    您當(dāng)前的位置:首頁 > 技術(shù)文章 > 如何預(yù)測新基因編碼蛋白的氨基酸序列

    如何預(yù)測新基因編碼蛋白的氨基酸序列

    發(fā)布時間: 2021-08-21  點(diǎn)擊次數(shù): 2172次

    當(dāng)我們想研究一個新基因的功能時,我們首先預(yù)測一下它是否編碼蛋白,如果編碼蛋白,那編碼出的蛋白的最有可能的氨基酸序列是什么? 

    當(dāng)我們預(yù)測出該基因編碼的蛋白的氨基酸序列后,在數(shù)據(jù)庫中比對,如果比對出了一個高度相似的已知蛋白,那我們可以根據(jù)該蛋白的功能來大概的推測我們要研究的新基因所編碼的蛋白的功能,這將為我們之后研究該新基因的功能提供方向。 

    接下來我們就來說一下怎樣預(yù)測一個新基因編碼的蛋白的氨基酸序列。首先我們需要做的就是通過 5’- and 3’-RACE 技術(shù)得到該基因的全長 cDNA 序列,然后按以下步驟進(jìn)行即可。


    1.首先打開:web.expasy.org/translate/


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    2.將 DNA/RNA 序列輸入白色框中(應(yīng)輸入 cDNA 序列)


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    3.點(diǎn)擊下方的 TRANSLATE SEQUENCE。


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    4.點(diǎn)擊 TRANSLATE SEQUENCE 后會看到如下結(jié)果(紅色部分為可能的該段 DNA 序列的 ORF 編碼的氨基酸,因?yàn)檩斎?cDNA 序列后,并不是該段序列上的所有堿基都用來編碼氨基酸, 而是只有位于 ORF 框內(nèi)的堿基用來編碼氨基酸,ORF 是不確定,所以編碼的蛋白也不確定,那我們現(xiàn)在要做的就是得到最有可能的 氨基酸序列,紅色區(qū)域?yàn)楦鞣N可能)。


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    5.一般我們認(rèn)為紅色最多(即最長)的就是該段 cDNA 序列編碼的氨基酸序列。


    6.因?yàn)榈谝粋€紅色最多(即最長),那接下來就點(diǎn)擊第一個。


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    7.點(diǎn)擊進(jìn)入后會看到以下結(jié)果,我們會看到紅色中有許多的藍(lán)色字母(畫紅線的部分),如果我們仔細(xì)看了之后會發(fā)現(xiàn)藍(lán)色部分就是M---甲硫氨酸,我們都知道真核蛋白的起始氨基酸都是甲硫氨酸,也就是說畫紅線的部分就是可能的起始氨基酸部分,那只有一個是最有可能的,那就是使氨基酸序列最長的。因?yàn)橄聢D的結(jié)果中只有一個終止------在最后面,那我們選擇第一個劃線的 M 作為起始氨基酸使編碼的氨基酸序列最長 ,所以第一個M 最有可能是起始氨基酸。


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    8.那接下來就點(diǎn)擊第一個藍(lán)色的M,點(diǎn)擊后進(jìn)入會看到以下結(jié)果(紅色框內(nèi)即為該段cDNA序列最有可能編碼的氨基酸序列)


    如何預(yù)測新基因編碼蛋白的氨基酸序列


    9.我們還可以看到在結(jié)果的的最下方有一些工具(點(diǎn)擊第一個劃線部分可以得到該段氨基酸序列的 Fast 格式。那下方的四個劃線部分就是一些分析蛋白氨基酸序列的一些工具,比如可以拿該段氨基酸序列在數(shù)據(jù)庫中 Blast,劃線部分的這些工具就是對該段氨基酸序列進(jìn)行進(jìn)一步的分析,得到有關(guān)該段氨基酸序列更多的信息)。


    如何預(yù)測新基因編碼蛋白的氨基酸序列


產(chǎn)品中心 Products