【しげをサイエンス】ゲノムと言語の類似性

2020年12月5日

購読者の皆様、本日も当コラムにごアクセスいただき誠にありがとうございます。

しげをです。

本日のテーマは『ゲノムと言語の類似性』というテーマで切り込んでいきます。

1点お詫びです。最近老眼の進行が激しくて、小さい文字が見えにくくて仕方ないのです(笑)ですので、私自身が見えやすいように文字のサイズを大きめに設定することにしました。何卒ご容赦下さい(><)

では、早速参りましょう。

スポンサーリンク


1、ゲノムについて

ゲノムとは、ある生物が有するDNAすべてをしめす言葉である。ゲノム(DNA)は①リン酸基 ②デオキシリボース糖 ③塩基対(G,C,T,Aの中でGとC,TとAが対を形成する)からなり、塩基対の並び方の違いによりゲノムに違いが生じる。ヒトゲノムではこの塩基対が何と64億もあり、この中に我々が生きていくために必要なたんぱく質を合成するための遺伝子が含まれている。

遺伝子は1遺伝子当たり平均27,000個(最小で1000 最大で2,400,000でかなりばらつきが大きい)の塩基対からなり、ヒトゲノムの中には24,000個の遺伝子が存在している。このゲノムの中から遺伝子を含む必要な部分のみが読みだされ(転写)メッセンジャーRNA(mRNA)というものがつくりだされる、その後、mRNAはリボソームというところでトランスファーRNAの助けを借りて多くのタンパク質合成(翻訳)に寄与する。

これらのタンパク質から体反応を制御する酵素、DNA複製・修復材料、細胞、シグナル伝達物質などの身体に欠かせない物質が作り出されている。ゲノムの中でタンパク質を作り出している塩基対は全体の高々2%であり、残りの98%は他の役割を果たしている。まだまだ役割や機能が不明である点がゲノムには多いのである。

2、遺伝子数とタンパク質種類数の矛盾について

ヒトゲノムプロジェクトが始まる前はヒトの遺伝子は8万から 10万程度はあるのではないかと言われてきた。これはタンパク質1種類を生成するのに1つの遺伝子が必要であると考えられていたからである。しかし、プロジェクト終了後の結果では2万4千個の遺伝子しか発見されなかった。このことは一つの遺伝子が複数種類のタンパク質を生成していることであり、どのような仕組みでこのようなことが可能になるのかが話題になった。

3、選択的スプライシングについて

研究者の努力の結果、この矛盾は選択的スプライシングという機構で生じることがあきらかになった。次にこれについて説明する。

①DNAの遺伝子部分を読みだすとき、まず前駆体mRNAというものが生成される。この前駆体mRNAはタンパク質に翻訳される部分(エキソン)と翻訳されない部分(イントロン)からなり、それらが交互に並んだ形で形成されている。

②次に、スプライシングという現象が生じ全体または部分的にエキソンだけが残りイントロンはすべて除去されてしまう。このスプライシング処理で前駆体mRNAは成熟したmRNAに変化する。このスプライシングが1遺伝子から多種類のタンパク質を生成できる理由である。

今仮に、前駆体mRNAの段階で10個のエキソンと10個のイントロンが交互に並んでいたとする、この中から仮に8個のエキソンのみを使い(2個のエキソンと10個のイントロンは除去する)タンパク質を合成するとすると、10個から8個を選択する組み合わせの数となるので、45種類ものタンパク質の生成が可能となる。エキソンの選択方法は任意であるので、非常に多くの種類のタンパク質を生成できることになる。1遺伝子で多種類のタンパク質を生成できる理由はこのスプライシングにあったのである。

4、言語について

言語は脳のウェルニッケ野で形成され、ブローカ野から発せられるので、言語世界ではゲノムにおける遺伝からの読み込み(転写)からmRNAを生成するまではウェルニッケ野で処理され、その後はブローカ野でタンパク質に相当する言語を生成(翻訳)するといえる。ウェルニッケ野は細胞内の核(ゲノムを格納している)と核外部分に相当し、ブローカ野はタンパク質を生成するリボソームに相当すると言える。

ここからは私の考えであるが、言語全体をゲノムのようなものと考えると、文字1個は間違いなくDNAの塩基対に相当すると言える。この文字を並べて単語を生成するが、この単語自身は意味を有しているので、mRNAに近いものではないだろうか?単語を並べて文章にし、他の人とコミュニケーションすることは、mRNAから生成されたタンパク質で身体に必要なものを供給することとほとんど同じである。ゲノムと言語を比較すると、文字と塩基対、単語とmRNA、タンパク質と文章の対応はつくのであるが、最も重要な単語を生み出すもの、つまり、mRNAを作り出す遺伝子、前駆体mRNA,スプライシングが言語の世界では何に当たるのであろうか?

言語世界においてゲノムの中の遺伝子にあたるものは文法上の言語集団ではないかとおもっている。例えば、主語という言語集団からある特定の言語(例えば私)を選択するとするとこれが前駆体mRNAのエキソンに当たり残りはイントロンで切り捨てられる、次に動詞という言語集団から特定の言語(エキソン)が次は目的語の中から選ばれるという具合である。

言語集団は非常に多くあるが、必ずある一定のルールでまとめられている。主語という集団に動詞や形容詞は含まれることはないからである。この一定のルールというものが言語世界における遺伝子(言語集団)を特徴づけるものではないかと考えられる。この遺伝子内には一定のルールで決められたたくさんの言語が存在しているはずである、また、無意味な言葉もその中には将来のためにイントロンとなるようなものとして含まれているはずである。このようなルールを持った言語集団が豊富であればあるほど言語は明確なコミュニケーション手段となるはずである。遺伝子が多いほど、または、スプライシング機能が高いほど生成たんぱく質の種類が多く、高等生物になれるのと同じように、言語集団(言語における遺伝子)が多くあればあるほど、コミュニケーション能力が高まると言える。

5、日本語と英語について

よく日本語は英語よりも説明するのには劣った言語であると言われている。あくまで、物を伝えるという観点だけからいっているのであり、その他、日本語の方が優れている点も多くある。そこで、この理由を今までの議論から考えてみる。

まず、日本語なくて英語にあるものが多くある。

①時を表現する文法・・・英語には現在完了形などの時間的な表現が文法としてきちんと決められているものがある。

②仮定法・・・仮定法過去、仮定法過去完了など仮定法を表すときに文法としてきちんと形式が決められている。

このような文法は英語の方が多く、日本語は言葉を付け加えたりニュアンスで表現しようとしているので意味があいまいになる。つまり、言語集団のルールがはっきりしないのである。遺伝子があいまいであると出てくるタンパク質もあいまいになり、定義がはっきりした言葉にならないというわけである。

以上の議論ははなはだあいまいなものであることは筆者自身が理解しているが、生物学から得られた貴重な科学的事実を基に言語というあいまいで難解な分野を理解しようとすることは意義のある事だと考えている。

 

スポンサーリンク