Comparative Genome Analysis of Infectious Human and Domestic Animal Coronaviruses

Document Type : Microbiology and Immunology

Authors

1 Graduated from the Faculty of Veterinary Medicine, University of Tehran, Tehran, Iran

2 Department of Microbiology and Immunology, Faculty of Veterinary Medicine, University of Tehran, Tehran, Iran

3 Institute of Agricultural Biotechnology, National Institute of Genetic Engineering & Biotechnology (NIGEB), Tehran, Iran

Abstract

BACKGROUND: Coronaviruses, which mainly cause gastrointestinal and respiratory infections, have been identified in various species. Among the extensive genomic data of disease-causing Coronaviruses in humans and animals, some similarities can be analyzed by in-silico methods.   
OBJECTIVES: In the present study, comparative genome analysis of medical and veterinary medicine Coronaviruses was performed to obtain more accurate information about the genetic similarities and differences of different members of this family.
METHODS: The genomic sequences were retrieved from NCBI and Virus Pathogen Resource databases. Using the NCBI database blast algorithm, all sequences were aligned with the SARS-CoV-2 genome sequence, and similarity was obtained. Amino acid sequences of structural and non-structural proteins associated with coding regions (CDS) were aligned separately with the SARS-CoV-2, and their similarities were calculated. The 3D structure from each protein was compared with the corresponding protein in SARS-CoV-2, and Template Modeling Scores (TM-Score) were obtained. A phylogenetic tree of different species of the Coronaviridae family was drawn based on nucleotide and amino acid sequence data.
RESULTS: Nonstructural coding gene sequences detected the highest interspecies similarities in nucleotide, amino acid sequence, and 3D structure (nsp12, nsp13, nsp14, and nsp16). The ORF1ab, encoding non-structural proteins, carries essential functions for viral replication.
CONCLUSIONS: This study showed that the transcription complex is highly conserved among human and animal Coronaviruses. A comparison and analysis of the Coronaviridae transcription complex can be considered a key target for diagnosing, developing antiviral therapies, and designing vaccines.

Keywords

Main Subjects


مقدمه

 

اعضای خانواده کرونا (Coronaviridae)، ویروس‌هایی پوشش‌دار با ژنوم رنای (RNA) تک رشته‌ای مثبت می‎باشند. در بین ویروس‌های رنا، کروناویروس‌ها (Coronaviruses) با دارا بودن ژنومی به طول 25 تا 32 کیلوباز، طویل‌ترین توالی ژنومی را دارند (1-3). ویروس‌های این خانواده قادرند طیف وسیعی از میزبانان شامل پرندگان، دوزیستان، جوندگان، پستانداران وحشی و اهلی و انسان را آلوده کنند (4-6). تعدادی از اعضای این خانواده در اوایل دهه 1930 به عنوان عامل ایجاد برونشیت عفونی پرندگان، گاستروآنتریت خوک، هپاتیت حاد و عوارض عصبی در موش شناخته شدند (6، 7). کرونا ویروس‌های عامل بیماری انسان مدتی بعد و در دهه 1960 از میان پاتوژن‌های تنفسی انسان جداسازی و تشخیص داده شدند (8، 9). در اواخر سال 2002 میلادی، شیوع یکی از گونه‌های این خانواده با نام سارس  (SARS-CoV) باعث بروز عوارض تنفسی شدید (سندرم حاد تنفسی) در انسان شد. مرگ و میر ناشی از ابتلا به این ویروس حدود 15 درصد اعلام شد (10). تاکنون بیش از 30 گونه جانوری مختلف از جمله خفاش نعل اسبی و انواعی از سیکوت‌ها به عنوان مظنونین انتقال ویروس به انسان معرفی شده‌اند (11). ده سال پس از آن، در سال 2012 کرونا ویروس دیگری در منطقه خاورمیانه شیوع یافت که مرس  (MERS-CoV) نام گرفت و مرگ و میر حدود 37 درصدی را ثبت نمود (10). در مورد ویروس MERS مطالعات متعدد نشان داد که شتر عامل اصلی انتقال آن به انسان بوده است (12-14). در سال 2019 میلادی، بیماری دیگری با علائم نسبتاً مشابه در کشور چین ظاهر شد و مطالعات بعدی ثابت کرد که عامل این بیماری از نظر ژنتیکی شباهت بسیار زیادی به ویروس سارس دارد. به همین دلیل ویروس نوظهور را سارس کوو-2  (SARS-CoV-2) و بیماری ناشی از آن را کووید-19 (COVID-19) نامیدند (15، 16). در مورد منشأ پیدایش بیماری همچنان فرضیه‌های متعددی مطرح است اما به نظر می‌رسد خفاش‌ها همانند اپیدمی ناشی از ویروس SARS-CoV یکی از عوامل اصلی انتقال این ویروس به انسان بوده‌اند (17، 18). بیماری کووید 19 برخلاف اپیدمی‌های SARS و MERS زمانی شناسایی شد که تعداد زیادی از افراد آلوده به ویروس SARS-CoV-2 به مناطق مختلف جهان سفر کرده بودند. این مسئله سبب شد تا موارد متعددی از این بیماری به سرعت از سرتاسر جهان گزارش شود. به همین دلیل سازمان بهداشت جهانی در سال 2020 برای این بیماری وضعیت همه‌گیری جهانی اعلام کرد (19). بر اساس اطلاعات پایگاه Worldometer تا لحظه نگارش این مطالعه بیش از پانصد و شصت میلیون مورد از این بیماری در جهان گزارش شده است و بیش از 6 میلیون نفر بر اثر این بیماری جان خود را از دست داده‌اند.

بر اساس طبقه‌بندی جدید، خانواده Coronaviridae را به دو زیر خانواده Orthocoronavirinae و Letovirinae تقسیم می‌کنند. زیرخانواده Orthocoronavirinae شامل چهار جنس آلفاکروناویروس، بتاکروناویروس، گاماکروناویروس و دلتاکروناویروس است (6). به طور کلی آلفا و بتا کروناویروس‌ها عمدتاً پستانداران را آلوده کرده و موجب درگیری تنفسی در انسان و گوارشی در حیوانات می‎شوند (20). گاما کروناویروس‌ها و دلتا کروناویروس‌ها عمدتاً پرندگان را آلوده می‌کنند؛ با این حال بعضی از آن‌ها می‌توانند پستانداران را نیز آلوده کنند (21). تاکنون هفت کرونا ویروس انسانی شناسایی شده است که دو مورد آن یعنی Human coronavirus 229E (HCoV-229E) و (HCoV-NL-63) Human coronavirus NL63 در جنس آلفا کرونا ویروس و پنج مورد دیگر یعنی Human coronavirus HKU1 (HCoV-HKU1)، Human coronavirus OC43 (HCoV-OC43)، MERS-CoV، SARS-CoV و SARS-CoV-2 در جنس بتا کرونا ویروس قرار دارند. با مشخص شدن توالی ژنومی SARS-CoV-2، این ویروس نیز در جنس بتا کروناویروس قرار داده شده است (22, 23).

در میزبان‌های مستعد، کرونا ویروس‌ها بیشتر از راه تنفسی و یا مدفوعی-دهانی منتقل می‎شوند و عموم آن‌ها اولین تکثیر خود را در یاخته‌های اپی‌تلیال انجام می‌دهند (24، 25). برخی نظیرHCoV-OC43 ، HCoV-229E و Porcine respiratory coronavirus (PRCoV) اغلب در یاخته‌های اپی‌تلیال سیستم تنفسی تکثیر می‌شوند (26). مابقی کرونا ویروس‌ها نظیر Transmissible gastroenteritis virus (TGEV)،Bovine coronavirus (BCoV) ، Porcine hemagglutinating encephalomyelitis virus (PHEV) ،(CCoV)  Canine coronavirus،  Feline coronavirus (FCoV) و سویه گوارشی (MHV) Mouse hepatitis virus یاخته‌های اپی‌تلیال لوله گوارش را آلوده می‌کنند (27).

علائم ناشی از عفونت‌های کرونا ویروسی بسیار متنوع است. برخی از این ویروس‌ها عفونت‌های روده‌ای بی‌علامت ایجاد می‌کنند که در حیوانات بالغ موجب بقا ویروس در جمعیت می‌شود. از طرف دیگر برخی از این ویروس‌ها ممکن است باعث بروز بیماری شدید در میزبانان خود شوند. TGEV منجر به ایجاد اسهال در حیوانات جوان می‌شود و معمولاً کشنده است (27، 28). همچنین، SARS-CoV پس از ایجاد عفونت در مسیر هوایی فوقانی، باعث عفونت شدید مسیر تنفسی تحتانی شده و یا Feline infectious peritonitis virus  (FIPV) به صورت سیستمیک ‌گسترش می‌یابد و منجر به بیماری‌های تحلیل‌برنده در گربه‌سانان می‌شود (29، 30). گونه‌های کروناویروس موشی نیز موجب عفونت‌های تنفسی یا غدد اشکی و بزاقی می‌شوند و در صورت تداخل با سیستم ادراری-تناسلی ماده در تولید مثل نیز اختلال ایجاد می‌کنند. PHEV در خوک عمدتاً عفونت روده‌ای ایجاد می‌کند ولی می‌تواند نوروتروپیک هم باشد. عفونت حاصل از این ویروس اعصاب معده را درگیر کرده و مانع از تخلیه معده می‌شود که حاصل آن استفراغ و بیماری تحلیل برنده است (31-33).

ژنوم کرونا ویروس‌ها دو ناحیه UTR در دو سمت3´  و  5´دارد که شامل  7 تا 11 قاب خوانش (ORF) می‌شود. اولین ORF از سمت5’ UTR ، ORF1ab است که دو سوم ژنوم ویروس را تشکیل می‌دهد و شانزده پروتئین غیر ساختاری را کد می‌کند که در فعالیت‌های رونوشت‌برداری و همانندسازی ژنوم نقش دارند. یک سوم باقی مانده ژنوم، پروتئین‌های ساختاری شامل گلیکوپروتئین اسپایک (S)، پروتئین ماتریکس  (M)، پروتئین پوششی (E)، پروتئین نوکلئوکپسید (N) و هم چنین تعدادی پروتئین فرعی را تولید می‌کند که در بین کروناویروس‌های مختلف متفاوت است (22، 34، 35).

با توجه به این که SARS-CoV-2  سومین کرونا ویروسی می‎باشد که پس از دو ویروس MERS-CoV و SARS-CoV در طول دو دهه اخیر توانسته است با عبور از گونه‌های حیوانی، انسان را آلوده کند، زنگ خطر توجه بیشتر به روند شیوع و بیماریزایی کرونا ویروس‌ها به صدا در آمده است. نظر به نقش مهم حیوانات در انتقال گونه‌های مختلف کروناویروس به انسان و احتمال بروز اپیدمی‌های زئونوتیک مشابه در دهه‌های آینده، مقایسه ژنومی و پروتئومی گونه‌های مختلف کروناویروسی و دست‌یابی به توالی حراست شده (Conserved) در بین اعضای این خانواده برای اهداف تشخیصی و یا درمانی و همچنین تولید واکسن کارآمد بسیار مفید است. در مطالعه حاضر مقایسه ژنومی، پروتئینی و سلسله تبار کروناویروس‌های مهم در حوزه پزشکی و دامپزشکی با هدف دست‌یابی به اطلاعات بیشتر و دقیق‌تر از تشابهات و تفاوت‌های ژنتیکی اعضای مختلف این خانواده صورت گرفته است.

مواد و روش کار

جمع‌آوری داده‌ها و مقایسه توالی‌ها: توالی کامل ژنوم و پروتئین‌های گونه‌های ویروسی مهم از لحاظ دامپزشکی از بانک ژن NCBI (https://www.ncbi.nlm.nih.gov) استخراج شد (جدول 1). هر توالی با توالی متناظر خود در ویروس SARS-CoV-2 با استفاده از الگوریتم بلاست  NCBIمورد مقایسه قرار گرفت و نتایج به صورت درصد شباهت (Similarity) گزارش شد (جدول 3). همچنین، توالی نوکلئوتیدی ژنوم هر یک از ویروس‌ها از پایگاه داده Virus Pathogen Resource (ViPR) دریافت و با استفاده از الگوریتم بلاست از نظر هومولوژی با ژنوم ویروس SARS-CoV-2 مورد مقایسه قرار گرفت (جدول 4). در ادامه درصد شباهت توالی پروتئین‌های غیرساختاری در گونه‌های مختلف این خانواده در مقایسه با توالی‌ متناظر آن‌ها در ویروس SARS-CoV-2 مورد ارزیابی قرار گرفت که نتایج آن در تصویر 2 قابل مشاهده است.

پیش‌بینی شکل فضایی پروتئین‌ها: پس از مقایسه توالی‌های خطی نوکلئوتیدی و آمینواسیدی، جهت ترسیم و پیش‌بینی شکل فضایی پروتئین‌ها، از سرور Robetta استفاده شد. این سرور جهت ترسیم ساختار سه بعدی پروتئین‌ها از مدل­سازی‌های هومولوژی و ab initio به صورت ترکیبی استفاده می‌کند. در مدل‌سازی هومولوژی، اشکال سه بعدی پروتئینی که ساختاری نامشخص دارد را بر اساس تشابه توالی با پروتئین‌های واجد اشکال مشخص ترسیم می‌کنند. در مدل‌سازی ab initio ساختار سه بعدی مد نظر محققین فقط بر اساس اطلاعات مربوط به توالی پروتئین ترسیم می­شود. لازم به ذکر است که برخی از مدل‌های سه بعدی پروتئین‌های غیرساختاری کرونا ویروس‌ها قبلاً در سایر مطالعات گزارش شده است. این مدل‌ها از پایگاهRCSB  (https://www.rcsb.org/) استخراج گردید. لیست این مدل‌ها و PDB ID هرکدام از آن‌ها در جدول 2 قابل مشاهده است.

تحلیل دو به دو تشابهات ساختاری: از میان مدل‌های سه بعدی موجود در پایگاه RCSB و همچنین براساس نتایج پیش‌بینی و ترسیم اشکال پروتئین‌هایی که مدل سه بعدی آن‌ها در دسترس نبود، مجموعه‌ای از مدل‌ها با 3 شرط جهت ورود به تحلیل‌های بعدی انتخاب شدند: 1- در رابطه با مدل‌هایی که ساختار آن‌ها با سرور Robetta پیش‌بینی شد، تنها مدل‌هایی انتخاب شدند که سطح اطمینان سرور از دقت کلی ساختار فضایی آن‌ها بالاتر از 70 درصد بود. 2- مدل‌های فضایی مربوط به توالی‌های اسیدآمینه که کمتر از 30 درصد شباهت با توالی متناظر خود در ویروس SARS-CoV-2 داشتند از مجموعه کنار گذاشته شدند. 3- توالی‌های اسیدآمینه که با توالی متناظر خود در ویروس SARS-CoV-2 کمتر از 90 درصد هم‌پوشانی (Covarage) داشتند از مجموعه حذف شدند. در ادامه با استفاده از روش "تحلیل دو به دو تشابهات ساختاری" (Pairwise structure alignment analysis) که در پایگاه RCSB موجود است (www.rcsb.org/alignment)، میزان شباهت ساختاری و ترکیبی (Conformation) پروتئین‌های ویروس SARS-CoV-2 با پروتئین‌های متناظر موجود در سایر کرونا ویروس‌ها (پروتئین‌های حائز 3 شرط مطرح شده) محاسبه شد. بدین منظور برای مقایسه‌ها از الگوریتم jFATCAT (rigid) استفاده شد. از این الگوریتم معمولاً هنگام مقایسه ساختار فضایی پروتئین‌هایی که از نظر تکاملی قرابت زیادی دارند استفاده می‌شود. نتایج این مرحله با شاخص مدل امتیازدهی قالبی یا Template modeling score (TM-score) گزارش شده است. امروزه این شاخص یکی از مهم‌ترین شاخص‌های بررسی میزان شباهت ساختار فضایی دو پروتئین می‎باشد. میزان TM-score می‌تواند بین مقادیر صفر و یک متغیر باشد و هر چه TM-score به عدد یک نزدیک‌تر باشد، آن دو پروتئین از نظر ساختار فضایی به هم شبیه‌تر هستند (36، 37).

تحلیل سلسله تبار: به منظور بررسی تنوع ژنتیکی، درخت سلسله‌تبار بر اساس توالی نوکلئوتیدی مربوط به ژنوم کامل و همچنین توالی‌های اسیدآمینه و با استفاده از متدNeighbor-joining  با کمک روش Clustal W و با Bootstrap 1000  رسم شد. برای ترسیم درخت سلسله تبار از نرم‌افزار MEGA Version 7 استفاده شد.

نتایج

نتایج تحلیل همسانی (هومولوژی): در تصویر 1 ساختار ژنوم ویروس SARS-CoV-2 با ژنوم سایر کروناویروس‌های مهم بیماریزا در دام مقایسه شده است. نتایج بررسی توالی پروتئین‌ها نشان داد که پروتئین‌های ساختاری S،M  ، N و E در گونه SARS-CoV درصد شباهت بالایی با SARS-CoV-2 دارد ولی در سایر گونه‌ها شباهت پایین‌تر از 50 درصد است (جدول 3). همچنین، یافته‌های حاصل از هم ردیف سازی ژنوم کامل کرونا ویروس‌ها و ویروس SARS-CoV-2 نشان دهنده نواحی مشترک حراست شده در توالی پروتئینی ناحیه ORF1ab است )جدول 4).

با توجه به نتایج به‌دست آمده ناحیه ORF1ab برای تحلیل همردیفی انتخاب شد. این ناحیه در بین گونه‌های مختلف بررسی و داده‌های مربوط به هر توالی (nt) با مشابهت بالاتر از 80 درصد گزارش شدند (جدول 4).

هومولوژی پروتئین‌های کد شده توسط ناحیه ژنومی ORF1ab در گونه‌های مهم بیماریزای کرونا ویریده به تفکیک با پروتئین مترادف آن‌ها در SARS-CoV-2 بررسی شد. نتایج این مقایسه نشان داد که پروتئین غیر ساختاری nsp1، به غیر از گونه SARS-CoV که هومولوژی بالایی با SARS-CoV-2 دارد (44/84 درصد)، در سایر گونه‌ها از تنوع زیادی برخوردار است که در مقایسه با SARS-CoV-2 درصد شباهت قابل ارزیابی ندارد.

همچنین، بررسی هومولوژی سایر پروتئین‌های غیر ساختاری نشان داد که پروتئین‌های غیر ساختاری nsp2، nsp3، nsp4، nsp5، nsp6، nsp7، nsp8، nsp9 و nsp15 در کرونا ویروس‌های انتخاب شده درصد شباهت پایینی به پروتئین متناظر خود در SARS-CoV-2 دارند و از این بینnsp2 ، nsp3 وnsp4  درصد شباهت بسیار پایین‌تری داشتند، به استثنای SARS-CoV که در تمام پروتئین‌های ساختاری و غیر ساختاری درصد شباهت بالایی با SARS-CoV-2 داشت.

در بین پروتئین‌های ساختاری و غیر ساختاری، نواحی مربوط به پروتئین‌های غیر ساختاری nsp12، nsp13، nsp14 و nsp16 بیشتر حراست شده‌اند و در این بین پروتئین‌های  nsp12و nsp13 بالاترین درصد شباهت بین گونه‌ای را دارا بودند (تصویر 2).

نتایج بررسی دو به دو تشابهات ساختاری: به طور کلی به نظر می‌رسد نتایج این بخش با نتایج ذکر شده در بخش تحلیل هومولوژی توالی‌ها مطابقت داشت. همان طور که در جدول 5 قابل مشاهده است، TM-score حاصل از مقایسه ساختار فضایی پروتئین‌های nsp12، nsp13، nsp14 و nsp16 ویروس SARS-CoV-2 و دیگر اعضای کروناویریده از سایر پروتئین‌های غیرساختاری بیشتر بود. در رابطه با پروتئین‌های nsp12 و nsp13 مقدار TM-score در تمام گونه‌ها بزرگ‌تر یا مساوی با 95/0 بود که نشان‌دهنده وجود نوعی ساختار فضایی حراست شده در این پروتئین‌ها می‌باشد. مقدار TM-score حاصل از مقایسه ساختار فضایی پروتئین nsp12 در ویروس SARS-CoV-2 و ویروس‌های IBV، FCoV، CCoV و BCoV برابر با عدد 98/0 بود (به ترتیب تصاویر‌ 6-3). مقدار این شاخص در مقایسه ساختار فضایی پروتئین nsp13 در ویروس‌های پیش‌تر ذکر شده نیز به ترتیب برابر 97/0، 95/0، 95/0 و 98/0 بود که نتایج آن در تصاویر 3 تا 6 قابل مشاهده می‌باشد. همچنین مقدار TM-score پروتئین‌های nsp16 و nsp14 در تمام گونه‌ها به ترتیب از عدد 94/0 و 92/0 بیشتر بود. در رابطه با TM-score سایر پروتئین‌ها یک یا چند عدد کوچک‌تر از 9/0 وجود داشت.

نتایج تحلیل سلسله‌تبار: مطابق با نتایج به دست آمده از تحلیل ژنوم کامل ویروس‌ها، گونه‌های SARS-CoV، SARS-CoV-2، MERS-CoV، BCoV و HCoV-HKU1 نیای مشترکی داشتند. کرونا ویروس گاو (BCoV) و انسان (HKU1) قرابت ژنتیکی بیشتری داشتند و همچنین ویروس‌های SARS-CoV و SARS-CoV-2  در یک زیرشاخه قرار گرفته و به هم نزدیک‌تر بودند. این دو با یک شاخه از MERS-CoV جدا شده‌اند. کرونا ویروس‌های FCoV وCCoV نیز قرابت ژنتیکی بیشتری داشتند و با کرونا ویروس انسانی NL63 دارای یک نیای مشترک بودند و همچنین کروناویروس IBV از طریق یک شاخه بلند با این سه گونه نیای مشترکی داشت (تصویر 7).

در ادامه، توالی ORF1ab مبنای رسم درخت سلسله تبار در نظر گرفته شد. همانند تحلیل قبل، نتایج این تحلیل نیز نشان داد که گونه‌های SARS-CoV، SARS-CoV-2، MERS-CoV، BCoV و HCoV-HKU1 نیای مشترکی داشتند. بر اساس نتایج حاصل، قرابت ژنتیکی بالایی میان SARS-CoV و SARS-CoV-2 و همچنین FCoV و CCoV مشاهده شد. گونه HCoV-NL63 و دو گونه CCoV و FCoV نیز دارای نیای مشترکی بودند. کرونا ویروس IBV نیز از طریق یک شاخه بلند از سایر گونه‌ها جدا شده بود. نتایج این تحلیل در تصویر 8 قابل مشاهده است.

بحث

کروناویروس‌ها طیف وسیعی از میزبانان را آلوده کرده و برخی از گونه‌های جانوری در انتقال بیماری‌های ناشی از این خانواده ویروسی به انسان نقش مهمی دارند. با توجه به این موارد، امکان انتقال بین گونه‌ای از حیوانات به انسان و بروز اپیدمی‌ها و همه‌گیری‌های مشابه در آینده دور از انتظار نیست. این مسئله لزوم توجه به کروناویروس‌های جانوری را بیش از پیش برجسته می‌سازد. بنابراین، بررسی تشابهات و تفاوت‌های بین‌گونه‌ای اعضای خانواده کرونا در سطح نوکلئوتید، اسیدآمینه و ساختار فضایی پروتئین‌ها با هدف دست‌یابی به نواحی حراست شده می‌تواند برای تشخیص ویروس و طراحی واکسن‌هایی که قادر به تحریک ایمنی سلولی هستند و همچنین تولید پادتن‌های خنثی کننده متقاطع (Cross-neutralizing antibodies) بسیار مفید باشد. اثر این پادتن‌ها اگر بر علیه طیف وسیعی از کروناویروس‌ها مؤثر باشند از اهمیت زیادی در پزشکی و دامپزشکی و به‌ویژه سلامت واحد برخوردار است.

در مطالعه حاضر، یافته‌های حاصل از هم‌ردیفی توالی ژنوم برخی از ویروس‌های کروناویریده (دارای اهمیت از نظر دامپزشکی و پزشکی) و ویروس SARS-CoV-2 نشان داد که نواحی حراست شده عمدتاً در ناحیه ORF1ab قرار گرفته‌اند. این یافته در برخی از مطالعات پیشین برای سایر گونه‌ها نیز گزارش شده است (38، 39). به عنوان مثال در مطالعه‌ای که در سال 2010 (قبل از شیوع ویروس­های MERS-CoV و SARS-CoV-2) توسط Woo و همکاران به چاپ رسیده است نیز از ORF1ab به عنوان محل قرارگیری عمده توالی‌های حراست شده برخی از اعضای خانواده Coronaviridae یاد شده است (40). در ادامه، بررسی دقیق‌تر ORF1ab مشخص کرد که از میان پروتئین‌های کد شونده توسط این ناحیه، nsp12، nsp13، nsp14 و nsp16 بیشترین شباهت بین‌گونه‌ای را دارا هستند و گونه‌های مختلف این خانواده از نظر توالی اسیدآمینه مربوط به این 4 پروتئین حداقل 50 درصد شباهت با توالی‌های متناظر SARS-CoV-2 دارند. این شباهت سبب شد تا در مرحله بعد با استفاده از سرور Robetta ساختار فضایی پروتئین‌های کدشونده توسط ناحیه ژنی ORF1ab پیش‌بینی شود تا علاوه بر مقایسه توالی‌های خطی نوکلئوتیدی و آمینواسیدی، بتوان ساختار فضایی پروتئین‌های مربوطه را در ویروس SARS-CoV-2 و سایر کرونا ویروس‌ها مقایسه کرد (41).

همان‌طور که ذکر شد، امروزه به فراوانی از شاخص TM-score در مطالعات ایمونوبیوانفورماتیک استفاده می‌شود. بنا بر نتایج مطالعات پیشین، TM-score کمتر از 2/0 معمولاً نشان‌دهنده عدم وجود شباهت ساختاری میان دو پروتئین است، حال آن‌که در صورتی که این شاخص از عدد 5/0 بزرگ‌تر باشد در اغلب موارد نشان‌دهنده نحوه تاخوردگی (Folding) یکسان دو پروتئین است (36، 37). اعداد موجود در جدول 5 نشان‌دهنده آن است که شاخص TM-score مربوط به همه پروتئین‌های غیرساختاری بالاتر از عدد 5/0 است. این موضوع نشان داد که اساس ساختار فضایی مربوط به پروتئین‌های غیرساختاری در همه گونه‌های کرونا ویروسی یکسان می‌باشد و شباهت غیرقابل‌ انکاری میان آن‌ها مشاهده می‌شود. میزان این شباهت‌ها در پروتئین‌های nsp12، nsp13، nsp14 و nsp16 به حداکثر می‌رسد و این نتیجه‌گیری با نتایج حاصل از تحلیل هومولوژی توالی‌ها کاملاً مطابقت دارد.

نتایج حاصل از تحلیل سلسله تبار بر مبنای ORF1ab نشان داد که گونه‌هایی که قرابت بیشتری داشتند، درصد شباهت بالاتری نیز در توالی ORF1ab دارند. در مطالعات پیشین نیز از بخشی از پروتئین‌های کدشونده توسط ناحیه ژنی ORF1ab جهت انجام تحلیل سلسله تبار استفاده شده است. به عنوان مثال در مطالعه‌ای از RNA پلیمراز وابسته به RNA جهت ترسیم درخت سلسله تبار اعضای خانواده Coronaviridae استفاده شد. نتایج این مطالعه مطابقت بالایی با نتایج مطالعه حاضر دارد (40). لازم به ذکر است که nsp12 و nsp13 برخی از کرونا ویروس‌های جدا شده از خفاش‌ها شباهت بالایی با SARS-CoV-2 دارند. این یافته یکی از دلایل مطرح بودن خفاش‌ها به عنوان عامل انتقال ویروس SARS-CoV-2 به انسان است (42).

مطابق با نتایج مطالعات پیشین، nsp12 یک RNA پلیمراز وابسته به RNA است و nsp13 هم نقش هلیکازی دارد. همچنین، عملکرد nsp14  غلط‌گیری (proofreading) است و nsp16 به عنوان یک ریبوز متیل ترانسفراز فعالیت می‌کند. به بیان دقیق‌تر، نقش اصلی این 4 پروتئین غیرساختاری، تنظیم فعالیت‌های مرتبط با رونوشت برداری ویروس می‌باشد (43-46). بنابراین، به نظر می‌رسد سازوکار‌های مرتبط با رونوشت برداری ویروس‌های این خانواده تا حد زیادی میان اعضای آن حفظ شده است.

برخلاف ORF1ab، پروتئین‌های ساختاری مهم این خانواده نظیر گلیکوپروتئین اسپایک، پروتئین ماتریکس، پروتئین پوششی و پروتئین نوکلئوکپسید تنوع بالایی در میان اعضای مختلف دارند و به نظر می‌رسد توالی‌های حراست شده قابل توجهی در مقایسه با پروتئین‌های کدشونده توسط ناحیه ژنی ORF1ab در آن‌ها وجود ندارد. البته در رابطه با وجود یا عدم وجود ساختار فضایی حراست شده در پروتئین‌های ساختاری نیاز است تا مطالعات بیشتری انجام شود.

همان‌طور که در جدول 3 مشخص است، شباهت فضایی بالایی میان پروتئین‌های غیرساختاری اعضای خانواده کروناویریده وجود دارد. این شباهت فضایی می‌تواند سبب ایجاد نتایج مثبت کاذب در تشخیص مبتنی بر شناسایی پروتئین شود. در این صورت می‌توان بخش‌هایی از ژن را که اختصاصی هر ویروس است با استفاده از روش‌هایی نظیر PCR هدف قرار داد. البته در مورد داروها و واکسن‌ها عکس این موضوع صادق است. پروتئین‌های غیرساختاری به دلیل شباهت ساختار فضایی خود می‌توانند اهداف بسیار مناسبی برای توسعه و تولید انواع داروها و واکسن‌های ضد کروناویروس‌ها باشند. عوامل هدف‌ قرار دهنده این پروتئین‌ها می‌توانند به‌طور همزمان بر علیه طیف وسیعی از کروناویروس‌ها مؤثر باشند. به عنوان مثال، داروی Remdesivir که در عفونت‌های ویروسی به فراوانی از آن استفاده می‌شود، کمپلکس رونویسی ویروس را هدف قرار می‌دهد (47). با استراتژی مشابهی، می‌توان به تولید انواع داروهای ضد ویروس که کمپلکس رونویسی را هدف قرار می‌دهند پرداخت. همچنین از مناطق حراست شده در پروتئین‌های غیر ساختاری می‌توان برای روش‌های تشخیصی مبتنی بر تفکیک افراد بیمار از واکسینه (DIVA) نیز بهره برد.

برخی از مطالعات پیشین با استفاده از ابزارهای ایمونوانفورماتیک به بررسی قابلیت تحریک پاسخ ایمنی سلولی پروتئین‌های غیرساختاری کدشونده توسط ناحیه ژنی ORF1ab در سطح in silico پرداخته‌اند. به عنوان مثال در مطالعه‌ای که توسط Gustiananda و همکاران در سال 2021 به چاپ رسیده است گزارش شده است که برخی از اپی‌توپ‌های پروتئین‌های غیرساختاری ویروس SARS-CoV-2 می‌تواند به خوبی توسط مولکول‌های MHC کلاس 1 و 2 به گیرنده‌های یاخته‌های T عرضه شود و آن‌ها را تحریک کند (48). در رابطه با قابلیت پروتئین‌های غیرساختاری در تحریک پاسخ ایمنی هومورال مطالعه‎ای تا به امروز به چاپ نرسیده است.

نتیجه‌گیری نهایی: پیش از این نیز مقایسه ژنومی برای کروناویروس‌ها انجام شده است اما در مرور این یافته‌ها به کرونا ویروس‌های انسانی و دامی یا به عبارتی مهم از نظر دامپزشکی اشاره‌ای نشده است. مطالعه حاضر اولین بررسی بیوانفورماتیک برای مقایسه و تحلیل توالی و ساختارهای کروناویروس‌های مهم بیماریزا در دامپزشکی است که به پیشبینی ساختار سه بعدی پروتئین‌های کدشونده توسط ناحیه ژنی حراست شده ORF1ab پرداخته است. با توجه به مواردی که ذکر شد و نظر به چالش‌های توسعه واکسن و دارو علیه ویروس‌های رنا (به دلیل نرخ بالای وقوع جهش در این ویروس‌ها)، استفاده از پروتئین‌های دخیل در رونوشت برداری ویروس‌های خانواده Coronaviridae می‌تواند به عنوان یک راهکار مناسب جهت توسعه دارو و واکسن‌های مؤثر بر ویروس‌های این خانواده در نظر گرفته شود. توجه به این موضوع می‌تواند از بروز اپیدمی‌های ناشی از کروناویروس‌های انسانی و دامی در آینده پیشگیری کند.

سپاسگزاری

 نویسندگان از معاونت پژوهشی دانشگاه تهران و دانشکده دامپزشکی جهت تأمین اعتبار و امکانات مطالعه حاضر قدردانی می‌کنند.

تعارض منافع

بین نویسندگان تعارض در منافع گزارش نشده است.

  1. Alexandersen S, Chamings A, Bhatta TR. SARS-CoV-2 genomic and subgenomic RNAs in diagnostic samples are not an indicator of active replication. Nat Commun. 2020;11:1-13. doi: 10.1038/s41467-020-19883-7 PMID: 33247099
  2. Cao C, Cai Z, Xiao X, Rao J, Chen J, Hu N, et al. The architecture of the SARS-CoV-2 RNA genome inside virion. Nat Commun. 2021;12:1-14. doi: 10.1038/s41467-021-22785-x PMID: 34168138
  3. Viehweger A, Krautwurst S, Lamkiewicz K, Madhugiri R, Ziebuhr J, Hölzer M, et al. Direct RNA nanopore sequencing of full-length coronavirus genomes provides novel insights into structural variants and enables modification analysis. Genome Res. 2019; 29: 1545-1554. doi: 10.1101/gr.247064.118 PMID: 31439691
  4. Fung TS, Liu DX. Human coronavirus: Host-pathogen interaction. Annu Rev Microbiol. 2019;73:529-557. doi: 10.1146/annurev-micro-020518-115759 PMID: 31226023
  5. de Wilde AH, Snijder EJ, Kikkert M, van Hemert MJ. Host factors in coronavirus replication. Curr Top Microbiol Immunol. 2018;419:1-42. doi: 10.1007/82_2017_25 PMID: 28643204
  6. Zhou Z, Qiu Y, Ge X. The taxonomy, host range and pathogenicity of coronaviruses and other viruses in the Nidovirales order. Anim Dis. 2021;1:5. doi: 10.1186/s44149-021-00005-9
  7. Peiris JSM. Coronaviruses. Medical microbiology: eighteenth edition. 2012;2:587-593.
  8. Hu B, Ge X, Wang L-F, Shi Z. Bat origin of human coronaviruses. Virol J. 2015;12:1-10. . doi: 10.1186/s12985-015-0422-1
  9. Kahn JS, McIntosh K. History and recent advances in coronavirus discovery. Pediatr Infect Dis J. 2005;24:223-227. doi: 10.1007/7653_2020_47
  10. Abdelghany TM, Ganash M, Bakri MM, Qanash H, Al-Rajhi AMH, Elhussieny NI. SARS-CoV-2, the other face to SARS-CoV and MERS-CoV: Future predictions. Biomed J. 2021;44:86-93. doi: 10.1016/j.bj.2020.10.008 PMID: 33602634
  11. Shi Z, Hu Z. A review of studies on animal reservoirs of the SARS coronavirus. Virus Res. 2008;134:74-87. doi: 10.1016/j.virusres.2007.03.012 PMID: 17451830
  12. Mohd HA, Al-Tawfiq JA, Memish ZA. Middle East Respiratory Syndrome Coronavirus (MERS-CoV) origin and animal reservoir. Virol J. 2016; 13:87. doi: 10.1186/s12985-016-0544-0 PMID: 27255185
  13. Reusken CEM, Haagmans BL, Koopmans MPG. [Dromedary camels and Middle East respiratory syndrome: MERS coronavirus in the ’ship of the desert’]. Nederlands Tijdschrift Voor Geneeskunde. 2014;158:1-15. PMID: 25248734
  14. Adney DR, Letko M, Ragan IK, Scott D, van Doremalen N, Bowen RA, et al. Bactrian camels shed large quantities of Middle East respiratory syndrome coronavirus (MERS-CoV) after experimental infection*. Emerg Microbes Infect. 2019;8:717-723. doi: 10.1080/22221751.2019.1618687 PMID: 31119984
  15. Petersen E, Koopmans M, Go U, Hamer DH, Petrosillo N, Castelli F, et al. Comparing SARS-CoV-2 with SARS-CoV and influenza pandemics.  Lancet Infect Dis. 2020; 20: 238-244. doi: 10.1016/S1473-3099(20)30484-9 PMID: 32628905
  16. Chen Z, Boon SS, Wang MH, Chan RWY, Chan PKS. Genomic and evolutionary comparison between SARS-CoV-2 and other human coronaviruses. J Virol Methods. 2021;289:1-12. doi: 10.1016/j.jviromet.2020.114032 PMID: 33290786
  17. Latinne A, Hu B, Olival KJ, Zhu G, Zhang L, Li H, et al. Origin and cross-species transmission of bat coronaviruses in China. Nat Commun. 2020;11:1-15. doi: 10.1038/s41467-020-17687-3 PMID: 32843626
  18. Wong YC, Lau SY, Wang To KK, Mok BWY, Li X, Wang P, et al. Natural transmission of bat-like severe acute respiratory syndrome Coronavirus 2 without proline-arginine-arginine-alanine variants in Coronavirus disease 2019 patients. Clin Infect Dis. 2021;73:437-444. doi: 10.1093/cid/ciaa953 PMID: 32649739
  19. Cucinotta D, Vanelli M. WHO declares COVID-19 a pandemic. Acta Biomedica. 2020;91:157-160. doi: 10.23750/abm.v91i1.9397 PMID: 32191675
  20. Monchatre-Leroy E, Boué F, Boucher JM, Renault C, Moutou F, Gouilh MA, et al. Identification of alpha and beta coronavirus in wildlife species in france: bats, rodents, rabbits, and hedgehogs. Viruses. 2017;9:364-376. doi: 10.3390/v9120364 PMID: 29186061
  21. Miłek J, Blicharz-Domańska K. Coronaviruses in avian species-review with focus on epidemiology and diagnosis in wild birds. J Vet Res. 2018;62:249-255. doi: 10.2478/jvetres-2018-0035
  22. Brian DA, Baric RS. Coronavirus genome structure and replication. Curr Top Microbiol Immunol. 2005;12:1-30. doi: 10.1007/3-540-26765-4_1 PMID: 15609507
  23. Keshavarz Valian N, Pourakbari B, Asna Ashari K, Hosseinpour Sadeghi R, Mahmoudi S. Evaluation of human coronavirus OC43 and SARS-COV-2 in children with respiratory tract infection during the COVID-19 pandemic. J Med Virol. 2022;94:1450-1456. doi: 10.1002/jmv.27460 PMID: 34786736
  24. Vella F, Senia P, Ceccarelli M, Vitale E, Maltezou H, Taibi R, et al. Transmission mode associated with coronavirus disease 2019: A review. Eur Rev Med Pharmacol. 2020; 24: 7889-7904. doi: 10.26355/eurrev_202007_22296 PMID: 32744718
  25. Zhou L, Ayeh SK, Chidambaram V, Karakousis PC. Modes of transmission of SARS-CoV-2 and evidence for preventive behavioral interventions. BMC Infect. Dis. 2021;21:496. doi: 10.1186/s12879-021-06222-4 PMID: 34049515
  26. Corman VM, Lienau J, Witzenrath M. Coronaviruses as the cause of respiratory infections. Internist. 2019;60:1136-1145. doi: 10.1007/s00108-019-00671-5 PMID: 31455974
  27. Luo X, Zhou GZ, Zhang Y, Peng LH, Zou LP, Yang YS. Coronaviruses and gastrointestinal diseases. Mil Med Res. 2020;7:49-56. doi: 10.1186/s40779-020-00279-z PMID: 33054860
  28. Yuan D, Yan Z, Li M, Wang Y, Su M, Sun D. Isolation and Characterization of a Porcine Transmissible Gastroenteritis Coronavirus in Northeast China. Front Vet Sci. 2021;8:1-12. doi: 10.3389/fvets.2021.611721
  29. Gu J, Korteweg C. Pathology and pathogenesis of severe acute respiratory syndrome. Am J Clin Pathol. 2007;170:1136-1147. doi: 10.2353/ajpath.2007.061088 PMID: 17392154
  30. Tekes G, Thiel HJ. Feline Coronaviruses: Pathogenesis of feline infectious peritonitis. Adv Virus Res. 2016;96:193-218. doi: 10.1016/bs.aivir.2016.08.002 PMID: 27712624
  31. Hosking MP, Lane TE. The pathogenesis of murine coronavirus infection of the central nervous system. Crit Rev Immunol. 2010;30:119-130. doi: 10.1615/critrevimmunol.v30.i2.20 PMID: 20370625
  32. Cowley TJ, Weiss SR. Murine coronavirus neuropathogenesis: Determinants of virulence. J NeuroVirology. 2010;16:427-434. doi: 10.3109/13550284.2010.529238 PMID: 21073281
  33. Mora-Díaz JC, Piñeyro PE, Houston E, Zimmerman J, Giménez-Lirola LG. Porcine hemagglutinating encephalomyelitis virus: A review. Front Vet Sci. 2019;6:1-12. doi: 10.3389/fvets.2019.00053 PMID: 30873421
  34. Brant AC, Tian W, Majerciak V, Yang W, Zheng ZM. SARS-CoV-2: from its discovery to genome structure, transcription, and replication. Cell Biosci. 2021;11:1-17. doi: 10.1186/s13578-021-00643-z
  35. Naqvi AAT, Fatima K, Mohammad T, Fatima U, Singh IK, Singh A, et al. Insights into SARS-CoV-2 genome, structure, evolution, pathogenesis and therapies: Structural genomics approach. Biochim. Biophys. Acta - Mol. Basis Dis. 2020;1866:1-16. doi: 10.1016/j.bbadis.2020.165878 PMID: 32544429
  36. Xu J, Zhang Y. How significant is a protein structure similarity with TM-score = 5/0? Bioinformatics. 2010;26:889-895. doi: 10.1093/bioinformatics/btq066 PMID: 20164152
  37. Zhang Y, Skolnick J. TM-align: A protein structure alignment algorithm based on the TM-score. Nucleic Acids Res. 2005;33:2302-2309. doi: 10.1093/nar/gki524 PMID: 15849316
  38. Mei H, Pond SK, Nekrutenko A. Stepwise evolution and exceptional conservation of ORF1a/b overlap in coronaviruses. Mol Biol Evol. 2021;38(12):5678-5684. doi: 10.1093/molbev/msab265 PMID: 34505896
  39. Velazquez-Salinas L, Zarate S, Eberl S, Gladue DP, Novella I, Borca M V. Positive selection of ORF1ab, ORF3a, and ORF8 genes drives the early evolutionary trends of SARS-CoV-2 during the 2020 COVID-19 pandemic. Front Microbiol. 2020;1:1-13. doi: 10.3389/fmicb.2020.550674
  40. Woo PCY, Huang Y, Lau SKP, Yuen KY. Coronavirus genomics and bioinformatics analysis. Viruses. 2010;2:1804-1820. doi: 10.3390/v2081803 PMID: 21994708
  41. Kim DE, Chivian D, Baker D. Protein structure prediction and analysis using the Robetta server. Nucleic Acids Res. 2004;32:526-531. doi: 10.1093/nar/gkh468 PMID: 15215442
  42. Tabibzadeh A, Esghaei M, Soltani S, Yousefi P, Taherizadeh M, Safarnezhad Tameshkel F, et al. Evolutionary study of COVID-19, severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) as an emerging coronavirus: Phylogenetic analysis and literature review. Vet Med Sci. 2021;7:559-571. doi: 10.1002/vms3.394 PMID: 33210477
  43. Wang W, Zhou Z, Xiao X, Tian Z, Dong X, Wang C, et al. SARS-CoV-2 nsp12 attenuates type I interferon production by inhibiting IRF3 nuclear translocation. Cell Mol Immunol. 2021;18:945-953. doi: 10.1038/s41423-020-00619-y PMID: 33637958
  44. White MA, Lin W, Cheng X. Discovery of COVID-19 Inhibitors Targeting the SARS-CoV-2 Nsp13 Helicase. J Phys Chem Lett. 2020;11:9144-9151. doi: 10.1021/acs.jpclett.0c02421 PMID: 33052685
  45. Ma Y, Wu L, Shaw N, Gao Y, Wang J, Sun Y, et al. Structural basis and functional analysis of the SARS coronavirus nsp14-nsp10 complex. Proc Natl Acad Sci USA. 2015; 112: 9436-9441. doi: 10.1073/pnas.1508686112 PMID: 26159422
  46. Vithani N, Ward MD, Zimmerman MI, Novak B, Borowsky JH, Singh S, et al. SARS-CoV-2 Nsp16 activation mechanism and a cryptic pocket with pan-coronavirus antiviral potential. Biophys J. 2021;120:2880-2889. doi: 10.1016/j.bpj.2021.03.024 PMID: 33794150
  47. Kokic G, Hillen HS, Tegunov D, Dienemann C, Seitz F, Schmitzova J, et al. Mechanism of SARS-CoV-2 polymerase stalling by remdesivir. Nat Commun. 2021. doi: 10.1038/s41467-020-20542-0 PMID: 33436624
  48. Gustiananda M, Sulistyo BP, Agustriawan D, Andarini S. Immunoinformatics analysis of sars-cov-2 orf1ab polyproteins to identify promiscuous and highly conserved t-cell epitopes to formulate vaccine for indonesia and the world population. Vaccines. 2021. doi: 10.3390/vaccines9121459