Immuno-Bioinformatics Study of Autotransporter Protein, Antigen 43, in Enterotoxigenic Escherichia coli Isolated From Calves

Document Type : Microbiology and Immunology

Authors

1 1Department of Microbiology and Immunology, Faculty of Veterinary Medicine, University of Tehran, Tehran, Iran

2 2Department of Natural Resources Engineering, Isfahan University of Technology, Isfahan, Iran 3Institute of Biotechnology & Bioengineering, Isfahan University of Technology, Isfahan, Iran

Abstract

BACKGROUND: Extensive effort is focused on identifying genomic conserved antigens in development of effective vaccine against Enterotoxigenic Escherichia coli. Antigen 43 is one of the members of a large secreted protein family named autotransporters in the E.coli and other gram negative bacteria. Autotransporter proteins have a similar conserved structure. Some of them are recognized during both experimental and naturally occurring ETEC infections. Antigen 43 is represented as a potential target in vaccine development because of its virulence functions such as cell aggregation, biofilm formation and its presence in convalescent sera from human patients with ETEC diarrhea.
OBJECTIVES: In this study, we carefully investigate antigenic structure and immunogenicity of the Antigen 43 protein of strain 510 E.coli isolated from calves by experimental methods and immunoinformatics tools.
METHODS: Amino acid sequence, physico-chemical parameters, stability, secondary and tertiary protein structure, the ability of induction the B and T cell immune responses by having the effective epitopes and also the allergenicity assessment were analyzed.
RESULTS: In this study, we identified 15 peptide sequences that can potentially induce B and T cell immune responses and finally, 9 of them were introduced as antigens.
CONCLUSIONS: The results of in-silico analysis on this protein suggested that it can be used in bovine colibacillosis vaccine development.

Keywords


 

پروتئین‌های اتوترانزپورتر (Autotransporter)، بزرگترین گروه از پروتئین‌های لایه بیرونی و ترشحی را در باکتری‌های گرم منفی تشکیل می‌دهند. آن‌ها در همه موارد از یک ساختار مدولار مشابه تشکیل شده‌اند که شامل سه دامنه پپتید سیگنال  (Signal peptide)، دامنه مسافر (Passenger domain)، دامنه ناقل (Transporter domain) می شود و منجر به ترشح خودبه‌خودی این پروتئین ها از لایه بیرونی باکتری به سطح می‌گردد (46).

دامنه ناقل (β) در انتهای کربوکسی اتوترانزپورتر (C)، منفذی را در لایه بیرونی ایجاد می‌کند که از آن طریق دامنه مسافر (α) انتهای آمینی (N) به بیرون یاخته منتقل می‌شود. معمولاً به دنبال این انتقال، دامنه مسافر به‌وسیله یک پروتئاز لایه بیرونی شکافته شده و از طریق یک برهم کنش غیرکوولانسی با دامنه بتا در تماس با سطح باقی می‌ماند و یا به ‌صورت یک پروتئین محلول آزاد می‌شود (18).

پروتئین های اتوترانزپورتر بسیار متنوع هستند و عملکرد‌های مختلفی برعهده دارند که در مجموع حدت را تقویت می‌کنند. درحالیکه دامنه ناقل و پپتید سیگنال در بین پروتئین‌های اتوترانزپورتر بسیار حراست (Conserve) شده‌اند، این دامنه مسافر است که به‌عنوان یک پروتئین بالغ ترشحی، عملکرد‌های مؤثر متنوعی را به اتوترانزپورترهای گوناگون اعطا می نماید. از آن جمله می‌توان به پروتئولیز کاتالیز کننده، ارائه به ‌عنوان یک عامل اتصالی، میانجی‌گری حرکت با واسطه اکتین و ارائه به ‌عنوان یک سایتوتوکسین اشاره نمود. علی‌رغم فراوانی آن‌ها و نقشی که در روند بیماریزایی باکتری دارند، بیشتر این پروتئین ها از لحاظ ساختاری مشخص نشده اند و اطلاعات اندکی درمورد نحوه عمل آن‌ها وجود دارد (16،19).

در میان خانواده بزرگ اتوترانزپورترها، نوع AIDA-Iا(Adhesin Involved in Diffuse Adherence) بزرگترین و متنوع‌ترین پروتئین‌های اتوترانزپورتر هستند. در اشرشیاکلی 16 تحت گروه AIDA-I شناسایی شده‌است که در طول و توالی دامنه مسافر و خواص عملکردی با یکدیگر متفاوت هستند (46). از این میان پادگن 43 (Ag 43) به‌خوبی مورد مطالعه قرار گرفته است. پادگن 43 یک عامل اتصالی اتوترانزپورتر خودشناخت (Self-recognizing) است که به صورت یک پیش پروتئین 1039 اسیدآمینه‌ای تولید می‌شود. پپتید سیگنال انتهای آمینی پروتئین (52 اسیدآمینه) انتقال را از میان لایه سیتوپلاسمی به پری‌پلاسم هدایت می‌کند. ساختار رایج دامنه مسافر و ناقل پادگن 43 به ترتیب از 499 و 488 اسیدآمینه تشکیل شده‌اند (16،44).

پادگن 43 در بیشتر پاتوتیپ‌های ایکولای یافت می‌شود و گاهی به صورت آلل‌های چندگانه در یک سویه از ایکولای وجود دارد. حضور آلل‌های ژن پادگن 43 (agn43) که با نام flu نیز شناخته می شود در نواحی مختلف کروموزوم و همچنین تنوع در توالی دامنه مسافر آن‌ها در میان سویه‌های مختلف ایکولای می‌تواند منجر به تفاوت در خواص عملکردی آن‌ها در هر سویه از ایکولای گردد. از جمله عملکردهای به‌خوبی مشخص شده پادگن 43، تجمع سلولی و تشکیل بیوفیلم هستند (9،44).

حضور این پروتئین در سرم بیماران  مبتلا به اسهال ناشی از ایکولای انتروتوکسیژنیک (ETEC)، از بیان آن در عفونت‌های تجربی و طبیعی متعاقب ETEC و ایمنی‌زا بودن آن حکایت می‌کند. جالب توجه است که واکسیناسیون موش ها با دامنه مسافر نوترکیب پروتئین Ag 43 حفاظت مطلوبی در مقابل استقرار روده‌ای ETEC‌ انسانی فراهم می‌آورد (18).

با وجود فراوانی اتوترانزپورترها و مقدار فزاینده داده‌هایی که پروتئین‌های AT را با حدت باکتریایی مرتبط می‌سازند، اطلاعات کمی در مورد ساختمان مولکولی این پروتئین‌ها در دسترس است. در حقیقت پروتئین‌های AT در بانک داده پروتئین (PDB)،  به طور قابل توجهی فقط با یک ساختار تمام طول AT، 7 دامنه مسافر AT، 5 دامنه بتا AT، 12 دامنه کوچک اتوترانزپورترهای سه تایی (Trimeric autotransporters) در میان حدود 87500 ساختار موجود در حال حاضر تعداد اندکی را تشکیل می-دهند و هیچ یک از آن‌ها به گروه بزرگ پروتئین‌های AT نوع AIDA-I تعلق ندارند به استثنای ساختار سه بعدی دامنه مسافر پادگن 43 سویه یوروپاتوژنیک انسانی (CFT073) که به تازگی به این بانک اضافه شده است (19).

با توجه به موارد ذکر شده و نیز عدم وجود اطلاعات کافی درمورد پروتئین‌های اتوترانزپورتر در سویه‌های ایکولای بیماریزای دامی برآن شدیم که در این مطالعه به بررسی بیوانفورماتیک پروتئین Ag43 سویه 510 ایکولای انتروتوکسیژنیک عامل کلی‌باسیلوز به‌عنوان یک کاندید بالقوه ایمنی‌زا در تهیه واکسن‌های مؤثر بر این بیماری بپردازیم.

 

مواد و روش کار

استخراج ترادف و انجام همردیفی: سویه 510 که از سویه‌های ایکولای ETEC گاوی با سروتیپ O101:K99,F41:H-  است در این پژوهش مورد استفاده قرار گرفت. ژن کدکننده دامنه مسافر پروتئین اتوترانزپورتر پادگن 43 این سویه (ناحیه بین انتهای قسمت پپتید سیگنال و ابتدای دامنه ناقل) با استفاده از آغازگرهای ذکر شده توسط Harris و همکاران در سال 2011، (آغازگر رفت '5-gtggcgattgcgctgtct-'3و آغازگر برگشت '5-tacaccggtctgatggct-'3) افزوده گردید (16). به طور خلاصه برای تکثیر این پروتئین، واکنش زنجیره‌ای پلیمراز در حجم نهایی µL 25 شــامل µl 5/2 بافر X10، µl 5/1 کلرید منیزیــم (mM 50)، µl 2 dNTPsا، (mM 25/1)اµl 2/0 آنزیم تک پلیمراز،  µl75/0 از هر کدام از آغازگرهای اختصاصی (nM 25)، DNA  به میزان µl 2 و آب مقطر استریل µl 3/15 صورت گرفت. مواد لازم جهت انجام PCR  از شرکت سیناژن تهیه شدند. چرخه‌های دمایی شامل یک مرحله واسرشــتگی اولیه در دمای C° 95 به مدت دو دقیقه، 29 چرخه ســه مرحله‌ای، شامل مرحله واسرشته سازی در دمایC° 95 به مدت 30 ثانیه، مرحله اتصال در دمای C° 3/57 به مدت 30 ثانیه، مرحله بسط در دمــای C° 72 به مدت 210 ثانیه و در انتها یک مرحله بســط انتهایی در دمــای C° 72  به مدت 5 دقیقه بــود. محصول افزوده‌سازی با استفاده از آغازگرهای رفت و برگشت توالی‌یابی شد. تعیین‌توالی توسط مؤسسه ماکروژن (سئول، کره) با دستگاه توالی‌یاب خودکار DNAا(ABI 3730 XL) انجام شد.

در ادامه، این قطعه با استفاده از پلاسمید pJET و مطابق دستورالعمل کیت (Thermo Scientific CloneJET PCR Cloning Kit #K1231, #K1232)، به منظور دستیابی به قطعه کاملتر (مکان آغازگرهای مورد استفاده) همسانه‌سازی (Clone) گردید. آزمونPCR  با آغازگرهای پلاسمید pJET براساس دستور کیت انجام گرفت و همسانه‌های مقاوم به آمپی-سیلین حاوی قطعه با اندازه مشابه ژن مورد نظر مشخص گردیدند. تعیین توالی بر روی محصول افزوده‌سازی پلاسمید بعد از تخلیص با کیتQiagenا (QIAprep spin miniprep kit)  از دو انتهای آغازگرهای رفت و برگشت پلاسمید صورت پذیرفت.

جستجو جهت یافتن توالی‌های نوکلئوتیدی و اسیدآمینه‌ای مشابه در پایگاه داده بانک ژن NCBI و Uniprot به ترتیب به آدرس http://blast.ncbi.nlm.nih.gov/Blast.cgi و http://www.uniprot.org/blast/ انجام شد.

تجزیه و تحلیل اولیه توالی پروتئین: شاخص‌های مختلف فیزیکی-شیمیائی پروتئین مانند نقطه ایزوالکتریک، وزن مولکولی، نیمه عمر، تعداد دنباله‌های منفی و مثبت، شاخص آلیفاتیک و مقدار (GRAVY) ا Grand average of  hydropathicity با استفاده از ابزار ProtParam در پایگاه Expasyا(http://expasy.org/tools/protparam.html) محاسبه گردید (15). از نرم افزارهای VaxiJenا(http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html) و ANTIGENproا(http://scratch.proteomics.ics.uci.edu/) به‌منظور پیش‌بینی آنتی ژنیسیته پروتئین استفاده شد (7،11). از سرور epestfindا(http://emboss.bioinformatics.nl/cgi-bin/emboss/epestfind) برای پیش‌بینی توالی‌های PEST به‌عنوان جایگاه‌های بالقوه شکاف پروتئولیتیک استفاده گردید (36).

پیشگویی ساختار دوم و سوم پروتئین: جهت پیشگویی ساختار دوم پروتئین از سرورهای مختلف SPIDER2، Rapturx، GOR4، Psipred، jpred4، Predictprotein و CFSSP استفاده شد  (6،8،12،17،25،29،49). دورهای آلفا و همچنین انواع متفاوت دورهای بتا از قبیل I، II، IV، VIII نیز در پروتئین به ترتیب با استفاده از ALPHAPREDا(http://www.imtech.res.in/raghava/alphapred/index.html) و BetaTPredا(http://www.imtech.res.in/raghava/betaturns/) پیش‌بینی شدند (21،22).

جهت پیشگویی ساختار سه بعدی پروتئین، از سرورهای متعدد ModBase، SWISS-MODEL، CPH models، Phyre2، (PS)2-v3، Rapturx و HHpred استفاده گردید که مدل‌سازی همولوژی را بر اساس تشابه توالی ها انجام می‌دهند (5،20،23،31،32،34،41) . به عبارتی در این نوع مدل‌سازی، ساختمان سه بعدی پروتئینی که دارای ساختار نامشخص است براساس تشابه توالی با پروتئین دارای ساختار مشخص ترسیم می‌شود. پس از آن، ساختار کلی با مدل سازی ab initio یعنی فقط بر اساس اطلاعات مربوط به توالی پروتئین و بدون داشتن الگوی مشخص با استفاده از سرور I-Tasser ساخته شد (1،50). در نهایت نیز نرم افزار Robetta که از ترکیب هر دو روش مدل سازی همولوژی و ab intio استفاده می‌کند، برای پیشگویی ساختار سوم پروتئین Ag43 سویه 510 ایکولای ETEC گاوی به‌کار رفت (24).

بهینهسازی انرژی و ارزیابی اعتبار و پایداری ساختار پیش بینی شده پروتئین: برای شناسایی و اصلاح خطاهای مدل انتخابی، بهینه‌سازی ساختار پروتئین با استفاده از سرور ModRefinerا(http://zhanglab.ccmb.med.umich.edu/ModRefiner) انجام شد (48). مختصات ساختار سه بعدی بهینه‌شده Ag43 با فرمت PDB به وبسایت ProSA ا (https://prosa.services.came.sbg.ac.at/prosa.php) که اغلب برای تأیید اعتبار ساختار پروتئین به‌کار می‌رود، عرضه گردید (47). کیفیت نتایج استریوشیمی ساختار پروتئین بهینه‌شده نیز توسط نقشه راماچاندران در نرم افزارهای PROCHECKا(http://www.ebi.ac.uk/thornton-srv/software/PROCHECK) و RAMPAGEا(http://mordred.bioc.cam.ac.uk/~rapper/rampage.php) بررسی شد (27،28). ضمن اینکه از امتیاز Cا(C-score) حاصل از سرور I-TASSER به منظور تخمین کیفیت مدل پیشگویی شده آن استفاده گردید.

پیشگویی حلالیت و در دسترس بودن سطحی پروتئین: حلالیت پروتئین به‌‌وسیله Recombinant Protein Solubility Prediction ا (http://www.biotech.ou.edu) و وضعیت دردسترس بودن سطحی اسیدآمینه‌ها با Emini Surface Accessibilityا(/http://tools.iedb.org/bcell) ارزیابی شد (10،14).

پیشگویی مکان درون یاختهای: جایگاه درون یاخته‌ای پروتئین در یاخته پروکاریوتی (باکتری گرم منفی) با کمک سرورهای CELLO ا(http://e093.life.nctu.edu.tw/index.html) و PSLpredا (http://www.imtech.res.in/raghava/pslpred) پیش‌بینی شد. PSLpred از ترکیب روش یکپارچه‌سازی PSI-BLASTا(Position-Specific Iterative Basic Local Alignment Search Tool) و سه مدل SVMا(Support vector machine) برای پیش‌بینی جایگاه دورن یاخته‌ای استفاده می‌کند (3،51).

پیشگویی جایگاه شکاف پروتئاز پروتئین: پیشگویی جایگاه‌های شکاف Ag43 با استفاده از سرور NetChop3.1 (http://www.cbs.dtu.dk/services/NetChop/) با روش ANNا(Artificial neural networks) و وبسایت Pcleavageا(http://www.imtech.res.in/raghava/pcleavage) با روش SVM بدست آمد. سرور NetChop3.1 از بهترین سرورهای موجود برای پیشگویی جایگاه‌های شکاف است و روش SVM سرور Pcleavage با آن قابل مقایسه است (4،30).

پیشگویی اپیتوپهای ایمنیزا (اپیتوپهای پادگنی یاختههای B): یک پادگن برای اینکه کاندید خوب واکسن باشد باید هیدروفیل بوده و بتواند هر دو پاسخ ایمنی با واسطه یاخته‌های B و T را برانگیزد. بنابراین، ابتدا توالی کامل پروتئین برای پیش بینی اپی توپ یاخته B با استفاده از دو روش BCpreds و AAPpreds در پایگاه http://ailab.ist.psu.edu/bcpred/predict.html بکار رفت (13). توالی های 20 تایی اپی توپ بر سطح یاخته B مشخص شدند و با استفاده از سرور VaxiJenا(http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html) با مشخصات (ACC output و حد آستانه 4/0) جهت بررسی پادگن‌زایی مورد تحلیل بیشتری قرار گرفتند. از طرف دیگر، اپی‌توپ‌های خطی یاخته B در سرورهای ABCpredا(http://www.imtech.res.in/raghava/abcpred/ABC_submission.html) با استفاده از روش ANN، Bcepredا(http://www.imtech.res.in/raghava/bcepred) با استفاده از جزییات فیزیکی-شیمیایی و BepiPredا (http://www.cbs.dtu.dk/services/BepiPred/) با استفاده از ترکیب روش‌های hidden Markov model و propensity scale method نیز مشخص گردیدند (26،37،39). ABCpred براساس ANN مطابق با نمره بدست آمده و بالاتر از حد آستانه (5/0)، اپی‌توپ‌ها را رتبه‌بندی می‌کند بدین ‌ترتیب که هرچه نمره بیشتر باشد احتمال اپی‌توپ بودن آن توالی بیشتر است. سرور Bcepred از هفت معیار فیزیکی-شیمیایی شامل آبدوستی، انعطاف‌پذیری، تحرک، قابلیت دسترسی، قطبیت، سطح در معرض، دورها و پادگن‌زایی جهت پیشگویی اپی‌توپ‌های خطی موجود یاخته B استفاده می‌کند. در BepiPred، حدآستانه 35/0 انتخاب شد که حداکثر حساسیت و ویژگی را دارد. همچنین برای پیشگویی اپی‌توپ‌های فضایی یاخته B از توالی اولیه، سرور CBTOPEا(http://www.imtech.res.in/raghava/cbtope) به کار رفت (2).

اپیتوپهای پادگنی یاختههای T: از آنجا که جمعیت هدف این مطالعه گاوهای هلشتاین ایران است، جهت شناسایی اپی‌توپ‌های یاخته T، یعنی اپی‌توپ‌های متصل شونده به مولکول‌های MHC، در ابتدا فراوانی آلل‌های MHC کلاس II گاوها با محوریت اگزون دوم ژن DRB3 مورد بررسی قرار گرفت. بر طبق نتایج حاصل از پژوهشNikbakht و همکاران در سال 2016، آلل‌های دارای فراوانی بالای 5 درصد جمعیت انتخاب شدند (32) و از آنجا که تاکنون هیچ سروری آلل‌های MHC-II گاوی را جهت پیشگویی اپی‌توپ‌های ایمنی‌زای یاخته T ارائه نکرده‌است، آلل‌های MHC انسانی (HLA) و موشی (H-2) که مشابه با آلل های MHC گاو (BoLA) بودند بررسی شدند. به این صورت که مجموعه آلل‌های HLA و H-2 به ترتیب در پایگاه داده IPD-IMGT/HLAا(http://www.ebi.ac.uk/ipd/imgt/hla) و IMGT ا(ttp://www.imgt.org/IMGTrepertoireMH/index.php?section=LocusGenes&repertoire=Chromosomal%20localization&species=mouse) مشخص شدند و پس از همردیفی و کاوش توالی‌های انسانی و موشی مشابه با آلل‌های گاوی موجود در جمعیت هلشتاین ایران، آلل‌های معادل آن‌ها برای تعیین اپی‌توپ مورد استفاده قرار گرفتند.

برای پیشگویی پپتیدهای متصل شونده به MHC کلاس II آلل‌های انسانی و موشی از سرور IEDBا(http://tools.iedb.org/mhcii) استفاده شد. همچنین آلل‌های موشی در دو سرور دیگر Rankpepا(http://imed.med.ucm.es/Tools/rankpep.html) و PREDmusا (http://research4.dfci.harvard.edu/cvc/predmus/HTML/balbc.php) نیز بررسی شدند (35،45،52).

پیشگویی جایگاههای آلرژیزا و بررسی شباهت احتمالی با ژنهای گاو: برای مشخص کردن شباهت احتمالی پروتئین Ag43 و اپی توپ‌های پیشگویی شده آن با ژن‌های گاو، توالی اسیدآمینه‌ای آن‌ها در پایگاه اطلاعاتی NCBI مورد مطالعه بلاست (BLASTp) قرار گرفت. پیشگویی آلرژن ها و مشخص کردن اپی توپ‌های IgE از وبسایت AlgPredا (http://www.imtech.res.in/raghava/algpred) بدست آمد.

 AlgPred، پیش‌بینی آلرژن‌ها را براساس شباهت به اپی‌توپ‌های شناخته شده با هر ناحیه پروتئین با استفاده از روش ترکیبی+ARPs (allergen-representative peptides)+BLAST+MAST اپیتوپ IgE + SVMc  انجام می‌دهد (38). همچنین آلرژن بودن با با اجرای آزمون آلرژن‌زایی FAO/WHO در پایگاه داده SDAPا(https://fermi.utmb.edu/cgi-bin/SDAP/sdap_01) مورد تحلیل بیشتر قرار گرفت.

 

نتایج

استخراج ترادف و انجام همردیفی: نتیجه تعیین‌توالی محصول افزوده‌سازی واکنش زنجیره‌ای پلیمراز قطعه‌ای به طول bp  2041 است. نتیجه حاصل از همسانه‌سازی آن، قطعه‌ای با طول bp 2106 نوکلئوتید است که یک پپتید 702 اسید‌آمینه‌ای را می‌سازد. بلاست این قطعه بیشترین تطابق با توالی‌های مرتبط به ژن پادگن 43 سویه‌های مختلف ایکولای را نشان می‌دهد. به این ترتیب که نتیجه بلاست توالی نوکلئوتیدی این پروتئین در پایگاه داده NCBI، ژن کد کننده پروتئین پادگن 43 سویه B7A باکتری ایکولای انتروتوکسیژنیک انسانی به طول bp 3120 (شماره دسترسی: CP005998.1) با هم‌پوشانی (coverage) 100 درصدی و شباهت (similarity) 99 درصدی است و همچنین حاصل بلاست توالی اسیدآمینه‌ای آن در پایگاه داده UniprotKB، پروتئین پادگن 43 باکتری ایکولای با طول bp 1039 (شماره دسترسی: A0A0B1N837) است که به‌ترتیب هم‌پوشانی و شباهت 100 و 7/99 درصدی با قطعه مورد نظر دارد و اینگونه صحت آزمایش را آشکار می‌سازد. این قطعه در بانک ژن با شماره دسترسی KX196450 ثبت گردید.

در مقایسه همردیفی توالی اسید‌آمینه‌ قطعه افزوده شده با 52، 499 و 488 اسیدآمینه تشکیل دهنده پپتید سیگنال، دامنه مسافر و دامنه ناقل پادگن 43 سویه رفرانس ایکولای (k-12)  مشخص گردید که این قطعه به ترتیب از ابتدای توالی خود شامل 17، 499 و 186 اسید‌آمینه تشکیل دهنده سه دامنه پروتئین پادگن 43 می‌شود. این امر نشان دهنده تکثیر کامل ناحیه دامنه مسافرAg43  سویه 510 است که عملکرد پروتئین را برعهده دارد و بررسی مجازی ایمنی‌زایی آن مورد توجه مطالعه ایمونوبیوانفورماتیک پژوهش حاضر بوده است.

تجزیه و تحلیل اولیه توالی پروتئین: در این مطالعه شاخص‌های فیزیکی-شیمیایی مربوط به پروتئین پادگن 43 مشخص گردید. متوسط وزن مولکولی محاسبه شده برای Ag 43، Da  5/70802 ‌است. نقطه ایزوالکتریک (PI) پروتئین 88/4 است. با توجه به اینکه اسیدیته پروتئین با 7PI< مشخص می‌شود این پروتئین اسیدی است. ضریب خاموشی (Extinction coefficient) در طول موج nm 280 برابر  cm-1 M-147900 است. در مورد شاخص ناپایداری، ابزار  ProtParamاین پروتئین را جزء پایدارها (97/8 II:) طبقه‌بندی کرده است. محدوده این شاخص برای پروتئین‌های پایدار نتایج کمتر از 40 است. شاخص آلیفاتیک که نشان‌دهنده پایداری پروتئین در بازه دمایی وسیع است برای این پروتئین مقدار 98/81 گزارش گردید. مقدار GRAVY یک پپتید یا پروتئین از مجموع مقدار هیدروپاتی همه اسیدآمینه‌ها تقسیم بر تعداد اسیدآمینه‌های توالی پروتئین بدست می‌آید که در مورد Ag 43 برابر 194/0- است. مقدار منفی این شاخص نشان می‌دهد که پروتئین غیر قطبی است. مجموع کل اسیدآمینه‌ها با شارژ منفی (Asp+Glu) و مثبت (Arg+Lys) در این پروتئین به ترتیب 60 و 41 است. نیمه عمر این توالی در یاخته‌های پستانداران 100 ساعت، در مخمر بیش از 20 ساعت و در ایکولای بیش از 10 ساعت پیش‌بینی گردید. قطعه مورد نظر به‌عنوان پادگن پیش‌بینی شد و  نتیجه آنتی‌ژنیسیته مرتبط با نرم افزارهای Vaxijen و ANTIGENpro به ترتیب 8211/1 و 948949/0 است. موتیف‌های PEST، توالی‌های غنی از اسیدآمینه‌های پرولین، گلوتامیک اسید، سرین، ترئونین و به میزان کمتر اسید آسپارتیک هستند که بطور چشمگیری نیمه عمر درون یاخته‌ایی پروتئین‌ها را کاهش می‌دهند. از این رو، آن‌ها پروتئین را برای خرد شدن پروتئولیتیکی هدف‌گذاری می‌کنند. سرور epestfind، موتیف‌های PEST را به دو صورت ضعیف (poor) و بالقوه (potential) در پروتئین موردنظر به ترتیب بر اساس نمره پایین و بالای حد آستانه شناسایی می‌نماید. هرچه نمره بیشتر شود احتمال خرد شدن پروتئین با میانجیگری موتیف PEST در یاخته یوکاریوتی قویتر است. در پروتئین Ag 43، پنج موتیف ضعیف PEST مشخص گردید که در تصویر 1 قابل مشاهده است.

ساختار دوم پروتئین: چنانچه دامنه مسافر پروتئین 4KH3 (زنجیره A) را به‌عنوان، تنها پادگن 43 ثبت شده در بانک داده پروتئین (PDB) مقیاس قرار دهیم، در میان سرورهای بکار رفته برای پیش بین ساختار دوم پروتئین، نتایج 2 سرور psipred و rapturx بیشترین شباهت را به این پروتئین و به یکدیگر دارند. سومین سروری که نتایج نزدیکی دارد، SPIDER2 است. نکته قابل توجه اساس کار هر سه این سرورهاست که بر پایه روش شبکه عصبی (Neural Network) عمل می‌نمایند که در هر کدام از آن‌ها تغییراتی جهت بهبود پیشگویی متحمل گشته است (جدول 1). دورها محلی از ساختار دوم پروتئین هستند که در آن زنجیره پلی پپتیدی جهت کلی خود را معکوس می‌کند. آن‌ها مارپیچ‌های آلفا و صفحات بتا را به یکدیگر مرتبط می‌نمایند. در پیشگویی دورهای ساختار دوم پروتئین Ag 43 سویه 510، 8 دور آلفا و 100 دور بتا تعیین گردید. هر دور آلفا از 5 اسیدآمینه و هر دور بتا از 4 اسیدآمینه متوالی تشکیل شده‌است.

ساختار سوم پروتئین: با استفاده از سرورهای مختلف یاد شده ساختار سوم پروتئین Ag 43 سویه 510 پیشگویی گردید. نکته قابل توجه و مشترک در نتایج تمام سرورها، انتخاب خودکار زنجیره A پروتئین 4KH3 به‌عنوان اولین الگو جهت مدل‌سازی محدوده 516 اسید‌آمینه اول قطعه موردنظر است. نتیجه ساختار پیشنهادی سرورهای I-Tasser،  Phyre2، (PS)2-v3 و همچنین دو سرور Rapturx و Robetta شامل تمام 702 اسید‌آمینه سازنده پروتئین است درحالیکه، سرورهای Modeller، Swiss-model، CPH models و HHpred با توجه به الگوی انتخابی در مدل نهایی خود فقط اسید‌آمینه‌های محدوده دامنه مسافر را لحاظ کردند. از این میان، سرورهای Rapturx و Robetta دو دامنه جدا از هم مطابق با دامنه مسافر و دامنه ناقل پروتئین (به ترتیب محدوده 500 اسید‌آمینه اول و 200 اسیدآمینه آخر قطعه) و بقیه سرورها ساختار مونومری پیشنهاد دادند.

از آنجا که این قطعه تحت مطالعه in-vivo قرار نگرفته است تا به صورت ساختار رایج خود یعنی تشکیل مستقل دامنه ناقل و دامنه مسافر بررسی گردد، تشکیل ساختار مونومر در مطالعه همسانه‌سازی آن مورد انتظار است. بنابراین در مرحله اول ساختار مونومر به‌دست آمده از سه سرور I-Tasser،  Phyre2، (PS)2-v3 که از تمام 702 اسید‌آمینه قطعه پروتئینی Ag 43 تشکیل شدند، مورد بررسی قرار گرفت.

ارزیابی انتقادی پیشگویی ساختار پروتئین (CASP) یک تجربه جهانی است که با هدف ارتقاء روش‌های شناسایی ساختار سه بعدی پروتئین براساس توالی اسیدآمینه‌ای آن‌ها هر دو سال یکبار برگزار می‌گردد. طبق آخرین نتایج منتشر شده (CASP11) در سال 2014، سرور I-Tasser به‌عنوان بهترین سرور در امر پیشگویی ساختار سوم پروتئین معرفی شد. در نهایت، بنا بر این موضوع و با توجه به اینکه در انتهای مدل پیشنهادی سرورهای Phyre2 و (PS)2-v3 که اساس کار آن‌ها مدل‌سازی برپایه تشابه توالی است ساختار رندم‌کویل مشاهده می‌شود و عدم موفقیت این سرورها را در پیش‌بینی ساختار سه بعدی ناحیه مربوط نشان می‌دهد، اولین ساختار پیشنهادی سرور I-Tasser که اساس کار آن مدل‌سازی برپایه ab initio است با C-score برابر با 15/1- و TM-score و RMSD مورد انتظار به ترتیب 15/0± 57/0 و Å 6/4 ± 8/10 انتخاب گردید (تصویر 2).

بهینهسازی انرژی و ارزیابی اعتبار و پایداری ساختار پیش بینی شده پروتئین: نمره اطمینان  (C-score)برای تخمین کیفیت مدل پیش‌بینی شده توسط I-TASSER، است که به طور معمول در بازه (2 تا 5-) قرار دارد. هرجا که نمره  C-score بیشترین است نشان‌دهنده اطمینان بالاتر آن ساختار است که بهترین مدل پیش‌بینی شده برای این پروتئین، C-score برابر با 15/1- را نشان می‌دهد. TM-score مورد انتظار این پروتئین 15/0± 57/0است، با توجه به اینکه TM-score بالای 5/0 نشان‌دهنده دقت توپولوژی است. فایل pdb مدل سه بعدی مذکور برای به حداقل رساندن انرژی و بهینه کردن ساختار پروتئین  به سرور ModRefiner ارائه گردید.  نتیجه به‌دست آمده دارای TM-score و RMSD به ترتیب 9425/0 و 645/2 نسبت به مدل ابتدایی است. جهت ارزیابی کیفیت کلی ساختار پروتئین فایل pdb آن در برنامه ProSA مورد بررسی قرار گرفت. بر این اساس z-score ساختار ورودی مدل انتخابی با نمره 15/7- در بازه نمراتی است که به‌طور معمول برای پروتئین‌های طبیعی (Native) با اندازه مشابه یافت می‌شود (تصویر 3).

پایداری ساختمان پروتئینی مدل انتخابی با نقشه راماچاندران حاصل از سرورهای PROCHECK و Rampage بررسی شد (تصویر 4). درصد اسیدآمینه‌ها در نواحی مطلوب‌ترین (Most favoured regions)، مجاز فرعی (Additional allowed regions)، مجاز سخاوتمندانه (Generously allowed regions) و غیرمجاز (Disallowed regions) سرور PROCHECK به ترتیب 1/69، 4/22، 3/4 و 3/4 و در نواحی مطلوب (Favoured regions)، مجاز (Allowed regions) و خارج از محدوده (Outlier regions) سرور Rampage به ترتیب 7/81، 9/13 و 4/4 گزارش گردید درحالیکه این مقادیر قبل از بهینه شدن مدل به ترتیب در سرور PROCHECK برابر با 8/51، 4/29، 8/10 و 8 و در سرور Rampage برابر با 7/67، 6/17 و 7/14 بودند.

حلالیت و دسترسی به سطح پروتئین: بر اساس پیش‌بینی انجام شده Ag 43 هنگامیکه در ایکولای بیان شود به میزان صفر درصد احتمال حلالیت دارد. میانگین دسترسی سطحی 00/1 و میزان حداکثر و حداقل آن به ترتیب 812/5 و 142/0 است. در خصوص پپتیدهای پیش‌بینی شده با بیشترین دسترسی، از 702 اسید‌آمینه کل، تعداد 251 اسیدآمینه میزان دسترسی به سطح بالای میانگین دارند و 15 توالی پپتیدی با حداقل طول 6 اسیدآمینه را می‌سازند. از میان این پپتیدها، پپتید 21 اسیدآمینه‌ای موجود در بازه مکانی 673-653 (انتهای قطعه افزوده)  بیشترین طول را دارد و بیشترین میزان دسترسی به سطح نیز متعلق به اسیدآمینه موقعیت 658 از همین پپتید است.

جایگاه درون یاختهای پروتئین: هر دو پایگاه CELLO و PSLpred، مکان این پروتئین را در یاخته پروکاریوتی، خارج از یاخته‌ (Extracellular) پیش‌بینی کردند.

جایگاههای شکاف پروتئازوم پروتئین: نتایج پیشگویی جایگاه‌های شکاف دو سرور NetChop3.1 و Pcleavage با در نظر گرفتن حد آستانه پیش فرض هر یک از آن‌ها، به ترتیب تعداد 176 و 285 جایگاه را نشان دادند که تعداد 92 جایگاه مشترک هستند.

اپیتوپهای یاخته B: مهمترین نتایج پیش‌بینی و تعیین اپی‌توپ خطی و اپی‌توپ‌های فضائی با کمک سرورهای مختلف به شرح زیر است: 19 توالی 20 تایی (18 توالی اول با نمره 1 و توالی آخر با نمره 14/0) و 16 توالی 20 تایی (14 توالی اول با نمره بین 1 تا 8/0 و 2 توالی آخر با نمره 7/0) حاصل کار دو روش BCpreds و AAPpreds بود درحالیکه در هر  دو روش توالی اپی‌توپ‌های پیشنهادی با یکدیگر همپوشانی ندارند. در مورد پیشگویی سرور ABCpred تعداد 687 توالی 16 تایی که همپوشانی دارند با رتبه‌بندی 1 تا 31 و نمره بالای حد آستانه 5/0 بدست آمد. از این تعداد، 20 پپتید اول آن (رتبه 9- 1 و نمره بالای 84/0) انتخاب شدند. سرور BepiPred هر اسیدآمینه را به‌طور مستقل بررسی می‌کند و بین 3- تا 3 نمره می‌دهد. هرچه نمره بیشتر باشد احتمال اپی‌توپ بودن بیشتر می‌شود. در مورد توالی Ag43، 47 مکان شامل توالی‌های حداقل یک اسیدآمینه تا حداکثر 72 اسیدامینه معرفی شدند که بیشترین احتمال مربوط به مکان 167-158 با میانگین نمره 3952/2 است. سرور BcePred نیز هفت معیار فیزیکی و شیمیایی را برای هر اسیدآمینه با نمره جداگانه مشخص می‌کند و برای هر مورد، اسیدآمینه با نمره بالای 8/1 را انتخاب می‌کند. سرور CBTOPE با مقیاس احتمال (9-0)، اسیدآمینه‌هایی که نمره 4 به بالا دارند را اپی‌توپ در نظر می‌گیرد که برای توالی Ag 43، 52 مکان شامل حداقل یک اسیدآمینه تا حداکثر 20 اسیدآمینه‌ای با بیشترین نمره 4 و 5 به عنوان اپی‌توپ‌های فضایی یا ناپیوسته یاخته B، پیش‌بینی شد. همانطور که قابل ملاحظه است پروتئین Ag 43 تعداد زیادی اپی‌توپ خطی و فضائی یاخته B دارد. از میان این نتایج، اپی‌توپ‌های خطی مشترک شناسایی و با اپی‌توپ‌های فضایی مقایسه شدند.

اپیتوپهای یاخته T:  براساس مطالعه Nikbakht و همکاران در سال 2016، پنج آلل MHC کلاس II گاوی با نام‌های BoLA- DRB3*0101، BoLA- DRB3*1501، BoLA- DRB3*1101، BoLA- DRB3*1201 و BoLA- DRB3*0902 بیشترین فراوانی را در جمعیت مورد مطالعه گاوهای هلشتاین ایرانی به ترتیب با 16/18، 58/11، 21/9، 42/8 و 11/7 درصد دارند. فراوانی سایر آلل‌های جدا شده زیر 5درصد  است. بنابراین بر طبق نتیجه بلاست آلل‌های انسانی و موشی با بیشترین شباهت به این پنج آلل مشخص شدند (جدول 2).

در مرحله بعد با استفاده از سرور IEDB اپی‌توپ‌های پروتئین Ag 43 برای هر کدام از آلل‌های انسانی و موشی مشابه پیشگویی شدند. در مورد آلل‌های موشی، ژن H-2 IE به‌عنوان شبیه‌ترین برای هر 5 مورد آلل گاوی انتخاب شد. جهت مشخص کردن اپی‌توپ‌های ایمنی‌زا به خاطر انتخاب نژاد Balb/c به‌عنوان مدل آزمایشگاهی این مطالعه جستجو بر اساس‌هاپلوتیپ این نژاد یعنی IEd انجام گرفت.

پیشگویی براساس روش پیشنهادی IEDB انجام شد. IEDB برای آلل HLA-DRB1*13:11 روش sturniolo و برای چهار آلل دیگر انسانی روش NetMHCIIpan را انتخاب کرد. نتایج بر حسب رتبه درصدی (percentile_rank) چیدمان شدند. در روش پیش‌بینی پیشنهادی IEDB، اپی‌توپ‌ها با percentile_rank کمتر، متصل‌شونده‌های بهتری هستند. بر همین اساس 20 توالی‌ 15 تایی ابتدایی نتیجه هر آلل انتخاب شدند. از آنجا که نتایج برخی آلل‌ها فاقد اپی‌توپ‌هایی در محدوده مکانی 516-18 مربوط به دامنه α بود و چون در حالت طبیعی دامنه مسافر پروتئین به خارج از سلول باکتری ترشح شده و پاسخ ایمنی میزبان را تحریک می‌نماید، این ناحیه به صورت مجزا نیز با روش مشابه بررسی گردید.

سرور IEDB برای پیشگویی اپی‌توپ‌های ایمنی‌زا در آلل IEd موشی، از روش smm استفاده کرد. نتایج آن برای کل قطعه Ag43 و دامنه α به صورت مجزا از هم و در کنار 20 اپی‌توپ 9 تایی حاصل از دو سرور Rankpep و PREDmus که بالاترین امتیاز را داشتند، انتخاب شدند.

قطعات اپی‌توپی مشترک یاخته T آلل‌های انسانی و موشی به‌طور جدا از هم بررسی شدند. از میان آن‌ها، توالی‌های مشترک در حداقل دو آلل انسانی و دو سرور موشی تعیین شد و مقایسه‌ای بین آن‌ها و اپی‌توپ‌های یاخته B صورت گرفت و اپی‌توپ‌هایی که قادرند هر دو پاسخ یاخته‌های B و T را القاء نمایند مشخص شدند (جدول 3 الف). آنگاه در نهایت امر، جهت بررسی بیشتر و تعیین اعتبار، توسط سرور VaxiJen برای مشخص کردن میزان پادگن‌زایی و در پایگاه اطلاعاتی IEDBا(http://www.iedb.org/home_v2.php) جهت یافتن اپی‌توپ‌های مشابه تجربی ثبت شده، واکاوی شدند (جدول 3 ب).

جایگاههای آلرژیزای پروتئین و میزان شباهت با ژنهای گاوی: در جستجوی توالی‌های پروتئینی مشابه گاوی و موشی با قطعه Ag 43 در پایگاه NCBI، نتیجه‌ای به دست نیامد. در مورد اپی-توپ‌های حاصل در جدول 3 نیز، شباهت معنی‌داری در کتابخانه آلرژن SDAP و همچنین ژن‌های گاوی در NCBI یافت نشد. براساس دستاوردهای متفاوت آلرژن‌زایی در ابزار AlgPred، این پروتئین تنها با روش SVM به‌ عنوان آلرژن بالقوه شناخته و با سایر روش‌ها آلرژن محسوب نشد و دستاورد هیبرید (مجموع روش‌ها) نیز آن‌را غیرآلرژن معرفی کرد و همین‌طور تمامی اپی‌توپ‌های مشخص شده جدول 3 با تک تک روش‌ها و دست‌آورد هیبرید آن‌ها غیرآلرژن معرفی شدند. در نهایت، آزمون آلرژن‌زایی براساس گزارش FAO/WHO نیز بر روی قطعه Ag 43 صورت گرفت. براساس قانون آلرژن‌زایی FAO/WHO در گزارش سال 2001 این نهاد، در صورتی یک پروتئین واکنش متقاطع با آلرژن‌های شناخته شده دارد که:

1. بیش از 35 درصد identity در توالی پروتئینی با استفاده از جستجوی پنجره 80 اسیدآمینه‌ای متوالی یافت شود. نتیجه این مرحله در مورد توالی Ag 43، 623 توالی 80 تایی متوالی بود که در بیشترین حالت شباهت 75/33 درصدی در پنجره 80 تایی اسیدآمینه 238-159 به دست آمد.

2. شش اسیدآمینه پشت سر هم شناسایی شود. حاصل این مرحله نیز در مورد توالی Ag 43، 5 توالی 6 تایی است که به ترتیب در نواحی اسیدآمینه 19-14، 99-94، 321-316، 485-480 و 585-580 قرار دارند.

 

بحث

در تلاش برای ایجاد  مصونیت بر ضد سویه‌های ETEC مطالعات گسترده‌ای در حیطه‌های دامی و به خصوص انسانی صورت گرفته‌است. پیشرفت در مسیر دانش سازوکار بیماریزایی ETEC، انتخاب گزینه‌های کارآمدی را در توسعه تولید واکسن به دنبال داشته‌است. از جمله آن‌ها، شناسایی پادگن های حراست شده ژنومی ایکولای است. بنابر مطالعات پیشین بر روی پاسخ ایمنی علیه عفونت ETEC، گروهی از مولکول‌های بیان شونده سطحی تحت عنوان اتوترانزپورترها شناسایی شدند. انواع متعددی از پروتئین‌های اتوترانزپورترها، در طی دهه گذشته در باکتری ایکولای و سایر باکتری‌های گرم منفی معرفی شدند. از خصوصیات قابل توجه این پروتئین‌ها که اغلب با حدت باکتری مرتبط هستند، بیان سطحی دامنه مسافر آن‌هاست. این امر، آن‌ها را به اهداف مناسبی جهت ساخت واکسن تبدیل نموده‌‌است.

پادگن 43 نمونه‌ای از پروتئین‌های این خانواده است که در بیشتر از 90 درصد سویه‌های ایکولای بیماریزا در دستگاه ادراری و اسهال‌زا و نزدیک به 56 درصد جدایه‌های همزیست حضور دارد. واکسیناسیون موشها با دامنه مسافر نوترکیب این پروتئین که از سویه انسانی جدا شده است، با ایجاد حفاظت مطلوب در مقابل استقرار روده‌ای ETEC‌ها، آن را به‌عنوان کاندید بالقوه ایمنی‌زا در طراحی واکسن‌های جدید اسهال ناشی از ETEC نوزادان جالب توجه کرده‌است (18،44).

عدم وجود اطلاعات کافی در مورد سویه‌های بیماریزای ETEC دامی و توجه به رشد و پیشرفت روز افزون واکسن‌شناسی معکوس از طریق مطالعات ایمونوبیوانفورماتیک هدف ما را در این مطالعه بررسی ساختاری و ایمنی‌زایی پروتئین پادگن 43 سویه 510 باکتریETEC قرار داده‌است.

دامنه مسافر پروتئین نوترکیب Ag 43 سویه 510 از 499 اسیدآمینه تشکیل شده‌است که با باقیمانده‌های 17 تایی و 186 تایی قطعات پپتید سیگنال و دامنه ناقل، توالی 702 اسیدآمینه‌ای را تشکیل می‌دهد. در بررسی خصوصیات فیزیکی- شیمیایی، شاخص بی‌ثباتی (Instability index) کمتر از 40 نشان‌دهنده مقاوم بودن پروتئین است و همچنین بالا بودن شاخص آلیفاتیک که با نسبت حضور اسیدآمینه‌های دارای زنجیره آلیفاتیک (آلانین، والین، ایزولوسین و لوسین) ارتباط دارد حاکی از احتمال پایداری پروتئین در بازه دمایی وسیع است (17). با توجه به ساختار دوم پروتئین میزان بیشتر آن را صفحات بتا تشکیل می‌دهد که به‌خوبی خاصیت تجمعی این پروتئین را توضیح می‌‌دهد (40). به‌ویژه هنگامیکه وقتی که در نگاه جزئی‌تر مشخص می‌شود قطعه مرتبط با دامنه مسافر شامل هیچ ساختار آلفا-هلیکسی نیست.

در مورد پیشگویی ساختار سوم پروتئین، در حال حاضر یک ساختار PDB از پروتئین دامنه مسافر Ag 43a سویه یوروپاتوژنیک انسانی (CFT073) در پایگاه داده پروتئین وجود دارد و نتیجه همردیفی Ag 43 با آن، 79 درصد هم‌پوشانی  و 81 درصد شباهت است. از این پروتئین در اکثر سرورهای پیشگویی‌کننده ساختار سه بعدی، به‌عنوان اولین الگوی انتخابی استفاده گردید. در مورد اسیدآمینه‌های انتهایی قطعه Ag 43 نوترکیب که همردیف دامنه ناقل پادگن 43 سویه k 12 قرار دارند، در اکثر سرورهای پیشگویی‌کننده برپایه تشابه توالی، ساختاری برای آن تعیین نشد. در بین سه سرور I-Tasser،  Phyre2و (PS)2-v3 که یک ساختار کلی با همه اسیدآمینه‌های شرکت کننده ارائه دادند نیز تنها مدل پیشنهادی سرور I-Tasser بود که یک ساختار مشخص واحد برای هر دو دامنه قطعه پیشگویی کرد و با توجه به تأیید جهانی نتایج این سرور، آن مدل انتخاب گردید. اساس عملکرد سرور I-Tasser مدل‌سازی ab initio است، ضمن آنکه جستجو توالی مشابه برای توالی اسیدآمینه‌ای مورد تحقیق و نیز جستجوی ساختار پروتئینی مشابه با ساختار پیشگویی شده از
جمله روندهای اجرایی این سرور است.

به منظور ارزیابی کیفیت مدل مورد نظر از نقشه راماچاندران استفاده شد. زوایای چرخش phi و psi برای همه باقیمانده‌های ساختار پروتئین در محورهای X و Y قابل مشاهده است. زاویه phi چرخش را حول باند Calpha-N اسیدآمینه نشان می‌دهد درحالیکه زاویه psi چرخش را حول باند Calpha-C مشخص می‌نماید. از آنجا که پلی‌پپتیدها فرایند تاخوردگی (folding) را متحمل می‌شوند، زوایای phi و psi در محدوده چرخش 180- تا 180+ درجه بسته به نوع زنجیره جانبی اسیدآمینه قرار می‌گیرند. ترکیباتی که اتم‌ها در آن در فاصله‌ای نزدیکتر از مجموع شعاع واندروالسی آن‌ها قرار می‌گیرند نواحی غیرمجاز یا پرت نقشه را می‌سازند. قرارگیری در این نواحی برای همه اسیدآمینه‌ها به غیر از گلایسین از نظر برخورد فضایی ممکن نیست. گلایسین به علت نداشتن زنجیره جانبی محدودیت سایر اسیدآمینه‌ها را نداشته و در تمام نقاط نقشه به خصوص نواحی مخصوص دورها در ساختار دوم، که برای سایرین ممنوع است، می‌تواند قرار بگیرد. مکان این اسیدآمینه در نقشه حاصل از سرور PROCHECK با علامت مثلث قابل تشخیص است و در محاسبات آماری لحاظ نمی‌شود در حالیکه در نقشه بدست آمده از سرور Rampage با علامت ضربدر قابل مشاهده‌است و تعداد آن در آمار محاسبه می‌گردد. درصد باقیمانده‌ها در ناحیه مطلوب راهنمای خوبی جهت ارزیابی کیفیت استریوشیمیایی ساختار است. این مقدار در سرور PROCHECK بالای 90 درصد و در سرور Rampage حدود 98 درصد برای یک ساختار پایدار با بررسی کریستالوگرافی ساختارهای پروتئینی شناخته شده، مورد انتظار است. در مدل بهینه ساختار سوم Ag 43 یعنی بعد از به حداقل‌ رساندن انرژی و اصلاح باندهای هیدروژن، وضعیت مکانی ستون فقرات و موقعیت زنجیره‌های جانبی توسط سرور ModRefiner، در مجموع بیش از 95 درصد از اسیدآمینه‌ها در نواحی مطلوب و مجاز نقشه راماچاندران قرار گرفتند. با توجه به فقدان الگوی مناسب جهت دامنه ناقل این پروتئین در پایگاه PDB، بیشتر اسیدآمینه‌های تشکیل دهنده ناحیه مجاز نقشه راماچاندران متعلق به قسمت انتهایی قطعه هستند و همین امر منجر به کاهش نسبی پایداری کل ساختار شده‌است.

توانایی تشخیص اپی توپ ها در پاسخ ایمنی، کاربردهای مهمی در تشخیص بیماری دارد و در نتیجه از گام‌های اساسی در مطالعات ایمونوبیوانفورماتیک شناسایی و نقشه‌برداری آن‌ها محسوب می‌شود. اپی توپ ها، گروه‌های تعریف شده‌ای از اسیدهای آمینه هستند که در ترکیب یک پروتئین پادگنی قرار دارند و پاسخ ایمنی را به‌وسیله برهمکنش با گیرنده‌های یاخته T و B فعال می کنند (42،43). الگوریتم‌های پیشگویی‌کننده اپی توپ‌های یاخته B و T به دو دسته تقسیم می‌شوند. روش‌های بر پایه ساختار که اطلاعات را از ساختمان سه بعدی پروتئین‌ها کسب می‌کنند و روش‌های بر پایه توالی که توالی اسیدآمینه‌ای را مد نظر دارند (33). از آنجا که ساختار سوم پیشگویی شده in-silico هرچند با کیفیت بالا با ساختار سوم واقعی در شرایط in-vivo می‌تواند تفاوت‌های قابل ملاحظه‌ای داشته باشد در این مطالعه تنها به سرورهای پیشگویی‌کننده اپی توپ بر پایه توالی پروتئین بسنده نمودیم. تعداد قابل ملاحظه‌ای اپی توپ یاخته B مشخص شدند و در مقایسه نتایج سرورهای مختلف اپی‌توپ‌های مشابه پیشنهاد گردیدند.

در خصوص اپی توپ‌های یاخته T ضروری است که پپتیدهای پادگنی به MHC متصل شوند تا یاخته‌های T بتوانند آن‌ها را بشناسند. بنابراین، شناسایی پپتیدهای متصل شونده به MHC بخش اساسی هر الگوریتمی است که اپی توپ‌های یاخته T را پیش‌بینی می‌کند (33). در این تحقیق از آنجاییکه هدف ما شناخت کاندیدهای مناسب واکسن کلی‌باسیلوز بوده و با توجه به اینکه باکتری ایکولای انتروتوکسیژنیک به طور غالب یک پاتوژن خارج یاخته ای است، اپی توپ‌های متصل شونده به MHC کلاس II مد نظر قرار گرفتند.

بدین منظور بر اساس نتایج حاصل از مطالعه پیشین Nikbakht و همکاران در سال 2016 که حاوی اطلاعات لازم برای تخمین فراوانی آلل‌های BoLA-DRB3 در جمعیت گاوهای هلشتاین ایران بود، 5 آلل غالب جمعیت (فراوانی بالای 5 درصد) انتخاب شدند. این در حالی است که تا کنون هیچ سروری آلل‌های MHC-II گاوی را جهت تعیین اپی توپ‌های یاخته T ارائه نداده‌است. لذا اپی‌توپ‌های یاخته T برای آلل‌های مشابه انسانی و مدل حیوان آزمایشگاهی موش تعیین شدند. سرانجام به 15 توالی پپتیدی در قطعه کلون شده Ag43 سویه 510 دست یافتیم که 10 توالی پپتیدی آن در دامنه مسافر قرار دارند و بالقوه قادرند باعث تحریک هر دو یاخته B و T شوند. همه این توالی‌ها مورد تحلیل سرور VaxiJen قرار گرفتند. از آنجا که حد آستانه این سرور 4/0 است، قطعات پپتیدی با نمره بالای 4/0 توسط این سرور پادگن محسوب می‌شوند. بنابراین در نهایت از مجموع 15 قطعه پپتیدی حاصل، 9 اپی‌توپ پادگنی شناخته شدند که تعداد 6 اپی‌توپ از دامنه مسافر هستند. درحالیکه هیچکدام از آن‌ها دربردارنده نواحی آلرژن‌زای شناسایی شده بر طبق قانون WHO نیستند.

در مجموع شایان ذکر است که با توجه به قدرت تحریک ایمنی، پایداری، حلالیت مناسب و اپی‌توپ‌های یافت شده در این مطالعه می‌توان پروتئین پادگن 43 سویه 510 ایکولای ETEC گاوی به‌عنوان یک پادگن حراست شده در بین سویه‌های ایکولای را جهت تهیه واکسن‌های نوترکیب با استفاده از دامنه مسافر آن و همچنین در طراحی واکسن‌های برپایه اپی‌توپ با معرفی اپی-توپ‌های بالقوه ایمنی‌زا در مقابله با بیماری اسهال گوساله‌ها در نظر گرفت. نتایج حاصل از تحقیق حاضر برای طراحی واکسن بر مبنای اپی‌توپ کاربرد داشته و می‌توان از توالی های پیشنهادی برای تهیه واکسن‌های ترکیبی نیز استفاده نمود.

 

تشکر و قدردانی

هزینه‌های این طرح از بودجه طرح تولید دانش فنی واکسن کلی باسیلوز و اعتبار طرح پژوهشی طرح نوع ششم به شماره 26/6/7502015 تأمین شده است.

 

تعارض در منافع

بین نویسندگان  هیچ گونه تعارض در منافع  گزارش نشده است.

 
Abbass, J., Nebel, J. C., Mansour, N. (2013). Ab initio protein structure prediction: methods and challenges. Biological Knowledge Discovery Handbook. Hoboken, John Wiley & Sons, Inc. New Jersey, USA. p.703-724.
Ansari, H. R., Raghava, G. P. (2010). Identification of conformational B-cell Epitopes in an antigen from its primary sequence. Immunome Res, 6, 6. https://doi.org/10.1186/1745-7580-6-6 PMID: 20961417
Bhasin, M., Garg, A., Raghava, G. (2005). PSLpred: prediction of subcellular localization of bacterial proteins. Bioinformatics, 21, 2522-2524. https://doi.org/  10.1093/bioinformatics/bti309 PMID: 15699023
Bhasin, M., Raghava, G. (2005). Pcleavage: an SVM based method for prediction of constitutive proteasome and immunoproteasome cleavage sites in antigenic sequences. Nucleic acids Res, 33, W202-W207. PMID:15988831
Biasini, M., Bienert, S., Waterhouse, A., Arnold, K., Studer, G., Schmidt, T., Kiefer, F., Cassarino, T.G., Bertoni, M., Bordoli, L. (2014). SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information. Nucleic Acids Res, 42, W252-W258. https://doi.org/10.1093/nar/gku340 PMID: 24782522
Buchan, D. W., Minneci, F., Nugent, T. C., Bryson, K., Jones, D. T. (2013). Scalable web services for the PSIPRED Protein Analysis Workbench. Nucleic Acids Res, 41, W349-W357. https://doi.org/10.1093/nar/gkt381 PMID: 23748958
Cheng, J., Randall, A. Z., Sweredoski, M. J., Baldi, P. (2005). SCRATCH: a protein structure and structural feature prediction server. Nucleic Acids Res, 33, W72-W76. https://doi.org/10.1093/nar/gki396 PMID: 15980571
Chou, P. Y., Fasman, G. D. (1974). Prediction of protein conformation. Biochemistry, 13, 222-245. https://doi.org/10.1021/bi00699a002
De Luna, M. d. G., Scott-Tucker, A., Desvaux, M., Ferguson, P., Morin, N. P., Dudley, E. G., Henderson, I. R. (2008). The Escherichia coli biofilm-promoting protein Antigen 43 does not contribute to intestinal colonization. FEMS Microbiol Lett, 284, 237-246. https://doi.org/10.1111/j.1574-6968.2008.01207.x PMID: 18507683
Diaz, A. A., Tomba, E., Lennarson, R., Richard, R., Bagajewicz, M. J., Harrison, R. G. (2010). Prediction of protein solubility in Escherichia coli using logistic regression. Biotechnol Bioeng, 105, 374-383. https://doi.org/10.1002/bit.22537 PMID: 19739095
Doytchinova, I. A., Flower, D. R. (2007). VaxiJen: a server for prediction of protective antigens, tumour antigens and subunit vaccines. BMC Bioinformatics, 8, 4. https://doi.org/10.1186/1471-2105-8-4
Drozdetskiy, A., Cole, C., Procter, J., Barton, G. J. (2015). JPred4: a protein secondary structure prediction server. Nucleic Acids Res, 43, W389-W394. https://doi.org/10.1093/nar/gkv332 PMID: 25883141
EL-Manzalawy, Y., Dobbs, D., Honavar, V. (2008). Predicting linear B-cell epitopes using string kernels. J Mol Recogn, 21, 243-255. https://doi.org/10.1002/jmr.893 PMID: 18496882
Emini, E. A., Hughes, J. V., Perlow, D., Boger, J. (1985). Induction of hepatitis A virus-neutralizing antibody by a virus-specific synthetic peptide. J Virol, 55, 836-839. PMID: 2991600
Gasteiger, E., Hoogland, C., Gattiker, A., Wilkins, M.R., Appel, R.D., Bairoch, A. (2005). Protein identification and analysis tools on the ExPASy server. The proteomics protocols handbook. Springer. p. 571-607.
Harris, J. A., Roy, K., Woo-Rasberry, V., Hamilton, D. J., Kansal, R., Qadri, F., Fleckenstein, J. M. (2011). Directed evaluation of enterotoxigenic Escherichia coli autotransporter proteins as putative vaccine candidates. PLoS Negl Trop Dis, 5, e1428. https://doi.org/10.1371/journal.pntd.0001428 PMID:   22163060
Heffernan, R., Paliwal, K., Lyons, J., Dehzangi, A., Sharma, A., Wang, J., Zhou, Y. (2015). Improving prediction of secondary structure, local backbone angles, and solvent accessible surface area of proteins by iterative deep learning. Sci Rep, 5, 11476. https://doi.org/10.1038/srep11476 PMID: 26098304
Henderson, I. R., Navarro-Garcia, F., Desvaux, M., Fernandez, R. C., Ala’Aldeen, D. (2004). Type V protein secretion pathway: the autotransporter story. Microbiol Mol Biol Rev, 68, 692-744. https://doi.org/10.1128/MMBR.68.4.692-744.2004 PMID: 15590781
Heras, B., Totsika, M., Peters, K. M., Paxman, J. J., Gee, C. L., Jarrott, R. J., Schembri, M. A. (2014). The antigen 43 structure reveals a molecular Velcro-like mechanism of autotransporter-mediated bacterial clumping. Proc Nat Acad Sci, 111, 457-462. https://doi.org/ 10.1073/pnas.1311592111 PMID: 24335802
Huang, T.-T., Hwang, J.-K., Chen, C.-H., Chu, C.-S., Lee, C.-W., Chen, C.-C. (2015). (PS)2: protein structure prediction server version 3.0. Nucleic Acids Res, 43, W338-W342. https://doi.org/ 10.1093/nar/gkv454 PMID:   25943546
Kaur, H., Raghava, G. (2004). A neural network method for prediction of β-turn types in proteins using evolutionary information. Bioinformatics, 20, 2751-2758. https://doi.org/10.1093/bioinformatics/bth322 PMID: 15145798
Kaur, H., Raghava, G. (2004). Prediction of α-turns in proteins using PSI-BLAST profiles and secondary structure information. Proteins: Structure, Function, and Bioinformatics, 55, 83-90. https://doi.org/10.1002/prot.10569 PMID: 14997542
Kelley, L. A., Mezulis, S., Yates, C. M., Wass, M. N., Sternberg, M. J. (2015). The Phyre2 web portal for protein modeling, prediction and analysis. Nat Protoc, 10, 845-858. https://doi.org/10.1038/nprot.2015.053 PMID:  25950237
Kim, D. E., Chivian, D., Baker, D. (2004). Protein structure prediction and analysis using the Robetta server. Nucleic Acids Res, 32, W526-W531. https://doi.org/10.1093/nar/gkh468 PMID: 15215442
Kloczkowski, A., Ting, K. L., Jernigan, R., Garnier, J. (2002). Combining the GOR V algorithm with evolutionary information for protein secondary structure prediction from amino acid sequence. Proteins: Structure, Function, and Bioinformatics, 49, 154-166. https://doi.org/10.1002/prot.10181 PMID:12210997
Larsen, J. E. P., Lund, O., Nielsen, M. (2006). Improved method for predicting linear B-cell epitopes. Immunome Res, 2, 2. https://doi.org/10.1186/1745-7580-2-2 PMID: 16635264
Laskowski, R. A., MacArthur, M. W., Moss, D. S.,Thornton, J. M. (1993). PROCHECK: a program to check the stereochemical quality of protein structures. J Appl Crystallogr, 26, 283-291. https://doi.org/10.1107/S0021889892009944.
Lovell, S. C., Davis, I. W., Arendall, W. B., de Bakker, P. I., Word, J. M., Prisant, M. G., Richardson, D. C. (2003). Structure validation by Cα geometry: ϕ, ψ and Cβ deviation. Proteins: Structure, Function, and Bioinformatics, 50, 437-450. https://doi.org/10.1002/prot.10286.
Ma, J., Wang, S., Zhao, F., Xu, J. (2013). Protein threading using context-specific alignment potential. Bioinformatics, 29, i257-i265. https://doi.org/10.1093/bioinformatics/btt210 PMID: 23812991
Nielsen, M., Lundegaard, C., Lund, O., Keşmir, C. (2005). The role of the proteasome in generating cytotoxic T-cell epitopes: insights obtained from improved predictions of proteasomal cleavage. Immunogenetics, 57, 33-41.  https://doi.org/10.1007/s00251-005-0781-7 PMID: 15744535
Nielsen, M., Lundegaard, C., Lund, O., Petersen, T.N. (2010). CPHmodels-3.0—remote homology modeling using structure-guided sequence profiles. Nucleic Acids Res, 38, W576-W581. https://doi.org/10.1093/nar/gkq535 PMID: 20542909
Nikbakht Brujeni, G., Ghorbanpour, R., Esmailnejad, A. (2016). Association of BoLA-DRB3. 2 Alleles with BLV Infection Profiles (Persistent Lymphocytosis/Lymphosarcoma) and Lymphocyte Subsets in Iranian Holstein Cattle. Biochem Genet, 54, 194-207. https://doi.org/10.1007/s10528-016-9712-6 PMID: 26782666
Patronov, A., Doytchinova, I. (2013). T-cell epitope vaccine design by immunoinformatics. Open Biol, 3, 120139. https://doi.org/10.1098/rsob.120139 PMID: 23303307
Pieper, U., Webb, B. M., Dong, G. Q., Schneidman-Duhovny, D., Fan, H., Kim, S. J., Hammel, M. (2014). ModBase, a database of annotated comparative protein structure models and associated resources. Nucleic Acids Res, 42, D336-D346. https://doi.org/10.1093/nar/gkt1144 PMID: 24271400
Reche, P. A., Reinherz, E. L. (2007). Prediction of peptide-MHC binding using profiles. Immunoinformatics, Springer. p. 185-200. https://doi.org/10.1007/978-1-60327-118-9_13 PMID: 18450001
Rechsteiner, M., Rogers, S. W. (1996). PEST sequences and regulation by proteolysis. Trends Biochem Sci, 21, 267-271. PMID: 8755249
Saha, S., Raghava, G. (2004). BcePred: prediction of continuous B-cell epitopes in antigenic sequences using physico-chemical properties. In, International Conference on Artificial Immune Systems, Springer. p. 197-204. https://doi.org/10.1007/978-3-540-30220-9_16
Saha, S., Raghava, G. (2006). AlgPred: prediction of allergenic proteins and mapping of IgE epitopes. Nucleic Acids Res, 34,W202-W209. https://doi.org/10.1093/nar/gkl343 PMID: 16844994
Saha, S., Raghava, G. (2006). Prediction of continuous B-cell epitopes in an antigen using recurrent neural network. Proteins: Structure, Function, and Bioinformatics, 65, 40-48. https://doi.org/10.1002/prot.21078 PMID:  16894596
Shivu, B., Seshadri, S., Li, J., Oberg, K. A., Uversky, V. N., Fink, A. L. (2013). Distinct β-sheet structure in protein aggregates determined by ATR-FTIR spectroscopy. Biochemistry, 52, 5176-5183. https://doi.org/10.1021/bi400625v PMID: 23837615
Söding, J., Biegert, A., Lupas, A. N. (2005). The HHpred interactive server for protein homology detection and structure prediction. Nucleic Acids Res, 33, W244-W248. https://doi.org/10.1093/nar/gki408 PMID:   15980461
Soni, B., Seniya, C., Misra, R.,Vyas, V. (2013). Immuno-informatic approach of in silico T cell epitope prediction. Int J Adv Technol Eng Res, 3, 9-18.
Tomar, N., De, R. K. (2010). Immunoinformatics: an integrated scenario. Immunology, 131, 153-168. https://doi.org/10.1111/j.1365-2567.2010.03330.x PMID: 20722763
Vander Woude, M. W., Henderson, I. R. (2008). Regulation and function of Ag43 (flu). Ann Rev Microbiol, 62, 153-169. https://doi.org/10.1146/annurev.micro.62.081307.162938 PMID: 18785838
Wang, P., Sidney, J., Kim, Y., Sette, A., Lund, O., Nielsen, M., Peters, B. (2010). Peptide binding predictions for HLA DR, DP and DQ molecules. BMC Bioinform, 11, 568. https://doi.org/10.1186/1471-2105-11-568 PMID:   21092157
Wells, T. J., Tree, J. J., Ulett, G. C., Schembri, M. A. (2007). Autotransporter proteins: novel targets at the bacterial cell surface. FEMS Microbiol Lett, 274, 163-172. https://doi.org/10.1111/j.1574-6968.2007.00833.x
Wiederstein, M., Sippl, M. J. (2007). ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins. Nucleic Acids Res, 35, W407-W410.  https://doi.org/10.1093/nar/gkm290 PMID: 17517781
Xu, D., Zhang, Y. (2011). Improving the physical realism and structural accuracy of protein models by a two-step atomic-level energy minimization. Biophys J, 101, 2525-2534. https://doi.org/10.1016/j.bpj.2011.10.024 PMID: 22098752
Yachdav, G., Kloppmann, E., Kajan, L., Hecht, M., Goldberg, T., Hamp, T., Hönigschmid, P., Schafferhans, A., Roos, M., Bernhofer, M. (2014). PredictProtein—an open resource for online prediction of protein structural and functional features. Nucleic Acids Res, 42, W337-W343. https://doi.org/10.1093/nar/gku366 PMID: 24799431
Yang, J., Yan, R., Roy, A., Xu, D., Poisson, J., Zhang, Y. (2015). The I-TASSER Suite: protein structure and function prediction. Nat Methods, 12, 7-8. https://doi.org/10.1038/nmeth.3213 PMID: 25549265
Yu, C. S., Lin, C. J., Hwang, J. K. (2004). Predicting subcellular localization of proteins for Gram-negative bacteria by support vector machines based on n-peptide compositions. Protein Science, 13, 1402-1406. https://doi.org/10.1110/ps.03479604 PMID: 15096640
Zhang, G. L., Srinivasan, K. N., Veeramani, A., August, J. T., Brusic, V. (2005). PREDBALB/c: a system for the prediction of peptide binding to H2d molecules, a haplotype of the BALB/c mouse. Nucleic Acids Res. 33:W180-W183. https://doi.org/  10.1093/nar/gki479 PMID: 15980450