معلومة

كيف تجد المخلفات المحفوظة عبر الأنواع؟

كيف تجد المخلفات المحفوظة عبر الأنواع؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أريد تحديد ما إذا كانت بعض مواقع الفسفرة محفوظة للبروتين X عبر البشر والخميرة. أعلم من بيانات MS أن هناك 4 مواقع فسفرة في البروتين البشري X. من أجل تحديد ما إذا كانت هذه البقايا ، وبالتالي من المحتمل مواقع الفسفرة ، محفوظة ، هل من الصحيح محاذاة كلا التسلسلين باستخدام مقارنات زوجية باستخدام برنامج مثل Needle؟ أم ينبغي علي إجراء محاذاة أكبر واستخدام أوميغا العنقودية؟ هل هناك طرق أفضل؟


كنت سأقوم بمحاذاة أكبر باستخدام العنقودية أو المافت أو شيء من هذا القبيل. ستعطيك المحاذاة الزوجية الكثير من الضوضاء من الصدفة العشوائية وستكون مجموعة المحاذاة الزوجية كبيرة حقًا. ستكتشف محاذاة التسلسل المتعدد إشارات الحفظ الأصغر.

قارن مع عدة أنواع من الخميرة وربما ثدييات أخرى في سياقها. عند الانتهاء من المحاذاة ، ربما رسمها؟ أنا أحب الشعارات للمحاذاة العمودية الكبيرة.


المخلفات المحفوظة في القمح (Triticum aestivum) مطلوب مجال NAM-A1 NAC لربط البروتين وعند حدوث طفرة تؤدي إلى تأخر السويقة وشيخوخة أوراق العلم

تحتوي عوامل النسخ NAC على خمسة نطاقات فرعية محفوظة للغاية وهي مطلوبة لثنائي البروتين وربط الحمض النووي. تم تحديد عدد قليل من المخلفات داخل هذه المجالات الفرعية على أنها ضرورية لوظيفة البروتين ، ولا يزال عدد أقل منها ذو صلة بيولوجية في بلانتا. هنا نستخدم منظمًا إيجابيًا للشيخوخة في القمح ، NAM-A1، لاختبار تأثير الطفرات الخاطئة على بقايا محددة ومحفوظة للغاية من مجال NAC على وظيفة البروتين.

نتائج

حددنا الطفرات الخاطئة في خمس بقايا محفوظة للغاية في مجال NAC لـ NAM-A1 في مجموعة Tetraploid TILLING. نمت سلالات TILLING التي تحتوي على هذه الطفرات ، جنبًا إلى جنب مع عناصر التحكم في الطفرات المترادفة وغير المحفوظة ، في ظل ظروف البيت الزجاجي وسجلت للشيخوخة. أظهرت أربعة من الطفرات الخمس تأخيرًا كبيرًا وثابتًا في شيخوخة السويقة ولكن لم يكن لها تأثيرات ثابتة على شيخوخة أوراق العلم. فقدت جميع الأليلات الأربعة الطافرة ذات النمط الظاهري للشيخوخة المتأخرة أيضًا القدرة على التفاعل مع المتماثل NAM-B1 في اختبار الخميرة ثنائي الهجين. تم سابقًا إثبات أن اثنتين من هذه البقايا متورطة في وظيفة مجال NAC في Arabidopsis ، مما يشير إلى الحفاظ على وظيفة البقايا بين الأنواع. ثلاثة من هذه الأليلات الأربعة أدت إلى استجابة مخففة لموت الخلايا مقارنة بالنوع البري NAM-A1 عند الإفراط في التعبير بشكل عابر في نيكوتيانا بنتاميانا. تم اختبار إحدى هذه الطفرات بشكل إضافي في ظل الظروف الميدانية ، حيث كان هناك تأخير كبير ومتسق في كل من شيخوخة السويقة والأوراق.

الاستنتاجات

قمنا بدمج الدراسات الميدانية والصوب الزجاجية لسلسلة من الأليلات الطافرة مع التحليلات الكيميائية الحيوية لتحديد أربعة بقايا من مجال NAC المطلوبة من أجل NAM-A1 وظيفة وتفاعل البروتين. نوضح أن الطفرات في هذه البقايا تؤدي إلى تدرج في الأنماط الظاهرية ، مما يزيد من إمكانية تطوير سلسلة أليلية من الطفرات لسمات ذات أهمية زراعية. نظهر أيضًا أن الطفرات في NAM-A1 تأثير أكبر على شيخوخة السويقة ، مقارنةً بشيخوخة أوراق العلم التي تمت دراستها بشكل أكثر شيوعًا ، مما يبرز هذا باعتباره مجالًا يستحق مزيدًا من الدراسة. تقدم نتائج هذا النهج المتكامل دليلًا قويًا على أن البقايا المحفوظة في المجالات الوظيفية لعوامل النسخ NAC لها أهمية بيولوجية في بلانتا.


مقدمة

تمثل بروتينات الغشاء أكثر من 20٪ من البروتينات المتوقعة في الجينوم المتسلسل (Wallin and von Heijne 1998). على عكس البروتينات القابلة للذوبان ، والتي تحيط بها البيئة المائية ، تتكون بروتينات الغشاء من مناطق الغشاء (TM) الموجودة في مناطق الغشاء الكارهة للماء ومناطق خارج الغشاء (EM) الموجودة في البيئة المائية خارج الغشاء (الشكل 1). نتيجة لهذا التمييز ، تختلف المبادئ الفيزيائية التي تحكم ثني واستقرار بروتينات الغشاء اختلافًا كبيرًا عن تلك التي تحكم البروتينات القابلة للذوبان (White and Wimley 1999 Popot and Engelman 2000 Bowie 2005). تختلف الخصائص التطورية لبقايا TM أيضًا عن تلك الخاصة بمخلفات البروتين القابلة للذوبان (جونز وآخرون. 1994 Goldman et al. 1998 Tourasse and Li 2000 Eyre et al. تؤثر خصائص بروتينات الغشاء كميًا على خصائصها التطورية على مستوى المخلفات غير مفهومة جيدًا.

بيئات المخلفات داخل بروتينات الغشاء. رسم تخطيطي لبروتين غشائي في المقطع العرضي. تنقسم بقايا بروتينات الغشاء إلى نوعين متميزين من المناطق: مناطق TM (حمراء) ، والتي تقع داخل الغشاء الذي يدخل فيه البروتين ، ومناطق EM (الزرقاء) ، التي تقع خارج الغشاء. في كل من منطقتي TM و EM ، تتعرض البقايا لدرجات مختلفة من الدفن داخل البروتين ، بدءًا من المدفونة تمامًا إلى المكشوفة للغاية.

على عكس بروتينات الغشاء ، يُعرف الكثير فيما يتعلق بالمحددات الفيزيائية الحيوية والهيكلية لتطور المخلفات للبروتينات القابلة للذوبان. بالنسبة لبقايا البروتين القابلة للذوبان ، من المعروف الآن أن درجة الدفن هي مؤشر رئيسي لمعدل التطور وأن البقايا المدفونة تتطور بشكل أبطأ من البقايا المكشوفة (Perutz et al. 1965 Overington et al. 1992 Goldman et al. 1998 Bustamante et al. 2000 Choi et al. 2006 Conant and Stadler 2009 Franzosa and Xia 2009 Ramsey et al. 2011). في الآونة الأخيرة ، قمنا ببناء نموذج كمي واسع النطاق يربط معدل تطور المخلفات بدرجة دفن البروتينات القابلة للذوبان في الخميرة (Franzosa and Xia 2009). تتميز طريقتنا بتقديرات دقيقة للخصائص الهيكلية والتطورية على مستوى المخلفات: يتم حساب دفن البقايا مباشرة من النماذج الهيكلية ثلاثية الأبعاد عالية الجودة القائمة على التماثل (3D) لبروتينات الخميرة ، ويتم حساب المعدل التطوري بدقة بناءً على محاذاة التسلسل من أخصائيي تقويم العظام من أنواع الخميرة وثيقة الصلة. كشف تحليلنا أن المعدل التطوري للبقايا يتوسع خطيًا مع إمكانية الوصول إلى المذيبات النسبية (RSA). بمعنى آخر ، عندما تصبح البقايا أكثر تعرضًا بشكل تدريجي (أقل دفنًا) ، يرتاح القيد الانتقائي بمعدل ثابت.

كان الاتجاه الخطي بين المعدل التطوري الآني للبقايا و RSA الذي لاحظناه سابقًا يعتمد على البروتينات القابلة للذوبان فقط (Franzosa and Xia 2009). من غير المعروف ما إذا كان هذا الاتجاه الخطي ينطبق على منطقتي TM و EM لبروتينات الغشاء ، والأهم من ذلك ، إلى أي مدى يمكن لمثل هذا الاتجاه أن يفسر الاختلاف العالمي في الخصائص التطورية لمناطق TM مقابل مناطق EM. أظهرت الدراسات السابقة أن معدلات وأنماط بدائل الأحماض الأمينية لمناطق TM لبروتينات الغشاء تختلف اختلافًا كبيرًا عن تلك الخاصة بالبروتينات القابلة للذوبان (جونز وآخرون 1994) ، وأن مناطق TM تتطور بشكل أبطأ من مناطق EM لبروتينات الغشاء (Tourasse and Li 2000) ، أن المخلفات المدفونة يتم الحفاظ عليها أكثر من البقايا السطحية في مناطق TM (Goldman et al. 1998 Eyre et al. 2004 Kauko et al. 2008 Mokrab et al. 2010) ، وأن المخلفات المدفونة أو القطبية أو الملفوفة محفوظة بدرجة عالية في مناطق TM (Kauko et al. 2008 Mokrab et al. 2010 Illergard et al. 2011). ومع ذلك ، تم التعامل مع التعرض للمذيبات عادةً كمتغير ثنائي في الدراسات السابقة ، حيث تم تصنيف مواقع المخلفات إلى مواقع مدفونة مقابل مواقع سطحية ، على الرغم من أن التعرض للمذيب هو خاصية مستمرة تختلف من الدفن الكامل إلى التعرض الكامل (الشكل 1).

كانت ثلاث دراسات حديثة (Kauko et al. 2008 Oberai et al. 2009 Illergard et al. 2010) رائدة في استخدام مقياس مستمر للتعرض للمذيبات لدراسة تطور بروتين الغشاء. Illergard et al. وجد (2010) أن معدل استبدال البقايا يزداد خطيًا مع RSA عند متوسطه على جميع بروتينات الغشاء ، لكنهم لم يجروا حسابات منفصلة لمناطق TM ومناطق EM لبروتينات الغشاء. Kauko et al. (2008) و Oberai et al. وجد (2009) أن حفظ البقايا يزداد بشكل رتيب مع زيادة دفن المخلفات لكل من منطقتي TM و EM. ومع ذلك ، فقد حررت كلتا الدراستين درجة دفن المخلفات في فترات ذات مدى غير متساو ، مما منع التقييم الكمي لتأثير الدفن على تطور البقايا. بعد التحكم في الوصول إلى المذيبات ، Kauko et al. وجد (2008) أن مواقع TM لديها معدلات indel أقل من مواقع EM لكل من المخلفات الحلزونية والملفوفة وأن مواقع TM لديها معدلات استبدال الأحماض الأمينية أقل من مواقع EM لبقايا الملف ، والتي تضم 7 ٪ فقط من جميع المواقع داخل لب الغشاء العميق . ومع ذلك ، عند التحكم في إمكانية الوصول إلى المذيبات ، يتضاءل هذا الاختلاف في معدلات استبدال الأحماض الأمينية بين مواقع TM و EM للمخلفات الحلزونية ، والتي تضم غالبية مواقع TM لبروتينات TM & # x003b1-helical TM (Kauko et al. 2008). وبالمثل ، فإن Oberai et al. (2009) في العثور على أي اختلاف في حفظ البقايا بين مواقع TM و EM بعد التحكم في إمكانية الوصول إلى المذيبات.

يبدو أن هذه النتائج السلبية تشير إلى أن مواقع TM و EM ذات التعرض المذيب المماثل تتطور بمعدلات مماثلة. ومع ذلك ، من الممكن أن تكون هذه النتائج السلبية ناتجة عن العيوب المنهجية للتحليلات السابقة التي حالت دون الكشف الكمي والحساس للاختلافات التطورية الهامة بين مناطق TM و EM. بدلاً من حساب معدل التطور الآني على شجرة الأنواع الثابتة ، استخدمت جميع الدراسات الثلاث المذكورة أعلاه (Kauko et al. 2008 Oberai et al. 2009 Illergard et al. 2010) درجات حفظ المخلفات أو معدلات استبدال الأحماض الأمينية بناءً على محاذاة تسلسل البروتينات المتماثلة من الأنواع المتنوعة ، دون مراعاة الاختلافات في وقت اختلاف الأنواع ودون فصل صريح بين أخصائيي تقويم العظام والمتشابهين ، وبالتالي منع التوصيف الدقيق والحساس للقيود الانتقائية. حتى الآن ، لم تكن هناك دراسة على مستوى البروتين حول العلاقة الكمية بين دفن المخلفات ومعدل التطور اللحظي لمناطق TM و EM لبروتينات الغشاء ، ومن ثم دور هذه العلاقة في شرح فرق المعدل التطوري العالمي بين TM و EM المناطق لا تزال غير مستكشفة.

في هذا العمل ، نطبق الإطار الدقيق والكمي الذي طورناه سابقًا للبروتينات القابلة للذوبان (Franzosa and Xia 2009) لدراسة بنية مستوى المخلفات و علاقات التطور # x02013 لبروتينات الغشاء في الخميرة ، باستخدام هيكل ثلاثي الأبعاد عالي الجودة قائم على التماثل. التعليقات التوضيحية لـ 59 بروتينًا غشائيًا مشفرًا في جينوم الخميرة النووي ، ومعدلات التطور المحسوبة من محاذاة التسلسل لأخصائيي تقويم العظام من أربعة أنواع من الخميرة وثيقة الصلة. نظرًا لاستبعاد البروتينات الغشائية التي لا تحتوي على أخصائي تقويم محدد جيدًا في هذه الأنواع من الخميرة من التحليل اللاحق ، فإننا نختار التركيز على أربعة أنواع من الخميرة وثيقة الصلة كتوازن مثالي بين الإحصائيات التطورية القوية وتغطية عدد كبير من بروتينات غشاء الخميرة. وجدنا أنه على الرغم من الاختلاف الكبير في بيئة المذيبات لمناطق TM و EM لبروتينات الغشاء ، فإن العلاقات الكمية بين معدل تطور المخلفات ودرجة التعرض للمذيبات متشابهة جدًا: بالنسبة لكل من منطقتي TM و EM لبروتينات الغشاء ، فإن الاتجاهات قوية وإيجابية وخطية. والأهم من ذلك ، بالنسبة لدرجة معينة من دفن المخلفات ، أن بقايا TM تتطور بشكل أبطأ باستمرار من بقايا الكهرومغناطيسية ، وبالتالي يجب أن تخضع لضغط انتقائي أقوى باستمرار. على الرغم من أن الدراسات السابقة قد عزت الحفظ المتزايد لمناطق TM إلى الجزء المتزايد من المخلفات المدفونة (Oberai et al. 2009) ، فإننا نوضح هنا أن الزيادة المنهجية التي لوحظت حديثًا في القيد الانتقائي عبر جميع بقايا TM هي المحدد المهيمن للخفض التطوري معدل مناطق TM بالنسبة لمناطق EM.

بالإضافة إلى ذلك ، تسلط دراستنا الضوء على عالمية العلاقة الخطية بين معدل تطور المخلفات والتعرض للمذيبات عبر بيئات متنوعة (البروتينات القابلة للذوبان ومناطق EM ومناطق TM لبروتينات الغشاء) ، مما يدعم قيود تعبئة البقايا كقوة دافعة رئيسية وراء هذه الاتجاهات الخطية . نظرًا لانخفاض أهمية التأثيرات الكارهة للماء في الجزء الداخلي من الغشاء ، تكتسب تعبئة البقايا أهمية متزايدة في مناطق TM ، مما يوفر تفسيرًا طبيعيًا للزيادة المنهجية في القيد الانتقائي عبر جميع بقايا TM. تكشف دراستنا عن مبادئ متميزة تحكم البنية وعلاقات تطور البروتينات الغشائية على مستوى المخلفات وتسلط الضوء على الطريقة التي تقود بها الخصائص الفيزيائية الحيوية على مستوى البقايا السلوك التطوري العالمي لبروتينات الغشاء.

نحن نركز على الخميرة في مهدها سaccharomyces cerevisiae لأنه نظام نموذجي مثالي للتحليل الجينومي. تم شرح بروتين الخميرة على نطاق واسع. بالإضافة إلى الخميرة الناشئة ، تم أيضًا ترتيب العديد من أصناف الخميرة وثيقة الصلة. تم تحديد العلاقات التقويمية بين جينات الخميرة بدقة ، وهو شرط أساسي لحساب معدل التطور. يسمح التركيز على الخميرة أيضًا بإجراء مقارنة مباشرة مع عملنا السابق على البنية الواسعة للبروتين وعلاقات التطور # x02013 في بروتينات الخميرة القابلة للذوبان (Franzosa and Xia 2009). من المتوقع أن يكون الاختلاف الأساسي في الخواص الفيزيائية الحيوية بين البيئات الغشائية والمائية وتأثيراتها على تطور البروتين مستقلًا عن الأنواع إلى حد كبير. وبالتالي ، نتوقع أن تكون نتائجنا قابلة للتطبيق على نطاق واسع على مجموعة واسعة من بروتينات الأغشية من البكتيريا إلى حقيقيات النوى الأعلى.


نتائج

إطار عمل LncLOOM

يتلقى LncLOOM مجموعة من المتواليات المتجانسة المفترضة للتسلسل الجيني ذي الأهمية. هنا ، نركز على lncRNAs و 3 UTRs ، ولكن يمكن أيضًا استخدام عناصر أخرى ، مثل المُحسِنات ، بسهولة (راجع قسم "المناقشة"). بالنسبة إلى lncRNAs ، نستخدم فقط التسلسلات الخارجية لتحديد الحافز ، ولكن أيضًا تصور مواقع تقاطعات exon-exon. يتم توفير تسلسل الإدخال بترتيب معين (الشكل 1 أ) ، والذي يتوافق بشكل مثالي مع المسافات التطورية بين الأنواع ، والتي يمكن تعيينها تلقائيًا بناءً على تشابه التسلسل. تظهر التعريفات الدقيقة لهياكل البيانات والخوارزميات المستخدمة في LncLOOM في قسم "الطرق" ، ويتم تقديم نظرة عامة على إطار العمل في الشكل 1. يمثل LncLOOM كل تسلسل RNA كـ "طبقة" من العقد في الرسم البياني للشبكة ( الشكل 1 ب) ، حيث تمثل كل عقدة قصيرة ك-مر. للتحليل المقدم هنا ، استخدمنا ك بين 6 و 15 ، كما ك- عادةً ما ينتج عن الأقصر من 5 رسوم بيانية كبيرة جدًا لإجراء عمليات حسابية فعالة وحفظها ك- تعتبر الأعمار التي يزيد عمرها عن 15 عامًا نادرة بدرجة كافية ليتم العثور عليها في الغالب مرة واحدة فقط في كل سلسلة (محفوظة لفترة أطول كسيتم استرداد -mers عن طريق دمج أقصر ك-mers (انظر أدناه)). على الرغم من أن 6 هو الحد الأدنى كبطول أكبر يسمح به LncLOOM ، من الممكن بدء اكتشاف الحافز باستخدام ك-mers من أي طول لتقليل تعقيد الرسم البياني لتحليل التسلسلات الأطول و / أو المتشابهة. يعكس ترتيب الطبقات المسافة التطورية لتسلسلات الإدخال من تسلسل الاستعلام ، والتي يتم وضعها في الطبقة الأولى من الرسم البياني (الإنسان في التحليلات الموصوفة هنا) ، ويتم وضع التسلسلات من الأنواع الأخرى في طبقات متسلسلة إضافية من رسم بياني. تربط الحواف في الرسم البياني بين عقد متطابقة ك- مير في طبقات متتالية. نلاحظ أنه من الممكن أيضًا ربط "متشابه" ك-mers ، ولكن ينتج عن هذا حاليًا رسوم بيانية كثيفة جدًا للتطبيقات العملية لنهجنا (راجع قسم "المناقشة") ، ولذا فإننا هنا فقط نربط العقد المتطابقة تمامًا. في ظل هذه التعريفات ، يتمثل هدفنا في تحديد مجموعات من "المسارات" الطويلة في الرسم البياني التي لا تتقاطع مع بعضها البعض ، وبالتالي ربط الأشكال القصيرة التي تحافظ على نفس الترتيب في تسلسلات مختلفة. نظرًا لأننا مهتمون عادةً بالزخارف الموجودة في تسلسل الاستعلام ، فإننا نطلب أن تبدأ المسارات في الطبقة العليا. مشكلة تحديد المجموعة القصوى من هذه المسارات صعبة حسابيًا ، منذ ذلك الحين ك = 1 هي نفس أطول مشكلة شائعة لاحقة [9] ، لكننا أظهرنا أنه يمكن ترجمتها إلى مشكلة حل برنامج خطي عدد صحيح (ILP) ، والتي يصعب من الناحية الحسابية إيجاد حل أمثل لها ، ولكن تتوفر مذيبات فعالة [10] (الشكل 1 ب وقسم "الطرق").

نظرة عامة على إطار عمل LncLOOM. أ نظرة عامة على منهجية LncLOOM. تقوم LncLOOM بعمليات ترتيب قوائم التسلسلات واستعادة مجموعة من الأشكال المرتبة المحفوظة لأعماق مختلفة والتي يمكن شرحها كمواقع ربط miRNA أو RBP. ب رسم تخطيطي لبناء الرسم البياني واكتشاف الحافز باستخدام البرمجة الخطية الصحيحة (ILP) للعثور على مسارات طويلة غير متقاطعة. يتم ترتيب التسلسلات مع زيادة المسافة التطورية بشكل رتيب من الطبقة العليا (الإنسان). يتم تصوير أزواج المقاطع عالية الدرجات (HSPs) التي يمكن استخدامها لتقييد موضع الحواف (راجع قسم "الأساليب") على شكل كتل زهرية وحمراء أسفل كل تسلسل. يستخدم الرسم البياني لبناء مشكلة ILP ، ويستخدم حلها لبناء مجموعة من المسارات الطويلة التي تتوافق مع الأشكال التركيبية المحفوظة

بمجرد إنشاء الرسم البياني ، نبدأ بتحديد المسارات لأكبرها ك قيمة ، ثم استخدم هذه المسارات (إذا وجدت) لتقييد المواقع المحتملة للمسارات لأصغر ك. يتيح لنا هذا النهج تفضيل العناصر المحفوظة لفترة أطول ولكن أيضًا لتحديد العناصر المحفوظة بشكل كبير ك-مرز. مرة واحدة فقط ك يتم اختبار القيم ، نقوم بدمج الرسوم البيانية الناتجة والحصول على مزيج من الأشكال والأعماق التي تم حفظها فيها. من أجل حساب الأهمية الإحصائية للحفاظ على الحافز ، نقوم بإنشاء MSA لتسلسلات الإدخال ، وخلط أعمدة المحاذاة ، ومن ثم نشتق متواليات عشوائية بهيكل تشابه داخلي مشابه لتسلسل الإدخال. يتم بعد ذلك تطبيق خط أنابيب LncLOOM الكامل على هذه التسلسلات ، ولكل نموذج موجود في تسلسل الإدخال الأصلي ليتم حفظه في طبقة د، نحسب الاحتمالية التجريبية لتحديد إما الفكرة نفسها بدقة ، أو مجموعة من نفس العدد من أي زخارف بهذا الطول ، محفوظة في طبقة د. إضافي ص يتم حساب القيم لعنصر تحكم أقل صرامة ، حيث يتم إنشاء متواليات عشوائية مع نفس تركيبة ثنائي النوكليوتيد ولا يتم الحفاظ على بنية التشابه بين التسلسلات.

يتم استخدام مجموعة غنية قائمة على HTML لتصور هذه الأشكال بطرق مختلفة ، على سبيل المثال ، ترميزها بالألوان بناءً على عمق الحفظ وإبراز العناصر في كل من تسلسل الاستعلام وفي التسلسلات الأخرى (انظر الشكلين 3 و 4 أدناه للحصول على أمثلة من إخراج LncLOOM). يتضمن إخراج LncLOOM أيضًا مسارًا مخصصًا مرمزًا بالألوان للزخارف المحددة في تسلسل الاستعلام ، والتي يمكن عرضها في متصفح الجينوم UCSC. قمنا بتعليق الزخارف باستخدام مجموعة من مواقع البذور من microRNAs المحفوظة (من TargetScan [11]) ومواقع ربط RBP الموجودة في بيانات eCLIP من مشروع ENCODE [12].

يحدد LncLOOM العناصر المحفوظة بعمق في ملف سيرانو lncRNA

ال سيرانو lncRNA (OIP5-AS1 في الإنسان) هو lncRNA على نطاق واسع ومعبر للغاية [13 ، 14]. على الرغم من حفظها في جميع الفقاريات ، سيرانو المعارض

تباين 5 أضعاف في طول التسلسل الخارجي الإجمالي (2340 nt في medaka إلى 10155 nt في الأبوسوم ، الشكل 2 أ). تم تحديد عنصر 67 nt المقيّد مسبقًا في سيرانو هي المنطقة الوحيدة التي أبلغت بلاست عن تشابه كبير عند مقارنة تسلسل الزرد والبشر [13]. علاوة على ذلك ، فإن كامل سيرانو الموقع غير قابل للمحاذاة بين الثدييات والأسماك في محاذاة الجينوم الكامل 100 طريقة (متصفح الجينوم UCSC). يحتوي العنصر المحفوظ للغاية على موقع ربط miR-7 مكمل على نطاق واسع بشكل غير عادي ، وهو أمر ضروري لتدهور miR-7 بواسطة سيرانو [13, 14].

العناصر المحفوظة في سيرانو lncRNA. أ الخطوط العريضة للتنظيم الجينومي سيرانو exons في الأنواع المختارة. ب عناصر التسلسل التي تم تحديدها بواسطة LncLOOM ليتم حفظها في سيرانو في 17 نوعًا على الأقل. المنطقة التي تحتوي على عناصر موجودة في المنطقة قابلة للمحاذاة بواسطة BLAST بين تسلسل Cyrano البشري والسمك الزرد محاطة بدائرة. تشير الأرقام بين العناصر إلى مسافات النطاق بين العناصر في الأنواع الثمانية عشر. يشير الرقم المحاط بدائرة أعلى كل عنصر إلى رقم العنصر المستخدم في النص واللوحات الأخرى. ج الاقتران بين عناصر الربط المتوقعة في سيرانو و miR-25/92 و miR-7 miRNAs. د دليل على ارتباط PUM1 و PUM2 بعزر UGUAUAG (المنطقة المظللة) في الجينوم البشري. مشروع ENCODE بيانات CLIP (أعلى ، K562 خلية) و [15] (أسفل ، HCT116 خلية). يعتمد التظليل على قوة الأدلة الملزمة ، على النحو المحدد في مشروع ENCODE. ه ربط وتنظيم الماوس سيرانو التسلسل بواسطة Pum1 / 2 و Rbfox1 / 2. أعلى: بيانات Pum1 / 2 CLIP و RNA-seq من [16]. الوسط: Rbfox1 CLIP من دماغ الفأر [17] ومن mESCs [18]. تم تمييز الأشكال الملزمة لـ Pumilio و Rbfox باللون الأصفر والأزرق على التوالي. نتائج حفظ تسلسل PhyloP مأخوذة من متصفح الجينوم UCSC. أسفل: ربط Ago2 في دماغ الفأر بمنطقة موقع ربط miR-153 بالقرب من نهاية 3 سيرانو. بيانات CLIP من [19]. F أعلى اليسار: محاذاة المنطقة المحيطة بعنصر AUGGCG المحفوظ بالقرب من نهاية 5 سيرانو. أعلى اليمين والأسفل: البيانات المركبة Ribo-seq و RNA-seq من مجموعات البيانات المتعددة المنسقة في [20]. بيانات ChIP-seq لـ YY1 في خط خلية K562 من مشروع ENCODE. الظاهر هو تغطية القراءة وذروات IDR

من أجل تحديد العناصر المحفوظة الإضافية ، قمنا بالتنسيق سيرانو تسلسلات من 18 نوعًا حيث يمكننا تحديد بيانات RNA-seq القابلة للاستخدام ، بما في ذلك ثمانية ثدييات ودجاج و العاشر الاستوائية، وسبعة أنواع من أسماك الفقاريات ، وقرش الفيل (ملف إضافي 2: الجدول S1). حدد LncLOOM سبعة عناصر محفوظة في جميع الأنواع ، تسعة منها محفوظة في جميع الأنواع باستثناء سمك القرش (الشكل 2 ب) ، و 37 عنصرًا محفوظًا في جميع الثدييات. نركز هنا على العناصر التسعة المحفوظة في جميع الأنواع باستثناء أسماك القرش (المرقمة من 1 إلى 9 في الشكل 2 ب) ، وقد وجد أن سبعة منها ذات دلالة إحصائية من خلال كلا الاختبارين LncLOOM (ص & لتر 0.01). تقع العناصر 3-6 فقط ضمن المنطقة المحفوظة 67-nt التي يمكن تحديدها بواسطة BLAST ، بما في ذلك عنصران يتوافقان مع الاقتران بـ 5 و 3 من miR-7 (الشكل 2 ج) ، والآخر ، UGUAUAG ، الذي يشبه التعرف على Pumilio العنصر (PRE ، العنصر رقم 6). يربط هذا العنصر بالفعل PUM1 و PUM2 في بيانات CLIP من الإنسان والفأر (الشكل 2 د ، هـ) ، وفي دماغ الأطفال حديثي الولادة ، حيث سيرانو مستويات عالية نسبيًا ، ونضوب بوم 1 و بوم 2 يؤدي إلى زيادة في سيرانو التعبير (معدل ص قيمة 3.49 × 10 −3 ، بيانات من [16] ، الشكل 2 هـ) ، بما يتوافق مع وظائف هذه البروتينات في تحلل الحمض النووي الريبي [21]. من المحتمل أن يكون هذا القمع بسبب التأثير المشترك لهذه PRE المحفوظة للغاية وغيرها - الـ 18 سيرانو تحتوي التسلسلات من أنواع مختلفة على 3.2 PREs إجماعًا في المتوسط ​​(بما في ذلك اثنان في تسلسل الماوس ، مقارنة بـ 1.3 في المتوسط ​​في 1000 تسلسل عشوائي مختلط ، ص & lt 0.001 ، راجع قسم "الأساليب").

يمكن تعيين وظيفة بيولوجية مفترضة للعديد من العناصر المحفوظة الإضافية المحددة بواسطة LncLOOM داخل سيرانو تسلسل. تم العثور على 9mer محفوظة في جميع أنواع المدخلات الـ 18 ، UGUGCAAUA (العنصر رقم 2 في الشكل 2 ب)

60 nt المنبع من موقع ربط miR-7 ، خارج المنطقة المحاذاة بواسطة BLAST. يتوافق هذا العنصر مع مطابقة بذرة عائلة miR-25/92 (الشكل 2 ج) وقد تم مؤخرًا إثبات ارتباطه وتنظيمه بواسطة أفراد عائلة miR-25/92 في قلب جنيني الفأر [22]. في 3 ′ نهاية سيرانو، عنصر واحد محفوظ (GCAAUAAA) يتوافق مع سيرانو إشارة عديد الأدينيل (PAS) بالإضافة إلى موقع miR-137. تم العثور على تسلسل آخر

100 nt المنبع من PAS ، CUAUGCA ، يتوافق مع تطابق البذور miR-153 ، وهذه المنطقة مرتبطة بـ Ago2 في دماغ الفأر (الشكل 2 هـ). ومن المثير للاهتمام، سيرانو تنخفض المستويات في خلايا هيلا بنسبة 41٪ و 11٪ بعد تعداء miR-137 و miR-153 على التوالي [23]. سيرانو وبالتالي يخضع لتنظيم شديد الحفظ بواسطة microRNAs إضافية تتجاوز التفاعلات المبلغ عنها مع miR-7 و miR-25/92.

ما يقرب من 55 nt في اتجاه المصب من موقع ربط Pumilio المحفوظ ، هناك نموذج WGCAUGA محفوظ (W = A / U) يتوافق مع نموذج الربط الإجماعي لـ Rbfox RBPs. يرتبط هذا النموذج بـ Rbfox1 / 2 في الماوس ، كما هو الحال بالنسبة للمناطق الإضافية التي تحتوي على مثيلات WGCAUGA في النصف 3 من سيرانو (الشكل 2 هـ). في الواقع ، تحليل 18 سيرانو أظهرت الأنواع إثراءًا كبيرًا لـ WGCAUGA (9.8 حالة مقابل 4.5 متوقع بالصدفة ، ص & lt 0.001 ، راجع قسم "الأساليب"). على عكس مواقع ربط miRNA و Pumilio ، فإن فحص مجموعات بيانات RNA-seq المختلفة لفقدان الوظيفة Rbfox1 / 2 لم يحدد أي تأثير على سيرانو مستويات (غير معروضة) ، مما يشير إلى أن الارتباط الشامل والمحفوظ بواسطة Rbfox1 / 2 قد يؤثر سيرانووظائف ، بدلاً من التعبير.

تم العثور على 6 أمتار أخرى محفوظة للغاية ، AUGGCG ، في 5 من سيرانو. تفتيش سيرانو كشفت التسلسلات وبيانات Ribo-seq من الإنسان والفأر وسمك الزرد أن هذا 6mer يتوافق مع الكودونين الأولين من 2–3 aa ORF القصير المحفوظ (الشكل 2f). تم العثور على ارتباط واضح الريبوسوم في نهاية 5 سيرانو في ORF هذا ، مع وجود عدد محدود جدًا من الأجزاء المحمية من الريبوسوم التي لوحظت في اتجاه هذا العنصر في كل من الإنسان وسمك الزرد (الشكل 2f) ، مما يشير إلى ترجمة فعالة وإطلاق الريبوسوم في ORF القصير هذا. يتطابق سياق كودون AUG في ORF تمامًا مع القواعد الـ 12 لعزر TISU ، وهو عنصر تنظيمي يؤثر على كل من النسخ والترجمة. يقع TISU في نهاية 5 من النصوص ويعمل كموقع ربط YY1 الذي قد يفرض موقع بدء النسخ وكعنصر بادئ ترجمة عالي الكفاءة ودقيق يعتمد على الغطاء ، للترجمة التي تعمل بدون مسح ضوئي [24 ، 25]. المنطقة الجينومية لهذا الشكل تظهر ارتباط YY1 القوي بالحمض النووي (الشكل 2f). نتوقع أن هذا الشكل يمكن أن يكون له وظيفة مزدوجة كعنصر YY1 المنظم سيرانو التعبير ، وبداية اختصار ORF الذي قد يساهم فيه سيرانو الوظيفة ، كما هو مقترح للـ lncRNAs الأخرى [26]. بشكل عام ، يمكن افتراض الوظائف البيولوجية المفترضة لثمانية من العناصر المحفوظة التسعة في سيرانو—أربعة كمواقع ربط ميرنا ، اثنان كمواقع ربط RBP ، واحد كموقع ORF قصير محفوظ ، وواحد كموقع PAS. يتم فصل هذه العناصر عن طريق امتدادات طويلة من التسلسلات غير المحفوظة (الشكل 2 ب) ، مما يؤكد قوة دمج LncLOOM مع التعليقات التوضيحية والبيانات المتعامدة للكشف عن بيولوجيا lncRNA.

كمثال آخر على قدرة LncLOOM على العثور على العناصر المحفوظة في النصوص المعروفة بأنها مرتبطة ببيولوجيا ميرنا ، قمنا بتطبيقه على ثمانية متماثلات من الميزان lncRNA في الزرد و نريب البروتين في الثدييات. هذا هو أحد الأمثلة القليلة على الجين الذي تحوَّل من جين lncRNA أسلاف محتمل إلى جين مشفر للبروتين ، مع الاحتفاظ بتماثل تسلسل جوهري في منطقة 3 [13 ، 27]. الميزان يتسبب في تدهور miR-29b في الزرد والفأر من خلال موقع شديد الحفظ ومتكامل للغاية [27]. مقارنة أسماك الزرد الميزان مع تسلسل الإنسان والفأر باستخدام BLASTN يستعيد محاذاة

2.2 كيلو بايت تسلسل بشري ، وبالنسبة للغار المرقط ، هناك محاذاة مهمة إضافية قصيرة (ه القيمة & لتر 0.001). وجد LncLOOM 17 عنصرًا محفوظًا بين جميع الأنواع ، و GT 25 محفوظة في جميع الأنواع باستثناء أسماك الزرد (ملف إضافي 1: الشكل S1). تضمنت هذه المواقع miR-29 ، بالإضافة إلى مواقع الربط المحفوظة لثمانية miRNAs إضافية ، مع وجود ثلاثة منها خارج منطقة المحاذاة بين أنواع الثدييات والأسماك بواسطة BLAST (ملف إضافي 1: الشكل S1). وهكذا يبدو أن سيرانو و الميزان، فإن اثنين من lncRNAs اللذان ثبت أنهما يستنبطان بشكل فعال تدهور ميرنا الموجه (TDMD) ، يؤويان العديد من مواقع ربط ميرنا الإضافية المحفوظة للغاية ، ولكن على عكس المواقع التي تتوسطها TDMD ، فهذه مواقع بذور أساسية من المحتمل أن تؤثر على lncRNA ، بدلاً من ميرنا ، المستويات.

الزخارف المحفوظة في تسلسل CHASERR lncRNA

من أجل اختبار قدرة LncLOOM على تحديد الوحدات المحفوظة في تسلسلات غير قابلة للمقارنة BLAST ، ركزنا على CHASERR، وهو lncRNA الذي وصفناه مؤخرًا بأنه ضروري لبقاء الفأر [28]. CHASERR يمكن التعرف على المتماثلات بسهولة في الأنواع المختلفة بناءً على القرب الشديد (& lt 2 كيلو بايت) من موقع بدء النسخ لـ CHD2 ، بالإضافة إلى بنية الجين المميزة 5-exon [28]. نحن نسقنا يدويًا CHASERR متواليات من 16 فقاريًا ، كان طولها 579-1313 nt ، ومن المحتمل أن تكون أربعة منها 5′-غير مكتملة بسبب الفجوات في بعض مجموعات الجينوم حول المروج الغني للغاية بـ G / C وأول إكسون من CHASERR [28] (ملف إضافي 1: الشكل S2). وجدت BLASTN أهمية (ه value & lt 0.01) محاذاة بين الإنسان CHASERR والتسلسلات التسعة تأتي من السلويات ، ولكن ليس مع أي من الفقاريات الست الأخرى. على العكس من ذلك ، عندما تم استخدام تسلسل الزرد كاستعلام ، وجد BLAST فقط التماثل في أنواع الأسماك الأخرى وفي الأبوسوم. عندما CHASERR يتم تغذية التسلسلات في ClustalO MSA [29] ، تم العثور على ثلاثة مواضع متطابقة فقط. الحفظ المحدود لـ CHASERR وبالتالي يمثل تحديًا للتحليل باستخدام أدوات شائعة الاستخدام لعلم الجينوم المقارن.

حدد LncLOOM اثنين ك-mers كما هو محفوظ في جميع الطبقات: AAUAAA في نهاية 3 ، والتي تتوافق مع PAS ، و AAGAUG ، وجدت مرة أو مرتين في exon الأخير للجميع CHASERR متواليات (عزر 1 في الشكل 3 أ). التفتيش على CHASERR وجدت التسلسلات أن شكل AAGAUG تم تمثيله بشكل كبير بشكل كبير - كان لدى متماثلات CHASERR 2.1 حالة في المتوسط ​​، مقارنة بـ 0.45 فقط متوقعًا بالصدفة (ص & لتر 0.01). كان سياق الحافز أيضًا متشابهًا بشكل نموذجي عبر هذه الحالات الـ 34 ، حيث يتبع النموذج نموذجيًا البيورين (الشكل 3 ب). تم حفظ الشكل المرتبط ظاهريًا ، AAAUGGA (الشكل 2 في الشكل 3 أ) ، في 11 من المتواليات. بما في ذلك المتواليات المرافقة ، يشترك الشكل 2 في قلب ARAUGR مع الشكل 1 (الشكل 3 ب). على حد علمنا ، لا تتطابق هذه التسلسلات مع تفضيل الربط المعروف لأي RBP ، ولم يكشف فحص بيانات eCLIP عن مرشح واضح للموثق. لذلك قمنا باستكشاف وظائف هذه التسلسلات بشكل تجريبي.

العناصر المحفوظة في CHASERR lncRNA. أ بشر CHASERR تظهر بنية الجين بزخارف محفوظة في أربعة أنواع على الأقل مشفرة بالألوان من خلال عمق حفظها. يتم تكبير منطقة آخر exon ، ويتم إبراز العناصر التي تمت مناقشتها في النص. ب الشعارات المتسلسلة للتسلسلات التي تحيط بأكثر الشكلين محفوظين ، مع تظليل شكل AARAUGR المشترك. ج أعلى: الفأر المطارد locus مع مواضع أزواج التمهيدي المستخدمة في qRT-PCR ، والمناطق المستهدفة بواسطة GapmeRs (نفس تلك المستخدمة في [28]) و ASOs المميزة. القاع: qRT-PCR مع استهداف الاشعال المطارد (يظهر في الأعلى) أو Chd2 exons في خلايا N2a المعالجة بالكواشف المشار إليها ، ن = 4 لعلاجات ASO و ن = 5 لـ GapmeRs. د مؤامرة البركان لمقارنة شدة MS بين المنسدلة مع تسلسل WT من Chaserr last exon والإكسون الأخير حيث تم تحور العناصر المحفوظة (ملف إضافي 1: الشكل S3A). ه qRT-PCR باستخدام بادئات تستهدف المناطق المشار إليها بعد IP مع الجسم المضاد المحدد ، ن = 4. أعلى اليمين: لطخة غربية باستخدام جسم مضاد لـ DHX36 على العينة المحددة

لاختبار الأهمية الوظيفية للعناصر المحفوظة ، صممنا أليغنوكليوتيدات مضادة المعنى (ASOs) مكملة للحالات الثلاث للزخارف المحفوظة في الماوس المطارد (ملف إضافي 1: الشكل S3A) ، ونقلها إلى خلايا Neuro2a (N2a) ، حيث أظهرنا سابقًا أن نضوب المطارد يؤدي إلى زيادة في Chd2 مستويات البروتين والحمض النووي الريبي [28]. أدى ترنسفكأيشن ASO1 و ASO3 بشكل فردي أو مختلط إلى زيادة كبيرة في Chd2 مستويات مماثلة لتلك التي تسببها ضربة قاضية المطارد (الشكل 3 ج). ومن المثير للاهتمام أن علاج ASO أدى إلى زيادة في المطارد مستويات ، كما تم تقييمها بواسطة أزواج التمهيدي RT-PCR وجدت إما أعلى أو أسفل المنطقة المستهدفة ASO (الشكل 3 ج).

من أجل تحديد البروتينات التي من المحتمل أن تربط المناطق المحفوظة ، استخدمنا النسخ المختبري لتوليد RNAs أحيائيًا يحتوي على أول 322 nt من تسلسل WT لآخر exon للماوس المطارد (القواعد 559-880 من الشكل الإسوي RefSeq NR_037569.1) ، نفس التسلسل مع طفرات AUGG → UACC في أربعة أشكال محفوظة ، وطفرة ثانية حيث تم تحوير جميع مواقع AUGG السبعة في exon الأخير إلى UACC (ملف إضافي 1: الشكل S3A). تم تحضين هذه التسلسلات ، جنبًا إلى جنب مع عناصر التحكم المضادة للدلالة ، بمحللات من خلايا N2a وتم عزل البروتينات المرتبطة بمتغيرات الحمض النووي الريبي المختلفة وتحديدها باستخدام مقياس الطيف الكتلي. كما هو معتاد في هذه التجارب ، تم تحديد عدد كبير من البروتينات ، 938 ، على أنها مرتبطة بتسلسل WT (ملف إضافي 2: الجدول S2) ، وتم إثراء 74 منها 3 أضعاف مقارنة بالتسلسل المضاد للحساسية ، ومع ذلك ، 9 فقط من هؤلاء كان لديهم انتعاش أعلى بمقدار ضعفين عند استخدام تسلسل WT مقارنة بكلا الطفرات (الشكل ثلاثي الأبعاد). ثم فحصنا مجموعات بيانات RNA-seq العامة وسعى للحصول على أدلة على التغييرات في Chd2 و / أو المطارد المستويات عند اضطراب هذه البروتينات. كانت هذه الأدلة متاحة لـ DHX36 و ZFR (ملف إضافي 1: الشكل S3B-C). لقد تحققنا من صحة الارتباط الكبير لـ المطارد مع DHX36 - البروتين الذي أظهر أعلى نسبة تخصيب مقارنة بالتسلسلات الطافرة - باستخدام الترسيب المناعي للحمض النووي الريبي (RIP) وجسم مضاد محدد (الشكل 3 هـ). ومن المثير للاهتمام ، أن DHX36 معروف بربط تسلسلات G-quadruplex [30 ، 31] ، وتحتوي العناصر المحفوظة بالفعل على أزواج GG ، على الرغم من أن هذه العناصر بعيدة تمامًا عن بعضها البعض ، وتحتوي G-quadruplexes النموذجية على مجموعات من 3 جي على الأقل. يتوقع معين QGRS [32] واحد G-quadruplex في exon الأخير من المطارد (ملف إضافي 1: الشكل S3A) ، لكن الأدوات الأخرى ، بما في ذلك ماسح G4RNA [33] ، التي تدمج أنظمة تسجيل مختلفة لم تجد أي G-quadruplexes عالية الدرجات في exon الأخير المطارد. من الممكن أيضًا أن يتم تشكيل تشكيل G-quadruplex غير المتعارف عليه في هذا التسلسل أو أن يكون له وضع مختلف من التعرف بواسطة DHX36.

وبالتالي ، فإن LncLOOM قادر على تحديد العناصر ذات الصلة وظيفيًا داخل lncRNAs والتي يمكن أن تكون بمثابة أساس لتصميم الكواشف المستهدفة لتعكير صفو وظيفتها ، وتمكين استخدام الأساليب البروتينية لتحديد شركاء تفاعل lncRNA معينين وذات صلة وظيفيًا.

العناصر المحفوظة بعمق في حدود 3UTRs من مقامر 1 و Pumilio mRNAs

أردنا بعد ذلك تقييم قابلية تطبيق LncLOOM خارج lncRNAs ، ولمقارنة التسلسلات عبر مسافات تطورية أطول. 3′ يمكن أن تملي UTRs استقرار RNA وكفاءة ترجمة mRNAs ، وعادة ما تتطور بسرعة أكبر بكثير من مناطق mRNA الأخرى [34]. من السهل تحديد القواعد التقويمية بين 3′UTRs ، بناءً على تسلسلات الترميز المجاورة ، والتي غالبًا ما يمكن مقارنتها بسهولة عبر مسافات تطورية طويلة جدًا. ومع ذلك ، هناك عدد قليل جدًا من الحالات المعروفة للحفظ بعيد المدى للعناصر الوظيفية داخل 3 -UTRs بين الفقاريات واللافقاريات. من أجل دراسة الحفاظ على 3′UTR باستخدام LncLOOM ، ركزنا أولاً على الجينات التي تعمل في تنظيم ما بعد النسخ ، حيث تخضع هذه عادةً لتنظيم معقد بعد النسخ. باستخدام بيانات RNA-seq المتاحة وعلامة التسلسل المعبر عنها (EST) ، قمنا بتجميع مجموعة من 3 تسلسلات UTR من مقامر 1، الذي يشفر مكونًا رئيسيًا في مسار ميرنا ، من 12 نوعًا ، بما في ذلك ثمانية فقاريات ، لانسيليت ، لامبري ، قنفذ البحر ، C. المعوية، واثنين من DICER في ذبابة الفاكهة. بشر مقامر 1 يمكن محاذاة 3'UTR بواسطة BLASTN إلى 3′UTRs من أنواع الفقاريات ، ولكن ليس أبعد من ذلك. حدد LncLOOM 15 عنصرًا محفوظًا في جميع متواليات الفقاريات ، ستة بأطوال لم يتم العثور عليها في التسلسلات العشوائية (ص & lt 0.01 ، ملف إضافي 1: الشكل S4). تم حفظ ثمانية من الزخارف خارج الفقاريات (ولا يمكن تقييمها بواسطة MSAs أو BLAST) ، وتم العثور على واحد ، يتوافق مع موقع ربط لـ miR-219 المحفوظ ، في جميع الأنواع ، بما في ذلك fly Dicer2 3′UTR.

ثم ركزنا على 3′UTRs من بوم 1 و بوم 2 mRNAs ، التي تكوِّد بروتينات Pumilio التي تثبط التعبير الجيني بعد النسخ. يتم الحفاظ على بروتينات Pumilio بعمق ، وهناك نوعان من بروتينات Pumilio في الفقاريات ، PUM1 و PUM2 ، مع طبيب تقويم واحد في الحبليات الأخرى والذباب.قمنا برعاية متواليات 3′UTR من 12 فقاريًا وأربعة لافقاريات (لامبري ، لانسيليت ، C. المعويةوذبابة الفاكهة). يمكن محاذاة الإنسان والأسماك الزرد 3′UTRs بسهولة بواسطة BLASTN ، وهناك تجانس كبير بين 3′UTR من PUM1 البشري وتلك الخاصة بـ Pumilio mRNAs في لامبري و lancelet ، ولكن ليس من تلك الموجودة في الذباب و C. المعوية. حددت LncLOOM ثمانية عناصر محفوظة في جميع أنحاء الفقاريات PUM1 3′UTRs ، أحدها ، UGUACAUU ، تم حفظه في جميع الـ 16 التي تم تحليلها 3′UTRs طوال الطريق إلى الذبابة بوم 3′UTR (الشكل 4 ، أعلى). في PUM2 ، كانت هناك ثلاثة عناصر محفوظة في جميع الفقاريات ، بما في ذلك أيضًا UGUACAUU ، والتي تم العثور عليها في جميع التسلسلات (الشكل 4 ، أسفل). ومن المثير للاهتمام ، أن شكل UGUACAUU هذا يطابق جزئيًا إجماع PRE ، UGUANAUA ، وهو مرتبط بكل من PUM1 و PUM2 في بيانات ENCODE البشرية ، مما يشير إلى أن هذا العنصر القديم جزء من برنامج التنظيم التلقائي المعروف بوجوده في Pumilio mRNAs [21 ]. وبالتالي فإن LncLOOM قادر على تحديد العناصر المحفوظة بعمق في تسلسل 3′UTR ، بما في ذلك تلك المفصولة بـ & gt 500 مليون سنة ، حيث لا تكتشف الأدوات المتاحة حفظ تسلسل كبير.

العناصر المحفوظة في PUM1 و PUM2 3′UTRs. يظهر التسلسل البشري والزخارف المحفوظة في سبعة أنواع على الأقل مشفرة بالألوان بناءً على حفظها. تواجدات شكل UGUACAUU المحفوظة للغاية في صندوق

يكشف التحليل المنهجي للزخارف المحفوظة في 3 -UTRs عن عناصر محفوظة بعمق

من أجل تقييم القدرة التنبؤية لـ LncLOOM على نطاق واسع ، أجرينا تحليلًا شاملاً لتسلسلات 3′UTR. ركزنا على 3′UTRs محددة جيدًا بناءً على تسلسل الترميز المحفوظ للغاية الذي يحيط بها ، مما يسمح لنا ببناء مجموعة بيانات مدخلات عالية الثقة تمتد لمئات الملايين من السنين من التطور ، والتي يمكننا من خلالها دراسة آلاف العناصر بشكل منهجي باستخدام LncLOOM. استندت مجموعة البيانات الخاصة بنا إلى 2439 جينًا تحتوي على 3′UTR MSA تم إنشاؤها كجزء من مجموعة التنبؤ بالموقع المستهدف TargetScan7.2 miRNA [11]. لكل جين ، قمنا ببناء مجموعة بيانات من 3 تسلسلات UTR لتحليل LncLOOM التي تحتوي على التسلسل المحاذي من TargetScan MSA في كل نوع من الأنواع الأربعة (الإنسان ، والفأر ، والكلب ، والدجاج) ، فقط إذا كان طولها 300-3000 نانومتر. . بالنسبة للجينات التي تحتوي على العديد من الأشكال الإسوية 3′UTR ، اخترنا أطول 3′UTR. ثم أضفنا إلى مجموعة البيانات ، حيثما كان ذلك متاحًا ، تسلسل 3′UTRs المشروحة في Ensembl في الأنواع الإضافية ، إذا كانت أطول من 200 قاعدة. وشملت هذه متواليات من خمسة أنواع من الفقاريات غير السلوية (الضفدع ، وسمك القرش ، والزرد ، والغار ، ولامبري) واثنين من اللافقاريات (السيونا والذباب). نظرًا لأن هدفنا الرئيسي كان تقييم قدرة LncLOOM على تحديد العناصر المحفوظة بعمق ، فقد ركزنا فقط على الجينات التي لها تسلسل مناسب من واحد على الأقل ليس سليًا. يتم عرض أعداد التسلسلات التي يمكن تحليلها على أعماق مختلفة في الملف الإضافي 1: الشكل S5A. من بين مجموعات البيانات 2439 3′UTR ، احتوى 2117 على تسلسل واحد على الأقل لم تبلغ BLASTN عن أي محاذاة مهمة (ه القيمة & lt 0.05) للتسلسل البشري ، بينما تحتوي 2031 مجموعة بيانات على تسلسل واحد على الأقل لم يكن له محاذاة كبيرة لأي من الأنواع الأربعة (الشكل 5 أ). لذلك يمكننا تحليل عدد كبير من التسلسلات حيث كان النهج القائم على MSA غير قادر على استجواب العمق الكامل للحفظ.

تحليل عالمي للزخارف المحفوظة في 3UTRs باستخدام LncLOOM. أ عدد الجينات التي تحتوي على أعداد مختلفة من متواليات تقويم العظام التي لم يكن لها محاذاة كبيرة لتسلسلها البشري (أسود) أو متواليات الفئران والكلاب والدجاج (باللون الرمادي). ب توزيع مجموعات فريدة من نوعها ك- حفظت في عدد التسلسلات المشار إليها والتي لا تتماشى مع تسلسل الإنسان 3′UTR. ج القياس الكمي للعدد الإجمالي للفرد ك- القرون (الوردي) ومجموع حالاتهم (الأحمر الداكن) التي حددتها LncLOOM لكل نوع. يظهر العدد الإجمالي لمواقع ربط miRNA المحفوظة على نطاق واسع باللون الأخضر ، وعدد المواقع الفريدة ك-الأمراء التي تتوافق مع هذه المواقع باللون الأصفر. عدد الجينات التي تحتوي على أي كيظهر -mer باللون الرمادي ، وعدد الجينات التي تحتوي على واحد على الأقل كيظهر -mer الذي يتوافق مع موقع miRNA باللون الأسود. د الأعلى: توزيع فريد ك-القرون الذين تم تحديدهم في التسلسل الأول غير متوافقين مع الإنسان في جينات متعددة (رمادي). عدد ال ك- الكشف عن الجينات في نوع من اللافقاريات في جين واحد على الأقل يظهر باللون الأسود. القاع: فريد ك- مشتركين لما لا يقل عن 50 جينًا وتم اكتشافهم في تسلسل اللافقاريات. ك- اللون الأحمر الذي يشبه دولة الإمارات العربية المتحدة باللون الأحمر ، واللون الذي يشبه PAS باللون الأزرق ، وتلك التي تشبه PRE تكون باللون الأخضر. ه مقارنة الجينات التي تحتوي على مواقع ربط ميرنا المحفوظة على نطاق واسع والتي اكتشفها LncLOOM و TargetScan في التسلسل البشري للجينات التي تم تحليلها. F عدد ارتباطات miRNA المحفوظة على نطاق واسع والتي تم اكتشافها بواسطة LncLOOM لكل عدد من التسلسلات غير المحاذاة النسبة المئوية للجينات مع موقع miRNA الذي تم اكتشافه لكل عدد من الطبقات غير القابلة للمحاذاة (أسود) وعدد الطبقات الفريدة ك-mers المقابلة لمواقع ربط ميرنا (أصفر). ز أعلى: مواقع ربط ميرنا المحفوظة على نطاق واسع والتي تنبأ بها LncLOOM في التسلسلات البشرية. يتم عرض المواقع التي تنبأ بها TargetScan واستعادتها LncLOOM باللون الأحمر والمواقع الجديدة (لم تتنبأ بها TargetScan مسبقًا) باللون الأزرق. القاع: حفظ هذه المواقع حسب عدد الأنواع. ح مقارنة كسور الجينات بموقع ميرنا واحد على الأقل تم اكتشافه في الأنواع المشار إليها بواسطة TargetScan و LncLOOM. تم استخدام المواقع الموجودة في TargetScanHuman فقط. أنا النسبة المئوية للجينات التي تحتوي على موقع miRNA تم اكتشافه بواسطة LncLOOM لكل عدد من التسلسلات غير المحاذاة: مواقع miRNA (الحمراء) التي تم توقعها مسبقًا بواسطة TargetScan في التسلسل البشري واستعادتها LncLOOM في تسلسلات إضافية ، والتي لم تكن جزءًا من MSA المستخدم بواسطة TargetScan (الزرقاء) مواقع ميرنا الجديدة التي تنبأ بها LncLOOM ولكن لم يتم توقعها مسبقًا بواسطة TargetScan في التسلسلات البشرية

استخدمنا LncLOOM للبحث عن الزخارف المحفوظة بطول لا يقل عن 6 قواعد ومع ص & lt 0.05 في جميع اختبارات LncLOOM. اكتشف LncLOOM أكثر من 150000 نموذج مهم في التسلسل البشري ، منها 27826 (18.3 ٪) تتوافق مع موقع بذرة لعائلة ميرنا محفوظة على نطاق واسع (على النحو المحدد بواسطة TargetScan). أحد عشر ألفًا وسبعمائة وخمسة وعشرين ك- تم حفظ القرون خارج السلى ، تم اكتشاف 3897 منها في تسلسل واحد على الأقل غير قابل للمحاذاة (الشكل 5 والملف الإضافي 1: S5). اكتشف LncLOOM واحدًا فريدًا على الأقل ك-مر في أول طبقة غير قابلة للمحاذاة من 1640 من 2117 جينًا تحتوي على تسلسلات لا تتوافق مع أطباء تقويم العظام البشريين ، في حين أن مجموعات من ثلاثة على الأقل فريدة من نوعها كتم العثور على القرون في 1088 جينًا (الشكل 5 ب). عند التفكير في التسلسلات فقط التي لا تتوافق مع أي من الأنواع الأربعة التي يحيط بها السلوي ، يكون هناك نوع واحد على الأقل فريد من نوعه ك-تم اكتشاف mer في أول تسلسل غير قابل للمحاذاة في 1529 مجموعة بيانات (ملف إضافي 1: الشكل S5B). في 114 جينة ، وجدنا الحفظ وراء الفقاريات وفي 97 الحفظ على طول الطريق من الإنسان إلى ذبابة الفاكهة. ما مجموعه 170 فريدة من نوعها كتم العثور على -mers (265 حالة) في جينات الذباب ، منها اثنان فقط يتطابقان مع موقع ربط ميرنا محفوظ على نطاق واسع (الشكل 5 ج).

بعد ذلك نظرنا في حفظ محدد ك- تشارك الأمهات بين 3′UTRs من جينات متعددة. في حدود كتم اكتشاف 42 جينًا في متواليات غير قابلة للمحاذاة ، وكان 42 جينًا شائعًا لما لا يقل عن 50 جينًا منها اثنان فقط يتوافقان مع موقع ربط ميرنا محفوظ على نطاق واسع وتم حفظ 30 جينًا في متواليات اللافقاريات (الشكل 5 د). من بين هؤلاء 30 ، 18 ك- احتوى المرسلون على تسلسل UUU في سياق A / U-rich ، يشبه العناصر الغنية بالاتحاد الأفريقي (AREs) ، و 5 يحتوي على AUAA ، يشبه PASs. آخر ك-mers تحتوي على نواة UGUA تشبه PRE. وبالتالي ، غالبًا ما يتم حفظ هذه المجموعات الثلاث من العناصر غير المرتبطة بـ miRNA بعمق شديد في 3′UTRs ، ويمكن اكتشاف هذه الأحداث المحفوظة بواسطة LncLOOM.

لتقييم حساسية LncLOOM ، قمنا بمقارنة مواقع الربط الخاصة بـ miRNAs المحفوظة على نطاق واسع والتي تم تحديدها بواسطة LncLOOM لتوقعات TargetScan لكل من الجينات الـ 2439 ، في عام 2121 تنبأ TargetScan بمواقع الربط في التسلسلات البشرية. تنبأ LncLOOM بمواقع الربط في 2330 جينًا ، بما في ذلك 217 التي لم تحدد محاذاة TargetScan لها أي مواقع محفوظة على نطاق واسع (الشكل 5 هـ). يمكن العثور على ملخص لجميع مواقع miRNA التي تنبأت بها LncLOOM على https://github.com/LncLOOM/LncLOOM. في عدد كبير من الحالات (29٪ من 2117 جينًا) ، وجد LncLOOM موقع ارتباط ميرنا محفوظًا بشكل كبير في الأنواع حيث لم يكن 3′UTR متوافقًا مع التسلسل البشري في MSA (الشكل 5f). لمقارنة تنبؤات LncLOOM و TargetScan بشكل أكثر دقة ، ركزنا على 2359 جينًا توقعت TargetScan مواقع ربط لها في النسخة البشرية المتطابقة المستخدمة في تحليل LncLOOM (الشكل 5 هـ) ، ومن بينها استردت LncLOOM 90.24 ٪ من جميع المواقع المحفوظة على نطاق واسع والتي تنبأ بها TargetScan في التسلسل البشري (الشكل 5 ز). ضمن 217 جينًا ، كان لدى 42 موقعًا موقعًا محفوظًا بعيدًا عن الثدييات وفي العديد من الجينات تم العثور عليها في أنواع الأسماك وذبابة الفاكهة (ملف إضافي 1: الشكل S5D). بالإضافة إلى مواقع ميرنا التي تم استردادها ، حددت LncLOOM 26165 موقعًا محميًا على نطاق واسع لم يتم التنبؤ بها مسبقًا (الشكل 5g). عند مقارنة عمق الحفظ ، غالبًا ما اكتشف LncLOOM المواقع التي تم استردادها بواسطة TargetScan في الأنواع البعيدة (الشكل 5 ح والملف الإضافي 1: S5E). الأهم من ذلك ، تم استرداد 831 و 331 تنبؤًا جديدًا في متواليات غير قابلة للمحاذاة في 24٪ و 13٪ من الجينات على التوالي (الشكل 5i والملف الإضافي 1: S5F).

نستنتج أن LncLOOM هي أداة قوية أيضًا لتحليل تسلسل 3′UTR ، مما يكشف عن عمق أكبر في الحفاظ على miRNA أو مواقع الربط الوظيفية الأخرى أكثر مما هو ممكن من خلال النهج القائمة على MSA مع وجود حل وسط محدود فقط بشأن الحساسية.


يطور الباحثون خوارزمية لمقارنة الخلايا عبر الأنواع

الخلايا هي اللبنات الأساسية للحياة ، وهي موجودة في كل كائن حي. ولكن ما مدى تشابه خلاياك مع الماوس في رأيك؟ سمكة؟ دودة؟

يمكن أن تساعد مقارنة أنواع الخلايا في الأنواع المختلفة عبر شجرة الحياة علماء الأحياء على فهم كيفية نشوء أنواع الخلايا وكيف تكيفت مع الاحتياجات الوظيفية لأشكال الحياة المختلفة. كان هذا موضع اهتمام متزايد لعلماء الأحياء التطورية في السنوات الأخيرة لأن التكنولوجيا الجديدة تسمح الآن بتسلسل وتحديد جميع الخلايا في جميع الكائنات الحية. أوضح بو وانج ، الأستاذ المساعد في الهندسة الحيوية بجامعة ستانفورد: "هناك بشكل أساسي موجة في المجتمع العلمي لتصنيف جميع أنواع الخلايا في مجموعة متنوعة من الكائنات الحية المختلفة".

استجابة لهذه الفرصة ، طور مختبر وانغ خوارزمية لربط أنواع الخلايا المماثلة عبر مسافات تطورية. طريقتهم ، مفصلة في ورقة نشرت في 4 مايو في eLife، تم تصميمه لمقارنة أنواع الخلايا في الأنواع المختلفة.

في بحثهم ، استخدم الفريق سبعة أنواع لمقارنة 21 زوجًا مختلفًا وتمكنوا من تحديد أنواع الخلايا الموجودة في جميع الأنواع جنبًا إلى جنب مع أوجه التشابه والاختلاف بينهما.

وفقًا لألكسندر تاراشانسكي ، طالب دراسات عليا في الهندسة الحيوية يعمل في مختبر وانغ ، جاءت فكرة إنشاء الخوارزمية عندما دخل وانغ إلى المختبر يومًا ما وسأله عما إذا كان بإمكانه تحليل مجموعات البيانات من نوع الخلية من نوعين مختلفين من الديدان التي أجريت عليها الدراسات المعملية. نفس الوقت.

قال تاراشانسكي ، الذي كان مؤلفًا رئيسيًا للورقة وزميلًا متعدد التخصصات في جامعة ستانفورد بيو إكس: "لقد أدهشني مدى وضوح الاختلافات بينهما. "اعتقدنا أنه يجب أن يكون لديهم أنواع خلايا متشابهة ، ولكن عندما نحاول تحليلها باستخدام تقنيات قياسية ، فإن الطريقة لا تتعرف عليها على أنها متشابهة."

تساءل عما إذا كانت مشكلة في التقنية أو إذا كانت أنواع الخلايا مختلفة جدًا بحيث لا يمكن مطابقتها عبر الأنواع. ثم بدأ Tarashansky العمل على الخوارزمية لمطابقة أنواع الخلايا بشكل أفضل عبر الأنواع.

قال تاراشانسكي: "لنفترض أنني أريد مقارنة الإسفنج بالإنسان". "ليس من الواضح حقًا أي جين من الجينات الإسفنجية يتوافق مع أي جين بشري لأنه مع تطور الكائنات الحية ، تتكاثر الجينات وتتغير وتتكرر مرة أخرى. والآن لديك جين واحد في الإسفنج قد يكون مرتبطًا بالعديد من الجينات في البشر."

بدلاً من محاولة العثور على تطابق جيني واحد لواحد مثل الطرق السابقة لمطابقة البيانات ، فإن طريقة رسم الخرائط للباحثين تطابق الجين الواحد في الإسفنج مع جميع الجينات البشرية المقابلة المحتملة. ثم تتابع الخوارزمية لمعرفة أيهما هو الصحيح.

يقول Tarashansky إن محاولة العثور على أزواج جينية فردية فقط قد حدت من قيام العلماء بالتطلع إلى تعيين أنواع الخلايا في الماضي. "أعتقد أن الابتكار الرئيسي هنا هو أننا نأخذ في الاعتبار الميزات التي تغيرت على مدار مئات الملايين من السنين من التطور لمقارنات بعيدة المدى."

"كيف يمكننا استخدام الجينات المتطورة باستمرار للتعرف على نفس نوع الخلية التي تتغير أيضًا باستمرار في الأنواع المختلفة؟" قال وانغ ، وهو كبير مؤلفي الصحيفة. "لقد تم فهم التطور باستخدام الجينات والصفات العضوية ، أعتقد أننا الآن عند نقطة تحول مثيرة لجسر المقاييس من خلال النظر في كيفية تطور الخلايا."

ملء شجرة الحياة

باستخدام نهج رسم الخرائط ، اكتشف الفريق عددًا من الجينات المحفوظة وعائلات أنواع الخلايا عبر الأنواع.

قال Tarashansky إن أبرز ما في البحث كان عندما كانوا يقارنون الخلايا الجذعية بين نوعين مختلفين جدًا من الديدان المفلطحة.

وقال: "حقيقة أننا وجدنا تطابقًا واحدًا لواحد في مجموعات الخلايا الجذعية كانت مثيرة حقًا". "أعتقد أن هذا في الأساس قد فتح الكثير من المعلومات الجديدة والمثيرة حول كيفية ظهور الخلايا الجذعية داخل دودة طفيلية مفلطحة تصيب مئات الملايين من الناس في جميع أنحاء العالم."

تشير نتائج رسم خرائط الفريق أيضًا إلى وجود حماية قوية لخصائص الخلايا العصبية وخلايا العضلات من أنواع الحيوانات البسيطة جدًا ، مثل الإسفنج ، إلى الثدييات الأكثر تعقيدًا مثل الفئران والبشر.

قال وانغ: "هذا يشير حقًا إلى أن هذه الأنواع من الخلايا نشأت في وقت مبكر جدًا في تطور الحيوانات".

الآن بعد أن قام الفريق ببناء أداة مقارنة الخلايا ، يمكن للباحثين الاستمرار في جمع البيانات حول مجموعة متنوعة من الأنواع لتحليلها. مع جمع ومقارنة المزيد من مجموعات البيانات من المزيد من الأنواع ، سيتمكن علماء الأحياء من تتبع مسار أنواع الخلايا في الكائنات الحية المختلفة وستتحسن القدرة على التعرف على أنواع الخلايا الجديدة.

قال تاراشانسكي: "إذا كان لديك فقط إسفنج ثم ديدان وفقدت كل شيء بينهما ، فمن الصعب أن تعرف كيف تطورت أنواع الخلايا الإسفنجية أو كيف تنوع أسلافهم إلى إسفنج وديدان". "نريد ملء أكبر عدد ممكن من العقد على طول شجرة الحياة حتى نتمكن من تسهيل هذا النوع من التحليل التطوري ونقل المعرفة عبر الأنواع."


مناقشة

في هذه الدراسة ، حددنا أولاً بقايا الأحماض الأمينية المحفوظة على مستوى الأسرة ، ثم استخدمنا ثلاثة برامج متميزة للتنبؤ أولاً بالهياكل ثلاثية الأبعاد لبروتينات N و NS ، وبرنامج إضافي واحد (CONFOLD) لبروتين NSs فقط (الشكل 8) ، متبوعًا بتوطينها المحتمل. بينما يتوفر هيكل البروتينات N لبعض أعضاء النظام بونيافيراليس، لا تتوفر مثل هذه المعلومات للـ NS. استخدمنا بروتين N كمرجع لدينا للتحقق من دقة التنبؤ من قبل المصممين الثلاثة قبل استخدامها للتنبؤ بهيكل NS. يلعب كلا البروتينين دورًا مهمًا في العدوى الفيروسية والتسبب في المرض والتجمع. نماذج التنبؤ لهياكل بروتين tospoviral هي محاولة لتوفير فهم جديد للبنية الفيروسية.

نموذج تنبؤ البروتين TSWV غير الإنشائي (NSs) بناءً على طريقة تلامس البقايا ، CONFOLD: أ المجال 1 ب المجال 2

من بين أعضاء بونيافيراليس، بنية البروتين N لفيروسات orthobunyavirus La Crosse orthobunyavirus (LaCV) [33] ، بونيامويرا فيروس (BUNV) [31] ، فيروس شمالينبيرج (SBV) [32] ، فيروس Leanyer (LEAV) [70] ، فيروس نيروفير فيروس حمى القرم والكونغو النزفية (CCHFV) [71] و Phlebovirus فيروس حمى الوادي المتصدع (RVFV) [72] تم تحديدها عن طريق التبلور. من بين البروتينات الفيروسية ، تم التنبؤ بالبروتينات السكرية [34] والبروتين N لـ TSWV و GRSV من خلال التنبؤ القابل للطي [8 ، 35] ، ولكن حتى الآن تم تحديد بنية البروتين N فقط من TSWV عن طريق التبلور [36،37،38] .

Soundararajan et al. [34] ذكرت نموذجًا نظريًا للبروتين السكري TSWV (Gن/ زج) باستخدام I-TASSER ، وحصلت على نموذج قابل للطي من Gن وجج بدرجة C - 2.73 و - 0.93 على التوالي. تم استنتاج أن التنظيم الهيكلي للبروتين السكري للمغلف يمكن أن يكون العامل الأساسي في التسبب فيج اعتقال في ER. أيضًا ، أشارت دراسة تفاعل البروتين والبروتين إلى أن المنطقة الطرفية C لـ Gن ضروري للاحتفاظ Golgi و dimerization من Gن إلى Gج.

كومودا وآخرون [36 ، 37] تبلور بروتين TSWV N المعبر عنه جرثوميًا. لي وآخرون. [8] قام ببناء نموذج تجانس ثلاثي الأبعاد لبروتين TSWV N باستخدام I-TASSER. كان النموذج يتألف من N-arm ، و N-terminal domain ، و C-terminal domain ، و C-arm ، حيث شكلت المجالات N و C-terminal بنية أساسية. أشارت بياناتهم إلى أن الأحماض الأمينية R 94 / R 95 و K 183 / Y 184 مهمة لربط N بـ RNA وتم تعيين تلك الأحماض الأمينية على شق سطحي مشحون للهيكل ثلاثي الأبعاد لنموذج التماثل N. في دراستنا ، تم حفظ R 95 بين جميع الأنواع الـ 31 من الجنس Tospovirus وكان موجودًا بشكل ثابت في حلزون α بواسطة جميع النماذج الثلاثة بالاتفاق مع الهياكل التي أبلغ عنها Komoda et al. [37] وجو وآخرون. [38]. ومن المثير للاهتمام أن Guo et al. [38] وجد في تركيبها المتبلور أن R 95 مهم لطي البروتين وربط الحمض النووي الريبي.

في دراستنا ، استخدمنا أشهر مصممي النماذج الثلاثة المتاحين: I-TASSER و MULTICOM و ROSETTA للتنبؤ بالبنى الثالثة. يستخدم المصممون الثلاثة طرقًا مختلفة لبناء النموذج ، وبالتالي اختار كل منهم بروتينًا مختلفًا لفيروس بونيا إن كقالب. كان نمط الطي الذي تم الحصول عليه للنماذج الثلاثة متشابهًا مع بعضها البعض ، وكان يتألف من شكل قلب كروي يحتوي على صفحتين β و 12 إلى 17 α-helix ، وسلسلتان نهائيتان تقابلان طرفي N و C المكشوفين على سطح البروتين. بصريًا ، تتفق توقعاتنا مع توقعات Li et al. [8]. بالإضافة إلى ذلك ، باستخدام صانع المطابقات المتراكب ، وجدنا اتفاقًا بين نموذجنا الأول I-TASSER مع تلك الموجودة في Komoda et al. [37] وجو وآخرون. [38] (ملف إضافي 4: الشكل S3). تشترك منطقة الأخدود الرئيسية في هيكل مماثل ، ولكن هناك اختلافات قابلة للطي في N- و C-termini في جميع الطرز الثلاثة. تنبؤات Komoda et al. [37] وجو وآخرون.[38] اختلف كل منهما عن الآخر في عدد صفائح بيتا و alpha helix ، بينما Komoda et al. قدم 4 و 12 ، وجو وآخرون. أظهر 2 و 13 ، على التوالي. تنبؤنا I-TASSER ، أوراق β الموجودة في بقايا F 72 T 73 F 74 و I 77 T 78 I 79 تتوافق مع تلك الموجودة في Guo et al. ، والأوراق β # 2 و # 4 من Komoda et al. مثل Guo et al. الدولة ، كان هيكلها أكثر توافقًا مع هيكل Komoda et al. ، مع بعض الاختلافات في الأسلحة. تم تحديد كلا الهيكلين بناءً على بلورات بوليمرية ، وبناء حلقة غير متماثلة من ثلاثة بروتومرات. عندما تم استخراج البروتومرات المفردة من ملفات PDB متعددة القوالب لمقارنتها بتنبؤنا ، كان لبنية Komoda بقايا إضافية من 21 حمضًا أمينيًا من ناقل التعبير في الطرف N ، بينما تفتقر بنية Guo إلى بعض البقايا: اثنان من البقايا (M 1 و S 2) عند الطرف N ، والمخلفات من K 19 إلى E 25 في الذراع N. بالإضافة إلى ذلك ، يقدم كلا الهيكلين طفرة ألانين في البقايا T 255 لإعطاء الاستقرار للبلورة. يمكن أن يختلف هذا الاختلاف من بروتومر إلى آخر في نفس الهياكل الثلاثية. النموذج المتراكب للسلسلة أ من كومودا وآخرون. [37] وجو وآخرون. [38] سمح لنا التنبؤ بتصور هذه الاختلافات ، ولكنه يمكن أن يساعد أيضًا في شرح الاختلاف في N-arm من جميع النماذج (ملف إضافي 4: الشكل S3). نموذجنا المتوقع ، بناءً على نهج الخيوط ، اختار عشوائيًا النماذج الأكثر تشابهًا ، عندما لم تكن الهياكل البلورية لـ TSWV N متاحة. لحسن الحظ ، أتاح لنا توفير هذه الهياكل مؤخرًا في قاعدة البيانات ، اختبار دقة نماذجنا. ساعدتنا هذه المصادفة في الحصول على مزيد من الثقة في النماذج المتوقعة باستخدام أساليب مماثلة لبروتين NSs.

في البداية ، استخدمنا نفس النهج للتنبؤ بالبنية ثلاثية الأبعاد لبروتين TSWV NSs. ومع ذلك ، لم يكن هناك بروتين مماثل تبلور من أي فيروس بالترتيب بونيافيراليس. اختار جميع المصممين قوالب وأساليب مختلفة للتنبؤ. في هذه الحالة ، فقط توقع ROSETTA كان مختلفًا عن توقع I-TASSER و MULTICOM. إن بروتين NSs ، وهو مثبط للدفاع عن النبات المضيف ، هو عضو في عائلة بروتين pfam03231 Bunya-NS-S2 وقد ثبت أنه يتداخل مع استجابة دفاع المضيف (الحيوان والإنسان والنبات). من المثير للاهتمام أن I-TASSER استخدم البروتين 3CM9 ، وهو عنصر مركزي في مناعة الغشاء المخاطي البشري ، كأحد النماذج الخاصة بـ NSs في تنبؤات الخيوط المجمعة (الشكل 7).

لم تظهر النماذج العليا التي تنبأت بها كل طريقة أي تشابه بين التنبؤات من الخوادم الثلاثة ، مما يجعل النماذج المتوقعة غير موثوقة لتعيين أي أهمية بيولوجية. ومن ثم ، لجأنا إلى خيارات أخرى للتنبؤ بهيكل بروتين NSs واستخدمنا التنبؤ بالهيكل الموجه بالتلامس لبناء نماذج ثلاثية الأبعاد تستخدم اتصالات البقايا المتوقعة.

تتوفر نماذج ثلاثية الأبعاد لإسكات البروتينات المثبطة المرتبطة بـ siRNA استنادًا إلى البنية البلورية لفيروسات النبات ، مثل p19 of فيروس القرنفل الإيطالي (CIRV) [39] ص 19 من فيروس حيلة شجيرة الطماطم (TBSV) [40] و p2b من فيروس نقص الطماطم (تاف) [41]. الصفحة 21 من فيروس البنجر الأصفر (BYV-كلوستيروفيروس) تم بلورة مجالات الربط وتحديدها [73]. ومع ذلك ، بالنسبة للفيروسات الأخرى ، لم يتم بلورة بروتين مثبط الإسكات بعد ، وبالتالي تم استخدام التنبؤ في السيليكو لتحديد هيكلها. كوستا وآخرون. [74] وجد أن p23 ، أحد البروتينات الكابتة الثلاثة للإسكات فيروس تريستيزا الحمضيات (CTV) ، كان قادرًا على قمع مؤقت محلي ولكن ليس إسكات المدى القصير. لقد توقعوا بنية نموذجية ثلاثية الأبعاد لبروتين p23 باستخدام مصمم نماذج I-TASSER ، والذي أظهر اختلافات داخل منطقة إصبع Zn بين العزلات. نظرًا لأن p23 لم يتبلور بعد ، فقد ساعد التنبؤ في دعم الدراسات الوظيفية للبروتين.

دي روند وآخرون. [19] وجد في TSWV أن طفرة حمض أميني واحدة في Gدبليو/ WG motif (الموضع 17/18) أدى إلى خلل في NSs لنشاط RSS و Avr مما يشير إلى تفاعل مفترض مع Argonaute 1 (AGO1). Hedil et al. [14] قد تلعب بقايا W17A / G18A المؤكدة دورًا مهمًا في قدرة NSs على التدخل في مسار إسكات الحمض النووي الريبي (RNA) إلى مزيد من التكوُّن الحيوي لعزل siRNA في اتجاه المصب وعزله. تم حفظ G 18 في TSWV بين جميع أنواع الجنس البالغ عددها 27 نوعًا Tospovirus وكان الحمض الأميني الوحيد الموجود باستمرار في منطقة الملف في جميع الطرق الأربعة المستخدمة للتنبؤ بنموذج NSs ثلاثي الأبعاد. تشاي وآخرون. [21] وجد أن البقايا K 182 و L 413 في الزخارف ، GKV / T (181-183) و YL (412-413) ، في بروتين NSs ضرورية لنشاط كبت البروتين. بناءً على دراستنا ، تم حفظ G 181 و Y 412 في جميع أنحاء الأسرة ، لكن موقعهما في الهيكل الثالث لم يكن ثابتًا في الملف أو اللولب أو الصفائح β.

في حالة فيروس بقع البطيخ الفضي (WSMV) ، هوانغ وآخرون. [20] أظهر أن الطفرات عند H 113 في الحاتمة المشتركة (CE) (109 KFTMHNQ 117) و Y 398 في شكل الورقة C الطرفية (397 IYFL 400) تؤثر على استقرار NSs mRNA ، واستقرار البروتين ، على التوالي ، و خلص إلى أن كلاهما مهم لإسكات نشاط القامع لـ NS. يتوافق H 113 من WSMV مع H 115 في تسلسل TSWV ويتم حفظه أيضًا في جميع أنواع الجنس. كان هذا الأحماض الأمينية في منطقة الملف في ثلاثة من النماذج وفي ورقة β في نموذج ROSETTA. حقيقة أن البقايا المختارة التي تم تحديدها في هذه الدراسة تم حفظها عبر Tospovirus يشير الجنس إلى أنها يمكن أن تكون مهمة وظيفيًا لبروتينات N و NSs. وبالتالي يمكن أن تكون هذه المناطق في جينات N و NS أهدافًا محتملة لاستراتيجيات جديدة لقمع الفيروسات.

بالنظر إلى القيود المفروضة على الطي الهيكلي لبروتين كبير (NSs) ، وبسبب الدرجات المنخفضة ، في هذا الوقت من الزمن ، لا يمكننا القول بدرجة عالية من الثقة أن التنبؤات الخاصة ببروتين NSs ليست عشوائية. أعاقت جهودنا للتحقق و / أو التحقق من صحة التنبؤ بسبب عدم وجود هياكل بروتينات NSs محددة عن طريق التبلور لأي فيروسات مسببة معروفة أو أعضاء في النظام. بونيافيراليس يمكننا استخدامها للمقارنة. علاوة على ذلك ، نحن مقيدون بحقيقة أن البروتينات المعروفة التي لها نشاط مثبط لإسكات الفيروسات الأخرى لم تشارك أي تماثل قابل للطي يمكننا استخدامه كقالب أو للتحقق من صحة نماذجنا.

يمكن أن يوفر تجاور المخلفات المحفوظة رؤى حول التفاعلات المحتملة بين المخلفات. في حالة بروتين NSs ، لم يكن هناك نمط ثابت فيما يتعلق بالتوطين المشترك للبقايا المحفوظة. يجب تمييز التفاعلات البينية والداخلية بين البقايا المحفوظة المختلفة وفيما بينها لتحديد ثبات البروتين والبقايا المحتملة المشاركة في وظائف البروتين إما في تحليل السيليكو أو في المختبر. بينما Li et al. [8] استخدمنا I-TASSER لطي التنبؤ بالبروتين N ، واستخدمنا مصممي نماذج مستقلين إضافيين ، ROSETTA و MULTICOM لتعزيز صرامة التنبؤات. يمكن لـ CONFOLD إنشاء نماذج قابلة للمقارنة مع تلك التي تم إنشاؤها بواسطة أحدث الأدوات مثل ROSETTA و FRAGFOLD. ومع ذلك ، نظرًا لعدم وجود قالب دقيق ، لا يمكن استخدام CONFOLD لإنشاء نموذج غير عشوائي. نظرًا لعدم وجود متجانسات هيكلية متاحة حاليًا يمكن استخدامها لنمذجة التماثل ، فإن النتائج التي تنتجها منصات النمذجة المختلفة لم تكن متطابقة وتنتظر عملية التحقق من صحة البيانات توافر بيانات التبلور للـ NS. في حين أنه من المهم تقييم الجودة الكيميائية المجسمة للنماذج الهيكلية التي تم الحصول عليها ومقارنتها بجودة هياكل الأشعة السينية التي تم استخدامها كقالب ، فقد أعيق هذا الجهد مرة أخرى بسبب عدم وجود نتيجة "جيدة" للقالب. من شأن توافر استنساخ معدي أن يسهل علم الوراثة العكسية لاختبار ، والتحقق ، والتحقق من الدور (الأدوار) المحتملة لبعض هذه المخلفات المحفوظة فيما يتعلق بموقعها النسبي في الشكل الثالث للبروتين. ومع ذلك ، فإن نظام علم الوراثة العكسي ليس متاحًا بعد لأي فيروس tospovirus. يمكن أن يكون التنبؤ بالنموذج ثلاثي الأبعاد أداة قيمة عندما تكون هناك قيود في الترتيب البيولوجي مثل عدم وجود نظام وراثي عكسي أو عدم وجود هياكل متبلورة ، متماثلة تقريبًا مع الاستعلام.

البقايا المحددة في البروتين N ، M 1 ، F 32 ، F 34 ، T 92 ، R 95 ، R 101 ، L 132 ، A 167 و L 219 ، وفي بروتين NSs ، M 1 ، G 18 ، D 28 ، يتم حفظ Y 30 و H 115 و G 181 و R 211 و I 338 و T 399 و Y 412 على مستوى الجنس وبعضها معروف بالفعل بلعب أدوار مهمة في وظائف البروتينات. يمكن استخدام مواقع mRNA للمخلفات ، على سبيل المثال ، R 95 ، في بروتين N كهدف من خلال نهج RNAi ويمكن استهداف البقايا المحددة في الطرف الأميني والكربوكسي للبروتين N على مستوى البروتين.

هذا هو التقرير الأول لتوطين المخلفات المحفوظة على مستوى الجنس في بروتينات N و NSs وتحديد السمات الهيكلية لـ NSs لأي فيروس tospovirus من خلال طرق التنبؤ بالطي والتلامس المتبقي. سيؤدي تحديد بنية بروتينية موثوقة إلى تحديد المناطق الحرجة التي يمكن أن تكون عرضة للنُهج المستهدفة لطرق مكافحة الفيروسات الجديدة. يجب إجراء دراسات الديناميكيات الجزيئية من أجل فهم أفضل للتفاعلات بين النماذج المختلفة.


محتويات

في اتجاه نسخ حبلا القالب ، تسلسل الإجماع ، أو الترتيب المحسوب للمخلفات الأكثر شيوعًا ، بالنسبة لمربع CAAT كان 3'-TG ATTGG (T / C) (T / C) (A / G) - 5 '. يشير استخدام الأقواس إلى وجود أي من القاعدتين ، ولكن لم يتم تحديد الترددات النسبية لهما. على سبيل المثال ، "(T / C)" تعني أنه يتم اختيار الثايمين أو السيتوزين بشكل تفضيلي. [3] داخل ميتازوا (مملكة الحيوانات) ، يحتفظ مركب عامل الارتباط الأساسي (CBF) -DNA بدرجة عالية من الحفظ ضمن نموذج الربط CCAAT ، بالإضافة إلى التسلسلات التي تحيط بهذا الشكل الخماسي. يختلف شكل CCAAT في النباتات (تم استخدام السبانخ في تجربة) اختلافًا طفيفًا عن الميتازوا من حيث أنه في الواقع نموذج ربط CAAT ، حيث يفتقر المروج إلى أحد بقايا C من الشكل الخماسي ، والإضافة الاصطناعية لـ C الثانية لا تحتوي على تأثيرات كبيرة على نشاط الربط. تفتقر بعض التسلسلات إلى مربع CAAT تمامًا. ثانيًا ، لا تتطابق النيوكليوتيدات المحيطة في النباتات مع تسلسل الإجماع أعلاه الذي حدده Bi وآخرون. [4]

صندوق CAAT هو ما يُعرف باسم المحفز الأساسي ، والمعروف أيضًا باسم المحفز الأساسي أو ببساطة المحفز ، وهو منطقة من الحمض النووي تبدأ في نسخ جين معين. تقع هذه المنطقة ، على وجه الخصوص بالنسبة لصندوق CAAT ، على حوالي 60-100 قاعدة في المنبع (نحو النهاية 5 ') ، ولكن ما لا يقل عن 27 زوجًا أساسيًا بعيدًا ، عن موقع النسخ الأولي أو جين حقيقيات النوى الذي يوجد فيه مجمع عام ترتبط عوامل النسخ بـ RNA polymerase II قبل بدء النسخ. [5] [6] من الضروري للنسخ أن تكون عوامل الارتباط الأساسية هذه (يشار إليها أيضًا باسم العامل النووي Y أو NF-Y) قادرة على الارتباط بعنصر CCAAT. أظهرت التجارب في العديد من المختبرات أن الطفرات في نموذج CCAAT التي تسبب فقدان ارتباط CBF تقلل أيضًا من نشاط النسخ في هذه المروجين ، مما يشير إلى أن مجمعات CBF-CCAAT ضرورية لنشاط النسخ الأمثل. [3]

في تجربة تم إجراؤها باستخدام عوامل الربط الأساسية (CBF) ومجمعات الحمض النووي ، تمكن الباحثون من تحديد التسلسلات التفضيلية للمروج في منطقة فوق مربع CAAT ومجاور له مباشرةً ، ومنطقتين على جانبي مربع CAAT. باستخدام عملية اختيار الربط العشوائي بوساطة PCR ، كان الباحثون قادرين على إظهار أن التسلسل "3 '- (T / C) G ATTGG (T / C) (T / C) (A / G) - 5" "يحيط فورًا تم اختيار منطقة ATTGG (CCAAT في الشريط التكميلي) بشكل تفضيلي على حبلا الترميز (عكس حبلا القالب). [3] [7] [8] تم توضيح ذلك باستخدام تسلسل قليل النوكليوتيد (R1) الذي يحتوي على 27 نيوكليوتيد عشوائي ، محاطًا بتسلسل محدد من 20 نيوكليوتيد على كل جانب. بينما لم يتم اختيار نوكليوتيد مفرد في كل استنساخ على جانبي شكل ATTGG (CCAAT في الخيط التكميلي) ، كان هناك العديد من النيوكليوتيدات في المواضع المختارة بتردد عالٍ. كان أبرز ما في التسلسل أعلاه هو البقايا G نحو نهاية 5 'من ATTGG. كانت المخلفات الأخرى المدرجة ملحوظة أيضًا ، ولكن هناك انقسام بين اثنين من البقايا. أسفرت هذه التجربة نفسها أيضًا عن نفس التسلسل كما هو موضح أعلاه عند استخدام أليغنوكليوتيد مختلف (R2) يحتوي على نواة ATTGG ويحيط به 12 5 نيوكليوتيدات عشوائية و 10 3 نيوكليوتيدات عشوائية. هذان التسلسلان متشابهان للغاية وتم تأكيدهما في تجارب متعددة. بالنسبة للتسلسلات التي أحاطت بعنصر ATTGG مع اثنين من بقايا الأدينين (AA) على نهايتها 5 'و G (A / G) في نهايتها 3' ، يبدو أنها حالت دون تكوين مركب CBF-DNA وحدث لاحقًا في 1٪ فقط من تسلسل المروج. [3] في تجربة أخرى أجريت مع المروج المتأخر الرئيسي (MLP) للفيروسات الغدية من مجموعة متنوعة من الأنواع المضيفة ، تبين أن طفرة صندوق CAAT وتسلسل CCAAT ، والتي يعتقد أنها تلعب دورًا محوريًا في (MLP). ) من المجموعة الفرعية C فيروسات غدية بشرية ، في الأنواع ذات تسلسل CAAT ناقص. تم تقليل بدء النسخ في أنواع MLP الطافرة بشكل كبير مقارنةً بالنوع أو الأنواع البرية التي يوجد بها طفرة CAAT. يتوافق الفشل في استعادة فيروسات الغدة الدرقية التي تعمل بشكل طبيعي ، والتي يظهرها مربع CAAT ، مع فكرة أن صندوق CAAT يلعب دورًا حيويًا في MLP الفيروس الغدي ويفضل على عناصر النسخ الأخرى. [9]

تتكون عوامل الارتباط الأساسية هذه ، أو العوامل النووية (NF-Y) ، من ثلاث وحدات فرعية - NF-YA و NF-YB و NF-YC. بينما في الحيوانات يتم ترميز كل وحدة فرعية NF-Y بواسطة جين واحد ، كان هناك تنوع في النباتات في كل من التركيب والوظيفة. تتكون عائلات NF-Y من ثمانية إلى 39 عضوًا لكل وحدة فرعية. سبب كبير لهذا التنويع هو بسبب ازدواج الجينات والازدواج الترادفي ، مما ساعد في المساهمة في أحجام الأسرة الأكبر لـ NF-Y مقارنة بالعوامل النووية الحيوانية المشفرة. [10] تحتوي كل وحدة فرعية على جزء محفوظ تطوريًا - الطرف C لـ NF-YA ، والجزء المركزي من NF-YB ، والمحطة N من NF-YC ، يظل أكثر من 70٪ من هذه الأنواع عبر الأنواع محفوظة. ومع ذلك ، لا يتم الحفاظ على المناطق المجاورة بشكل عام. [6]

تحرير الوحدة الفرعية NF-YA

تقوم عائلة NF-YA بترميز عوامل النسخ المتغيرة في الطول (بين 207-347 من الأحماض الأمينية من أجل م. truncatula). تتميز بروتينات NF-YA عمومًا بنطاقين محفوظين بقوة في جميع حقيقيات النوى الأعلى التي تم فحصها حتى الآن. يحتوي المجال الأول (A1) على 20 من الأحماض الأمينية التي تشكل حلزون ألفا يبدو مهمًا في تفاعلاته مع NF-YB و NF-YC. المجال الثاني (A2) مجاور للمجال A1 بواسطة تسلسل رابط محفوظ عبارة عن سلسلة من 21 حمض أميني حيوي في الحمض النووي المحدد لربط صندوق CCAAT. يتم حفظ المجالات A1 ​​و A2 تجاه الطرف C للثدييات ، ولكنها تحتل منطقة مركزية أكثر في الوحدات الفرعية للنبات NF-YA. في النباتات ، تطورت الوحدة الفرعية NF-YA لتنظيم تطور عضو جذري اختياري موجود فقط في النباتات البقولية ويظهر أنه يتم التعبير عنه في أنسجة الجذر. ثبت أن له خصائص تشبه مقاومة الجفاف ، وأصبح منظمًا أثناء إجهاد الجفاف في جذور وأوراق أرابيدوبسيس. أظهرت طفرات NF-YA فقدان الوظيفة وفرط الحساسية للظروف الشبيهة بالجفاف ، وعلى النقيض من ذلك ، أدى الإفراط في التعبير عن NF-YA إلى مقاومة الجفاف. [10]

تحرير الوحدة الفرعية NF-YB

عائلة NF-YB تشبه الوحدة الفرعية NF-YA ، متغيرة الطول ، ومع ذلك ، في المتوسط ​​أصغر بكثير من الوحدة الفرعية NF-YA (90-240 من الأحماض الأمينية في "M. truncatula"). لقد تم تمييزها بتركيب وتكوين حمض أميني مشابه لعزر طية الهيستون (HFM). يتكون هذا من ثلاثة حلزونات ألفا مفصولة بنطاقين من حلقات بيتا. على غرار NF-YA ، فقد ثبت أن NF-YB يعمل أيضًا على تحسين مقاومة الجفاف عند الإفراط في التعبير وكذلك الترويج للإزهار في أرابيدوبسيس. [10]

تحرير الوحدة الفرعية NF-YC

بروتينات NF-YC هي حجم متوسط ​​بين بروتينات NF-YA و NF-YB (117-292 حمض أميني في م. truncatula) وتحتوي أيضًا على HFM السائد في بروتينات NF-YB. لقد ثبت أيضًا أنه متورط في وقت الإزهار في بعض النباتات (يؤدي الإفراط في التعبير إلى الإزهار المبكر) حيث يتم تنظيم تأثيره من خلال ارتباط البروتين CONSTANS (CO) بالوحدة الفرعية NF-YC. [10]

مجمعات NF-Y تحرير

نظرًا للتغير التطوري في جينات ترميز NF-Y في النباتات ، فقد أصبح لديهم لاحقًا مجموعة كبيرة من المجمعات الثلاثية المحتملة. على سبيل المثال ، في أرابيدوبسيس، تم تحديد 36 وحدة فرعية لعامل النسخ NF-Y (بما في ذلك 10 NF-YA و 13 NF-YB و 13 وحدة فرعية NF-YC) والتي يمكن أن تشكل نظريًا 1690 مجمعًا فريدًا (والتي تحتوي على واحد من كل نوع من الوحدات الفرعية). هذا الرقم ، بالطبع ، أعلى مما يحدث بالفعل لأن بعض الوحدات الفرعية لها أنماط ربط محددة. أظهرت التحليلات الوظيفية على جينات ترميز NF-Y في النباتات ، نتيجة لتنويعها التطوري بالنسبة لنظيراتها من الحيوانات ، اكتساب وظائف محددة متنوعة ، مثل تطور الجنين ، والتحكم في وقت الإزهار ، وإجهاد ER ، وإجهاد الجفاف ، والعقيدات. وتطوير الجذر. قد يكون هذا جزءًا صغيرًا فقط من قدراتهم ، نظرًا لأن عدد التركيبات النظرية لمجمعات NF-Y كبير جدًا ويمكن إنشاء جزء صغير فقط (تم تأكيد أقل من 10 ٪ من جميع التفاعلات الممكنة في كلا الاتجاهين في الخميرة ). [10]

جانب آخر لعزر الربط CCAAT هو بروتينات ربط CCAAT / المحسن (C / EBPs). إنها مجموعة من عوامل النسخ المكونة من 6 أعضاء (α-ζ) ، وهي محفوظة بدرجة عالية وترتبط بعنصر CCAAT. في حين أن البحث عن هذه البروتينات الملزمة حديث نسبيًا ، فقد ثبت أن وظيفتها تلعب دورًا حيويًا في تكاثر الخلايا وتمايزها ، والتمثيل الغذائي ، والالتهاب ، والمناعة في خلايا مختلفة ، ولكن على وجه التحديد خلايا الكبد ، والخلايا الدهنية ، والخلايا المكونة للدم. [11] على سبيل المثال ، في الخلايا الشحمية ، ظهر هذا في مجموعة متنوعة من التجارب مع الفئران: كان التعبير خارج الرحم عن C / EBPs (C / EBPα و C / EBPβ) قادرًا على بدء برامج التمايز للخلية ، حتى في عدم وجود هرمونات شحمية ، أو تمايز الخلايا الدهنية إلى الخلايا الشحمية (أو الخلايا الدهنية). بالإضافة إلى ذلك ، تؤدي وفرة هذه C / EBPs (على وجه التحديد ، C / EBPδ) إلى استجابة متسارعة. علاوة على ذلك ، في الخلايا التي تفتقر إلى C / EBP أو في الفئران التي تعاني من نقص C / EBP ، كلاهما غير قادرين على الخضوع لتكوين الشحم. ينتج عن هذا موت الفئران بسبب نقص السكر في الدم ، أو انخفاض تراكم الدهون في الأنسجة الدهنية.[12] تتبع C / EBPs مجال سحاب أساسي عام (bZIP) في الطرف C وتكون قادرة على تكوين ثنائيات مع C / EBPs الأخرى أو عوامل النسخ الأخرى. يسمح هذا dimerization لـ C / EBPs بالارتباط على وجه التحديد بالحمض النووي من خلال تسلسل متناوب في الأخدود الرئيسي للحمض النووي. يتم تنظيمها من خلال وسائل مختلفة ، بما في ذلك الهرمونات والميتوجينات والسيتوكينات والعناصر الغذائية وعوامل مختلفة أخرى. [11]


كيف تجد المخلفات المحفوظة عبر الأنواع؟ - مادة الاحياء

عندما نقارن ما نعرفه عن السرطان لدى البشر ، وحتى في الكلاب والقطط ، غالبًا ما يعمل الأطباء البيطريون للحيوانات الغريبة في الظلام. مرضانا يستحقون الأفضل.

  • البحث والتعاون مطلوب. يجب أن يتحد الباحثون والأطباء للعثور على الأسباب الشائعة للسرطان في جميع الأنواع. ستساعدنا هذه النظرة الشاملة على فهم أفضل لنماذج السرطان المختلفة وطرق علاج كل من السرطانات البشرية والحيوانية.
  • لن يتحسن علاج السرطان البيطري إلا بالمعرفة المتقدمة. إن مجال علم الأورام للأنواع الغريبة هو حقًا في مهده. إن بيولوجيا السرطان الأساسية ، وبروتوكولات العلاج ، والاستجابة للعلاج ، والمعلومات الإنذارية والتخطيط التشخيصي غير ممثلة حاليًا في أبحاث السرطان.
  • يمكن للبحوث البشرية أن تنفع جنسنا البشري. قلة من الناس يدركون أن العديد من التطورات في أبحاث السرطان البشرية قد تم من خلال دراسة الفيروسات المسببة للسرطان في الأنواع الأخرى. تحدث العديد من التغييرات الجينية الأساسية التي تسبب السرطان في الجينات المحفوظة بشكل كبير عبر مجموعة واسعة من الأنواع.

عالم كامل من بيولوجيا السرطان ينتظر في الأنواع الغريبة والحيوانية المصاحبة. يمكننا دائمًا تحقيق المزيد عندما نعمل معًا.


ستترك البرنامج مجهزًا بمجموعة واسعة من المهارات. تتضمن مهارات بيولوجيا الحفظ والبيئة التي ستتوجه إليها في حياتك المهنية فهم بيئة الموائل المختلفة ، وعلم وظائف الأعضاء الحيوانية والنباتية ، وعلم البيئة السلوكية وبيولوجيا السكان.

سيقوم بعض الطلاب بالتحقيق في أسباب تدهور النظام البيئي والاستمرار في استخدام المبادئ البيئية لإعادة تهيئة الظروف المرغوبة في النظم البيئية المتأثرة. تقوم مختبرات الواقع الافتراضي لدينا بإعدادك لإجراء بحث بيولوجي في معمل حقيقي.


لعبة كمبيوتر تجعلك عالمًا وراثيًا

لإعادة مراجعة هذه المقالة ، قم بزيارة ملفي الشخصي ، ثم اعرض القصص المحفوظة.

لإعادة مراجعة هذه المقالة ، قم بزيارة ملفي الشخصي ، ثم اعرض القصص المحفوظة.

تسخر لعبة جديدة عبر الإنترنت القوة الحسابية للأدمغة الخاملة للمساعدة في فك رموز أصول الأمراض الوراثية.

تقف اللعبة ، المسماة Phylo ، على أكتاف عمالقة العلوم الذين يعملون على التعهيد الجماعي مثل لعبة طي البروتين Foldit وقوة التعرف على الأجسام السماوية Galaxy Zoo. يستفيد كل مشروع من براعة البشر في التعرف على الأنماط ، وهو شيء تشتهر به أجهزة الكمبيوتر.

& quot؛ هناك بعض المهام التي يمكن للبشر القيام بها بشكل أفضل من أجهزة الكمبيوتر ، مثل حل الألغاز ، & quot ؛ قال خبير المعلوماتية الحيوية جيروم فالديسبول من جامعة ماكجيل ، أحد قادة مشروع Phylo & # x27s. تم إطلاق اللعبة رسميًا في 29 نوفمبر.

يقوم لاعبو Phylo بتحريك المربعات الملونة التي تمثل النيوكليوتيدات الأربعة للحمض النووي للعثور على أفضل محاذاة بين قصاصات الحمض النووي من نوعين مختلفين. تحدد هذه الأقسام المعينة من الحمض النووي ، والتي تسمى مناطق المحفز ، أي أجزاء من الجينوم ينتهي بها الأمر كسمات في الكائن الحي ، سواء كانت العيون الزرقاء أو أمراض القلب.

يمكن أن تساعد معرفة مكان اصطفاف الجينات عبر الأنواع علماء الأحياء في تحديد مصادر الاضطرابات الوراثية.

& quot إذا تم الحفاظ على بعض المناطق عبر جميع الأنواع بعد المحاذاة ، فمن المحتمل أن تكون قد تم الحفاظ عليها لسبب محدد للغاية ، على حد قول Waldispuhl. & quot؛ يجب أن نكون قادرين على تقديم فهم أفضل للسبب الذي من المحتمل أن تؤدي الطفرة إلى حدوث مرض ، أو سبب ظهور هذا المرض. & quot

على عكس Foldit أو Galaxy Zoo ، فإن العلم في Phylo مخفي جيدًا. إنها تبدو وكأنها لعبة ألغاز مجردة ، بأشكال ملونة وموسيقى جاز. يقول فالدسبول إن ذلك كان متعمدًا.

& quot؛ لا نريد أن نقتصر فقط على الأشخاص المهتمين بالعلوم & quot؛ قال. ويقول إن المهوسون بالعلوم لن يحتاجوا إلى نفس القدر من الإقناع للعب لعبة تساعد البحث على المضي قدمًا. يريد مطورو Phylo أن تجذب اللعبة الأشخاص الذين قد يلعبون Farmville.

& quot؛ إذا لم يكن & # x27s ممتعًا ، فلن يلعبه الناس & quot؛ قال فالديسبول. & quot ؛ أردنا مقايضة جيدة بين ما & # x27s متعة ، وما & # x27s المعلومات المثيرة للاهتمام في العلوم. لذلك عندما نقدم اللعبة على الويب ، لن يفكر الأشخاص & # x27t في المشكلة البيولوجية ، لكنهم استمتعوا واستمتعوا بالترفيه. & quot

يأمل الفريق في صنع نسخ من اللعبة للهواتف الذكية والأجهزة اللوحية ، وفي النهاية دمجها في مواقع التواصل الاجتماعي مثل Facebook. تحتوي اللعبة بالفعل على صفحتها الخاصة على Facebook ، حيث يمكنك ترك تعليقات.

& quot؛ الطريقة الوحيدة لتحسينه للمجتمع هي طرحه للمجتمع وفتحه للتعليقات من جميع أنحاء العالم ، & quot؛ قال فالديسبول.


شاهد الفيديو: Waste Sorting Song. Clean Up Trash. How to Recycle? Environmental Songs for Kids. JunyTony (يونيو 2022).


تعليقات:

  1. Nechten

    أهنئ ، ما هي الكلمات الضرورية .. ، فكر رائع

  2. Cairbre

    انا أنضم. يحدث ذلك. يمكننا التواصل حول هذا الموضوع. هنا أو في PM.

  3. Vudodal

    نعم إنه دقيق

  4. Samuk

    أي موضوع جيد

  5. Kigakazahn

    أعرف موقعًا مع إجابات على موضوع يثير اهتمامك.

  6. Sterling

    منحت ، هذه فكرة رائعة

  7. Modraed

    فيه كل النعمة!



اكتب رسالة