معلومة

الجمع بين بيانات التعبير الجيني من نوعين

الجمع بين بيانات التعبير الجيني من نوعين



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي حاليًا مجموعتان من بيانات التعبير الجيني. الأول عبارة عن إطار بيانات للجينات المحددة بواسطة أرقام CG لمعرف التعليق التوضيحي (على سبيل المثال "CG10005") في عمود واحد ومتغير رقمي ذي أهمية مرتبط بكل من هذه الجينات في الآخر (الجزء المهم هو أن الجينات يتم تحديدها بواسطة رقم CG). مجموعة البيانات الثانية هي هذه الدراسة من عدة أنواع حيث يتم تحديد الجينات بواسطة معرف "GLEANR" مثل هذا: "dsim_GLEANR_10060".

أرغب في استخراج جميع القيم من هذه الدراسة لبيانات D.melanogaster و D.simulans ، ثم ربط ذلك بمعرف التعليق التوضيحي في مجموعة البيانات الأولى (لربط متغير اهتمامي بالتحيز الجنسي في التعبير لكل نوع ). المشكلة التي أواجهها هي توصيل الجينات المتعامدة في الدراسة الثانية ببعضها البعض ، ثم ربطها بمعرفات CG في الدراسة الأولى.

هل لدى أي شخص أي اقتراحات بشأن الموارد التي يمكن استخدامها لتوصيل كل هذا؟


هذه هي صفحة FlyBase لجين المثال: Dsim GD10095. هناك ، لديك قسم "أطباء تقويم العظام" ، والذي يرتبط بـ OrthoDB. لذا اقتراحي هو: العثور على قائمة المرادفات لـ D. simulans على FlyBase (ربما هنا؟) ، قم بتنزيل قسم Drosophila من OrthoDB ، وأخيراً ابحث عن أخصائي تقويم العظام 1: 1.


يمكنك أيضًا استخدام biomart لهذه الأغراض.

انقر فوق علامة التبويب "ID Converter" في قسم "الأدوات" (على اليسار).


الجمع بين بيانات التعبير الجيني من نوعين - علم الأحياء

البيانات الضخمة في علم النسخ وعلم الأحياء الجزيئي

مقدمة:

تتيح التطورات التكنولوجية الحديثة تحديد معدلات إنتاجية عالية للأنظمة البيولوجية على المستوى الجزيئي بطريقة فعالة من حيث التكلفة. تقودنا التكلفة المنخفضة نسبيًا لتوليد البيانات اليوم إلى "عصر البيانات البيولوجية الضخمة". يوفر توفر مجموعات البيانات الضخمة هذه فرصًا غير مسبوقة ولكنه يثير أيضًا تحديات جديدة لاستخراج البيانات والتحليل العميق والتحليل التكاملي عبر طبقات "-omics" بيولوجية مختلفة.
في صفحة الويب هذه ، نقدم منشورات مختلفة ونقدم مفاهيم أساسية في تحليل "البيانات الضخمة" ، مع التركيز على تحسين التعبير الجيني أو الإنتاجية العالية "-omics". يتضمن ذلك مناهج المعلوماتية الحيوية القائمة على خوارزميات "التعلم الآلي" بالإضافة إلى أمثلة "غير خاضعة للإشراف" و "خاضعة للإشراف" لكل منها.
علاوة على ذلك ، نشير إلى نقاط الضعف في مناهج البيانات الضخمة الخالصة مع التركيز بشكل خاص على البيولوجيا والطب ، والتي تفشل في تقديم حسابات مفاهيمية للعمليات التي يتم تطبيقها عليها (البيانات الضخمة تحتاج إلى نظرية كبيرة أيضًا!).

الهدف النهائي هو ربط جميع المعلومات الجزيئية وترجمتها مرة أخرى من "البيانات الضخمة" إلى استنتاجات ذات مغزى في الطب الدقيق أو بيولوجيا الأنظمة أو علم وظائف الأعضاء الجزيئي أو الفيزيولوجيا المرضية.

  • ترسم مجموعات البيانات البيولوجية الكبيرة خريطة لشبكات الحياة - تقدم أنظمة omics المتعددة طريقة جديدة لممارسة علم الأحياء
  • البيانات الضخمة - الفلكية أم الجينومية؟
  • البيانات الضخمة في علم الأحياء والطب
  • Trans-Omics - كيفية إعادة بناء الشبكات البيوكيميائية عبر طبقات متعددة & # 8216Omic & # 8217
  • المعلوماتية الحيوية للبيانات الضخمة
  • استنتاج شبكات تنظيم التعبير الجيني من قياسات عالية الإنتاجية
  • دراسة النسخ أحادية الخلية كبيانات كبيرة
  • الجيل القادم من المعلوماتية للبيانات الضخمة في عصر الطب الدقيق
  • دمج التنميط النصي والبروتيوم: الإستراتيجيات والتطبيقات
  • الطب الدقيق ، الطب الشخصي ، Omics والبيانات الضخمة - المفاهيم والعلاقات
  • طرق دمج البيانات للكشف عن تفاعلات النمط الجيني والنمط الظاهري
  • ! ! ! البيانات الضخمة تحتاج إلى نظرية كبيرة أيضًا! ! !
  • بيانات التعبير - مورد عام لمجموعات البيانات المنسقة عالية الجودة التي تمثل التعبير الجيني عبر علم التشريح والتنمية والظروف التجريبية
  • ARMADA - استخدام ديناميكيات النشاط الحافز لاستنتاج شبكات تنظيم الجينات من بيانات التعبير الجيني
  • من تحليل البيانات الضخمة إلى الطب المخصص للجميع: التحديات والفرص
  • التنميط الطويل لتعبير RNA غير المشفر في لوحة خط الخلايا السرطانية NCI60 باستخدام RT-qPCR عالي الإنتاجية
  • تشخيص علامة النسخ باستخدام البيانات الضخمة
  • يوفر التنميط العالمي لأحداث الربط البديلة للحمض النووي الريبي نظرة ثاقبة للاختلافات الجزيئية بين أنواع مختلفة من سرطان الخلايا الكبدية
  • الحديث المتبادل miRNA-miRNA: من علم الجينوم إلى علم الظواهر
  • الشبكات التنظيمية لما بعد النسخ: من تعريف التعبير إلى التحليل التكاملي لبيانات mRNA و MicroRNA
  • نحو فهم تطور شبكات تنظيم الجينات الفقارية: الجينوم المقارن والنهج اللاجينومية
  • تشريح دقيق لالتقاط الليزر: بيانات كبيرة من عينات صغيرة.
  • العمارة التنظيمية العالمية لنسخة أنسجة الإنسان والفأر والجرذان.

كانت جينات Michael Snyder & # 8217s تخبره أنه قد يكون في خطر متزايد للإصابة بمرض السكري من النوع 2. لم يكن عالم الوراثة بجامعة ستانفورد قلقًا: لقد شعر بصحة جيدة ولم يكن لديه تاريخ عائلي للإصابة بالمرض. ولكن بينما كان يراقب جوانب أخرى من بياناته البيولوجية على مدى شهور وسنوات ، رأى أن مرض السكري بدأ بالفعل في الظهور ، على الرغم من أنه لم تظهر عليه أي أعراض.
توضح قصة Snyder & # 8217s قوة النظر إلى ما وراء الجينوم ، الكتالوج الكامل للكائن الحي والمعلومات الوراثية # 8217s. حكايته تحول الجينوم & # 8217s ذات البعد الواحد إلى منظور متعدد الأبعاد. من نواح كثيرة ، يشبه الجينوم خريطة ورقية للعالم. تُظهر تلك الخريطة أماكن وجود المدن. لكنه لا يقول أي شيء عن الدول التي تتاجر مع بعضها البعض ، أو البلدات التي لديها منافسات شرسة في كرة القدم ، أو الدول التي ستتأرجح لمرشح سياسي معين.
افتح إحدى الخرائط الرقمية اليوم & # 8217s ، ومع ذلك ، فإن العديد من مصادر البيانات المتراكبة توفر مجموعة كبيرة من المعلومات التفصيلية في الوقت الفعلي. ببضع نقرات ، يمكن لخرائط Google إظهار كيفية عبور بوسطن في ساعة الذروة ، وتقديم طرق بديلة حول الأزمات المرورية وإخبارك بمكان التقاط البيتزا في الطريق.
الآن ، علماء مثل سنايدر يطورون نفس هذه الأنواع من الأدوات للبيولوجيا ، مع عواقب بعيدة المدى. لمعرفة ما يحدث & # 8217s بالفعل داخل الكائن الحي & # 8212 أو داخل عضو أو خلية معينة & # 8212 يربط الباحثون الجينوم ببيانات واسعة النطاق حول ناتج تلك الجينات في أوقات محددة ، في أماكن محددة ، استجابةً لضغوط بيئية محددة.
بينما يظل الجينوم مستقرًا في الغالب بمرور الوقت ، تتغير & # 8220omes & # 8221 الأخرى بناءً على الجينات التي يتم تشغيلها وإيقافها في لحظات معينة في أماكن معينة من الجسم. يعد البروتين (جميع بروتينات الكائن الحي والبروتينات # 8217s) والمستقلب (جميع المستقلبات ، أو الجزيئات الصغيرة التي تمثل نواتج العمليات البيولوجية) مجموعتين من مجموعات البيانات القوية العديدة التي تصبح أكثر إفادة عند استخدامها معًا في نهج متعدد الاتجاهات. يوضحون كيف يتم تطبيق دليل التعليمات الجينومية هذا بالفعل.
& # 8220 الجينوم يخبرك بما يمكن أن يحدث ، & # 8221 يقول أوليفر فين ، عالم الكيمياء الحيوية في جامعة كاليفورنيا ، ديفيس. يمكن للبروتيوم والمستقلب إظهار ما يحدث بالفعل. ومثلما يستخدم مخططو المدن بيانات حول أنماط حركة المرور لمعرفة مكان توسيع الطرق وكيفية توقيت إشارات المرور ، يمكن لعلماء الأحياء استخدام تلك الشبكات المتشابكة للتنبؤ على المستوى الجزيئي بكيفية استجابة الكائنات الحية الفردية في ظل ظروف معينة.
من خلال ربط هذه الطبقات وغيرها من أجل التوسع من علم الجينوم إلى متعدد omics ، قد يكون العلماء قادرين على تحقيق أهداف الطب الشخصي: لمعرفة ، على سبيل المثال ، العلاج الذي سيستجيب له مريض سرطان معين بشكل أفضل ، بناءً على ديناميكيات الشبكة مسؤول عن ورم. أو توقع ما إذا كان اللقاح التجريبي سيعمل قبل الانتقال إلى الاختبارات السريرية باهظة الثمن. أو مساعدة المحاصيل على النمو بشكل أفضل أثناء الجفاف. وعلى الرغم من أن العديد من هذه التطبيقات لا تزال في المستقبل ، فإن الباحثين يضعون الأساس الآن. & # 8220 علم الأحياء يتم إجراؤه بطريقة لم يتم القيام بها من قبل & # 8217s ، & # 8221 يقول نيتين باليجا ، مدير معهد بيولوجيا الأنظمة في سياتل. البيانات الضخمة - الفلكية أم الجينومية؟
ستيفنس زد دي ، لي سي ، فاجري إف ، كامبل آر إتش ، تشاي سي ، إيفرون إم جي ، آيير آر ، شاتز إم سي ، سينها إس ، روبنسون جي إي
بلوس بيول. 2015 يوليو 713 (7): e1002195 - eCollection 2015

علم الجينوم هو علم بيانات ضخم وسيزداد حجمه في القريب العاجل ، لكن من غير المعروف ما إذا كانت احتياجات الجينوم ستتجاوز مجالات البيانات الضخمة الأخرى. مع الأخذ في الاعتبار عام 2025 ، قمنا بمقارنة علم الجينوم مع ثلاثة مصادر رئيسية أخرى للبيانات الضخمة: علم الفلك ، ويوتيوب ، وتويتر. تُظهر تقديراتنا أن علم الجينوم هو "وحش رباعي الرؤوس" - فهو إما على قدم المساواة مع المجالات التي تم تحليلها هنا أو الأكثر تطلبًا من حيث الحصول على البيانات وتخزينها وتوزيعها وتحليلها. نناقش جوانب التقنيات الجديدة التي ستحتاج إلى تطوير للارتقاء ومواجهة التحديات الحسابية التي يطرحها علم الجينوم في المستقبل القريب. لقد حان الوقت الآن للتخطيط المنسق على مستوى المجتمع المحلي للتحديات "الجينومية" للعقد القادم. البيانات الضخمة في علم الأحياء والطب.
O. P. Trifonova، V. A. Ilin، E. V. Kolker، A. V. Lisitsa
بناءً على مادة من ورشة عمل مشتركة مع ممثلين دوليين
تحالف علوم الحياة المعزز بالبيانات ، 4 يوليو 2013 ، موسكو ، روسيا
أكتا ناتورال 2013 5 3 (18): 13

تم تحديد مهمة استخراج المعرفة الجديدة من مجموعات البيانات الكبيرة بواسطة المصطلح & # 8220Big Data. & # 8221 لتوضيح الأمر ببساطة ، فإن ظاهرة البيانات الكبيرة هي عندما لا يمكن استيراد نتائج تجاربك إلى ملف Excel. يقدر حجم محادثات Twitter على مدار العام بعدة أوامر من حيث الحجم أكبر من حجم ذاكرة الشخص # 8217s المتراكمة طوال حياته / حياتها. بالمقارنة مع Twitter ، فإن جميع البيانات الموجودة على الجينوم البشري تشكل كمية صغيرة بشكل مهم [1]. تمثل مشكلة تحويل مجموعات البيانات إلى المعرفة التي أثارتها المعاهد الوطنية الأمريكية للصحة في عام 2013 مجال الاهتمام الأساسي لتحالف علوم الحياة المعزز بالبيانات (DELSA ، www.delsaglobal.org) [2]. لماذا خلقت قضايا جمع البيانات الضخمة بمساعدة الكمبيوتر حوافز لتشكيل مجتمع DELSA ، والذي يضم أكثر من 80 باحثًا رائدًا على مستوى العالم يركزون على مجالات الطب والرعاية الصحية وعلوم المعلومات التطبيقية؟ تمت مناقشة هذا الاتجاه الجديد من قبل المشاركين في ورشة العمل & # 8220Convergent Technologies: البيانات الضخمة في علم الأحياء والطب. & # 8221


المعلوماتية الحيوية للبيانات الضخمة.
غرين سي إس ، تان جيه ، أونج م ، مور ج إتش ، تشينج سي
J خلية فيسيول. 2014 ديسمبر 229 (12): 1896-1900

تتيح التطورات التكنولوجية الحديثة تحديد سمات الإنتاجية العالية للأنظمة البيولوجية بطريقة فعالة من حيث التكلفة. تقودنا التكلفة المنخفضة لتوليد البيانات إلى عصر "البيانات الضخمة". يوفر توفر البيانات الضخمة فرصًا غير مسبوقة ولكنه يثير أيضًا تحديات جديدة لاستخراج البيانات وتحليلها. في هذه المراجعة ، نقدم مفاهيم أساسية في تحليل البيانات الضخمة ، بما في ذلك خوارزميات "التعلم الآلي" بالإضافة إلى أمثلة "غير خاضعة للإشراف" و "خاضعة للإشراف" لكل منها. نلاحظ حزم لغة البرمجة R المتوفرة لإجراء تحليلات التعلم الآلي. بالإضافة إلى الحلول القائمة على البرمجة ، نقوم بمراجعة خوادم الويب التي تتيح للمستخدمين ذوي الخلفية البرمجية المحدودة أو بدون خلفية برمجة لإجراء هذه التحليلات على مجموعات بيانات كبيرة.
استنتاج شبكات تنظيم التعبير الجيني من قياسات عالية الإنتاجية.
زافولان م
أساليب. 2015 سبتمبر 185: 1-2

في حين أن البيولوجيا الجزيئية قد نجحت في بناء كتالوج المكونات لعدد كبير من أنواع الخلايا ، فقد وسعت التطورات التكنولوجية الحديثة نطاق تقنيات القياس واستبانةها. وقد أدى ذلك إلى ازدهار عدد من الحقول الفرعية ، بما في ذلك علم الأحياء الرياضي ، وعلم الأحياء الحسابي ، وبيولوجيا الأنظمة ، والبيولوجيا التركيبية ، وما إلى ذلك. على الرغم من إمكانية مناقشة التعريفات الدقيقة والحدود لهذه الحقول الفرعية المتداخلة جزئيًا ، فمن الواضح أن التوافر العام لـ أدت الأساليب عالية الإنتاجية لزيادة الدقة الكمية إلى تحويل التركيز بعيدًا عن المكونات الفردية نحو النمذجة الكمية لسلوك الخلية الكاملة. كانت الرؤية من وراء هذا المجلد هي توضيح بعض هذه الأساليب والأفكار التي قدموها إلى الميدان. ركزنا على التعبير الجيني ، والذي يعد في الخلايا حقيقية النواة عملية معقدة للغاية من العديد من الخطوات ، وكلها تخضع للتنظيم. نأمل أن يجد القراء هذا المنظور محفزًا. أنا ممتن للمؤلفين المساهمين الذين شاركوا في هذا المسعى ، وللدكتور أدولف على دعوتهم لتحرير مثل هذا العدد ، ولتيفاني هيكس وليز ويشار على مساعدتهم الكبيرة في رؤية المشروع حتى اكتماله. دراسة النسخ أحادية الخلية كبيانات كبيرة.
يو بي ولين دبليو
علم الجينوم علم البروتينات المعلوماتية الحيوية. 2016 14 فبراير (1): 21-30

يتطلب النمو السريع لدراسات تسلسل الحمض النووي الريبي أحادية الخلية (scRNA-seq) تخزين البيانات ومعالجتها وتحليلها بكفاءة. توفر تقنية البيانات الكبيرة إطارًا يسهل الاكتشاف الشامل للإشارات البيولوجية من مجموعات بيانات scRNA-seq المشتركة بين المؤسسات. تتم مناقشة استراتيجيات حل إشارة النسخ أحادية الخلية العشوائية وغير المتجانسة في هذه المقالة. بعد إجراء مراجعة مكثفة لتطبيقات البيانات الضخمة المتاحة للدراسات القائمة على تسلسل الجيل التالي (NGS) ، نقترح سير عمل يراعي الخصائص الفريدة لبيانات تسلسل scRNA والأهداف الأساسية للدراسات أحادية الخلية.
الجيل القادم من المعلوماتية للبيانات الضخمة في عصر الطب الدقيق.
تشانغ واي ، تشو س ، ليو ح
الحد الأدنى من البيانات الحيوية 2015 8:34 - eCollection 2015

أدى ظهور علم الأحياء كثيف البيانات ، والتقدم في تكنولوجيا المعلوماتية ، والتغيرات في طريقة تقديم الرعاية الصحية إلى خلق فرصة مقنعة للسماح لنا بالتحقيق في الأسئلة الطبية الحيوية في سياق "البيانات الضخمة" وتطوير أنظمة المعرفة لدعم الطب الدقيق. لتعزيز هذا التنقيب عن البيانات وتطوير تكنولوجيا المعلومات في الطب الدقيق ، استضفنا ورشتي عمل دوليتين للمعلوماتية في عام 2014: 1) ورشة العمل الأولى حول التنقيب عن البيانات في المعلوماتية الطبية الحيوية والرعاية الصحية ، بالتزامن مع مؤتمر المحيط الهادئ الآسيوي الثامن عشر حول اكتشاف المعرفة والبيانات. التعدين (PAKDD 2014) ، و 2) ورشة العمل الأولى حول المعلوماتية الطبية الحيوية والسريرية الانتقالية ، بالتزامن مع المؤتمر الدولي الثامن لبيولوجيا الأنظمة والمؤتمر الانتقالي للمعلومات الحيوية (ISB / TBC 2014). يقدم هذا العدد المواضيعي من BioData Mining سلسلة من الأوراق المختارة من هاتين الورشتين الدوليتين ، بهدف تلبية احتياجات استخراج البيانات في مجال المعلوماتية بسبب طوفان "البيانات الضخمة" الناتجة عن الجيل التالي من التقنيات الحيوية مثل تسلسل الجيل التالي ، وعلم الأيض. ، والبروتيوميات ، وكذلك البيانات الطبية الحيوية وبيانات الرعاية الصحية المنظمة وغير المهيكلة من السجلات الصحية الإلكترونية. نحن ممتنون لاستعداد BioData Mining لإنتاج هذه القضية المواضيعية التطلعية.
دمج التنميط النصي والبروتيوم: الإستراتيجيات والتطبيقات.
كومار د ، بانسال جي ، نارانج أ ، باساك تي ، عباس تي ، داش د
البروتيوميات. 2016 16 (19): 2533-2544

يعد اكتشاف توقيع التعبير الجيني المرتبط بالحالة الخلوية أحد المهام الأساسية في غالبية الدراسات البيولوجية. بالنسبة لمعظم المظاهر السريرية والخلوية ، يمكن عرض هذه الاختلافات الجزيئية عبر طبقات متعددة من تنظيم الجينات مثل الاختلافات الجينية والتعبير الجيني وترجمة البروتين والتعديلات اللاحقة للترجمة. هذه الاختلافات على مستوى النظام ديناميكية بطبيعتها ، كما أن الحديث المتبادل معقد للغاية ، وبالتالي فإن تحليلها بشكل منفصل قد لا يكون مفيدًا للغاية. هذا يستلزم التحليل التكاملي لمثل هذه الطبقات المتعددة من المعلومات لفهم التفاعل بين المكونات الفردية للنظام البيولوجي. جعلت التطورات الأخيرة في تسلسل الحمض النووي الريبي عالي الإنتاجية وتقنيات قياس الطيف الكتلي (MS) لفحص النصوص والبروتينات هذه الأساليب المفضلة لفهم التنظيم الجيني العالمي. بعد ذلك ، تمكّن التحسينات في تقنيات تحليل "البيانات الكبيرة" من استخلاص استنتاجات جديدة من التحليل البروتيني النسبي التكاملي. كانت التحليلات الموحدة لكلا النوعين من البيانات مجزية للعديد من الأهداف البيولوجية مثل تحسين شرح الجينوم ، والتنبؤ بكميات بروتين الحمض النووي الريبي ، وفك رموز اللوائح الجينية ، واكتشاف علامات المرض والأهداف الدوائية. هناك طرق مختلفة يمكن من خلالها دمج بيانات النسخ والبروتيوميات بهدف تحقيق أهداف بحثية مختلفة. هنا ، نقوم بمراجعة مختلف الدراسات والأساليب والأدوات الحسابية المستهدفة للتحليل التكاملي لهاتين الطريقتين عاليتي الإنتاجية من أساليب omics.
الطب الدقيق ، الطب الشخصي ، Omics والبيانات الضخمة - المفاهيم والعلاقات.
شياوهوا دوغلاس تشانغ
J فارماكوجينوميكس فارماكوبروتيوميكس 2015 ، 6: 2

في 20 كانون الثاني (يناير) 2015 ، أعلن الرئيس الأمريكي أوباما في خطابه عن حالة الاتحاد لعام 2015 أنه كان يطلق مبادرة جديدة للطب الدقيق [1]. في 30 يناير ، كشفت إدارة أوباما النقاب عن تفاصيل حول مبادرة الطب الدقيق. تم إطلاق مبادرة الطب الدقيق باستثمار 215 مليون دولار في ميزانية رئيس الولايات المتحدة & # 8217s لعام 2016 ، وستكون رائدة في نموذج جديد للبحوث المدعومة بالمريض والتي تساعد في النهاية على تقديم العلاج المناسب للمريض المناسب في الوقت المناسب [2]. في 11 مارس 2015 ، أفيد أن الصين تخطط لاستثمار 60 مليار يوان (ما يقرب من 10 مليارات دولار) في الطب الدقيق (20 مليارًا من الحكومة المركزية و 40 مليارًا المتبقية من الحكومات والشركات المحلية) قبل عام 2030 [3] . إذن ، ما هو الطب الدقيق؟ كيف ترتبط بمصطلحات أخرى مثل الطب الشخصي و omics (خاصة علم الصيدلة الجينومي و Pharmacoproteomics)؟ في هذه المقالة ، أشرح المفاهيم وعلاقاتها.
طرق دمج البيانات للكشف عن تفاعلات النمط الجيني والنمط الظاهري.


غالبًا ما تُستخدم مجموعات البيانات المرجعية للمقارنة أو تفسير أو التحقق من البيانات التجريبية والأساليب التحليلية. في مجال التعبير الجيني ، تم نشر العديد من مجموعات البيانات المرجعية. عادةً ما تتكون من تجارب أساسية فردية أو تجارب سريعة يتم إجراؤها في مختبر واحد وتمثل مجموعة معينة من الشروط. هنا ، نصف نوعًا جديدًا من مجموعات البيانات الموحدة الممثلة للأبعاد المكانية والزمانية للتعبير الجيني. إنها ناتجة عن دمج بيانات التعبير من عدد كبير من التجارب العامة التي تم تطبيعها عالميًا ومراقبة الجودة. يتم تجميع بيانات التعبير عن طريق الجزء التشريحي أو مرحلة التطوير لإنتاج نسخة تمثيلية لكل فئة.على سبيل المثال ، أنشأنا مجموعة بيانات تعبيرية على مستوى الجينوم تمثل لوحة أنسجة إدارة الغذاء والدواء عبر 35 نوعًا من الأنسجة. تم إنشاء مجموعات البيانات المقترحة للإنسان والعديد من الكائنات الحية النموذجية وهي متاحة للجمهور على www.expressiondata.org
ARMADA - استخدام ديناميكيات النشاط الحافز لاستنتاج شبكات تنظيم الجينات من بيانات التعبير الجيني.
Pemberton-Ross PJ ، Pachkov M ، van Nimwegen E
أساليب. 2015 سبتمبر 185: 62-74

يظل تحليل بيانات التعبير الجيني أحد أكثر السبل الواعدة لإعادة بناء شبكات تنظيم الجينات على مستوى الجينوم. ومع ذلك ، فإن الأبعاد الكبيرة للمشكلة تحظر ملاءمة النماذج الديناميكية الصريحة لشبكات تنظيم الجينات ، في حين أن طرق التعلم الآلي لتقليل الأبعاد مثل التجميع أو تحليل المكون الرئيسي تفشل عادةً في تقديم تفسيرات آلية للأوصاف المختصرة. لمعالجة هذا الأمر ، قمنا مؤخرًا بتطوير منهجية عامة تسمى تحليل استجابة النشاط الحافز (MARA) والتي من خلال نمذجة أنماط التعبير الجيني من حيث أنشطة المنظمين الملموسين ، تحقق تقليلًا كبيرًا في الأبعاد مع الاحتفاظ بالتفسيرات البيولوجية الآلية لتوقعاتها (Balwierz ، 2014 ). هنا نوسع مارا من خلال تقديم ARMADA ، الذي يصوغ ديناميكيات نشاط المنظمين عبر دورة زمنية ، ويستنتج التفاعلات السببية بين المنظمين الذين يقودون ديناميكيات أنشطتهم عبر الزمن. لقد قمنا بتنفيذ ARMADA كجزء من خادم الويب ISMARA الخاص بنا ، ismara.unibas.ch ، مما يسمح لأي باحث بتطبيقه تلقائيًا على أي دورة زمنية للتعبير الجيني. لتوضيح الطريقة ، نطبق ARMADA على مسار زمني للخلايا البطانية للوريد السري البشري المعالجة بـ TNF. بشكل ملحوظ ، ARMADA قادر على إعادة إنتاج ديناميكيات نشاط الحافز المرصودة المعقدة باستخدام مجموعة صغيرة نسبيًا من التفاعلات بين المنظمين الرئيسيين في هذا النظام. بالإضافة إلى ذلك ، نظهر أن ARMADA استنتجت بنجاح العديد من التفاعلات التنظيمية الرئيسية المعروفة لتحريك هذه الاستجابة الالتهابية ومناقشة العديد من التفاعلات الجديدة التي يتوقعها ARMADA. بالاقتران مع ISMARA ، يوفر ARMADA نهجًا قويًا لتوليد فرضيات معقولة للتفاعلات الرئيسية بين المنظمين الذين يتحكمون في التعبير الجيني في أي نظام تتوفر فيه قياسات الدورة الزمنية.
من تحليل البيانات الضخمة إلى الطب المخصص للجميع: التحديات والفرص.
الياس أ ، توركوت م ، مير د
علم الجينوم BMC Med. 2015 8:33

أدت التطورات الحديثة في التقنيات عالية الإنتاجية إلى ظهور بيولوجيا الأنظمة كعلم شامل لتحقيق نمذجة أكثر دقة للأمراض المعقدة. يتوقع الكثيرون ظهور الطب الشخصي في المستقبل القريب. ومع ذلك ، فإننا ننتقل من الأنظمة الصحية ذات المستويين إلى الطب الشخصي ذي المستويين. تقتصر مرافق Omics على المناطق الغنية ، ومن المرجح أن يوسع الطب الشخصي الفجوة المتزايدة في النظم الصحية بين البلدان المرتفعة والمنخفضة الدخل. ينعكس هذا في تأخر متزايد بين قدرتنا على توليد وتحليل البيانات الضخمة. تؤدي العديد من الاختناقات إلى إبطاء الانتقال من الطب التقليدي إلى الطب الشخصي: توليد تعليم مختلط عالي التكلفة وفعال من حيث التكلفة وتخزين بيانات الفرق متعددة التخصصات ومعالجة تكامل البيانات وتفسيرها والأهمية الاقتصادية الفردية والعالمية. توفر هذه المراجعة تحديثًا للتطورات المهمة في تحليل البيانات الضخمة والاستراتيجيات المستقبلية لتسريع الانتقال العالمي إلى الطب الشخصي. التنميط الطويل لتعبير RNA غير المشفر في لوحة خط الخلايا السرطانية NCI60 باستخدام RT-qPCR عالي الإنتاجية.
ف مستداغ ، ليفيفر إس ، فولدرز بيجاي ، ديرفو إس ، هيلمانز ي ، فانديسومبيلي ي
بيانات العلوم. 2016 يوليو 3: 160052

تشكل RNAs الطويلة غير المشفرة (lncRNAs) فئة جديدة من جزيئات الحمض النووي الريبي المتورطة في جوانب مختلفة من تنظيم التعبير الجيني لترميز البروتين. لدراسة lncRNAs في السرطان ، أنشأنا ملفات تعريف تعبيرية لـ 1707 lncRNAs بشرية في لوحة خط الخلايا السرطانية NCI60 باستخدام منصة nanowell RT-qPCR عالية الإنتاجية. نحن نصف كيف تم تصميم فحوصات qPCR والتحقق من صحتها وتوفير بيانات تعبير تمت معالجتها وتوحيدها لمزيد من التحليل. يتم إثبات جودة البيانات من خلال مطابقة ملفات تعريف تعبير lncRNA مع الخصائص المظهرية والجينومية لخطوط الخلايا السرطانية. يمكن دمج مجموعة البيانات هذه مع مجموعات البيانات الدوائية و omics المتاحة للجمهور للكشف عن الارتباطات الجديدة بين تعبير lncRNA وتعبير mRNA ، أو تعبير miRNA ، أو رقم نسخة الحمض النووي ، أو حالة طفرة جينات ترميز البروتين أو الاستجابة للأدوية.

تتحدى بيانات omics الكبيرة المعلوماتية الحيوية الترجمية بطريقة غير مسبوقة بسبب تعقيداتها وأحجامها. تعد كيفية استخدام بيانات omics الكبيرة لتحقيق تشخيص سريري منافس للأمراض القابلة للتكاثر من نهج الأنظمة مشكلة ملحة يجب حلها في المعلوماتية الحيوية الترجمية والتعلم الآلي. في هذه الدراسة ، يقترح المؤلفون تشخيصًا جديدًا لعلامة النسخ لمعالجة هذه المشكلة باستخدام بيانات RNA-seq كبيرة من خلال عرض النسخة الكاملة كعلامة ملف تعريف بشكل منهجي. لا يتجنب تشخيص الأنظمة مشكلة التكاثر لطرق التشخيص القائمة على الجينات / الشبكة فحسب ، بل يحقق أيضًا نتائج التشخيص الإكلينيكي المتنافسة عن طريق استخراج الإشارات الحقيقية من بيانات تسلسل الحمض النووي الريبي الكبيرة. تُظهر طريقتهم ملاءمة أفضل للتشخيصات الشخصية من خلال تحقيق أداء تشخيصي استثنائي عبر استخدام معلومات الأنظمة بدلاً من أساليبها التنافسية وتعد نفسها كمرشح جيد للاستخدام السريري. على حد علمهم ، هذه هي الدراسة الأولى حول هذا الموضوع وستلهم المزيد من التحقيقات في تشخيصات بيانات omics الكبيرة.
يوفر التنميط العالمي لأحداث الربط البديلة للحمض النووي الريبي نظرة ثاقبة للاختلافات الجزيئية بين أنواع مختلفة من سرطان الخلايا الكبدية.
Tremblay MP و Armero VE و Allaire A و Boudreault S و Martenon-Brodeur C و Durand M و Lapointe E و Thibault P و Tremblay-L & eacutetourneau M و Perreault JP و Scott MS و Bisaillon M
علم الجينوم BMC. 2016 2617: 683

الخلفية: ارتبط خلل التنظيم في أنماط التضفير البديلة (AS) بالعديد من الأمراض البشرية بما في ذلك السرطان. في هذه الدراسة ، تم التحقيق في التعديلات التي طرأت على مشهد ربط الحمض النووي الريبي العالمي للجينات الخلوية في شاشة واسعة النطاق من 377 عينة من أنسجة الكبد باستخدام بيانات تسلسل الحمض النووي الريبي عالية الإنتاجية.
النتائج: تحدد دراستنا التعديلات في أنماط AS للنصوص المشفرة بأكثر من 2500 جين مثل الجينات المثبطة للورم وعوامل النسخ والكينازات. توفر هذه النتائج نظرة ثاقبة للاختلافات الجزيئية بين أنواع مختلفة من سرطان الخلايا الكبدية (HCC). سمح تحليلنا بتحديد 761 نصًا فريدًا يتم تنظيم AS بشكل خاطئ في HBV المرتبط بـ HCC ، بينما 68 فريدًا لـ HCC المرتبط بـ HCV ، و 54 لـ HBV و ampHCV المرتبط بـ HCC ، و 299 إلى HCC الخالي من الفيروسات. علاوة على ذلك ، نوضح أن نمط التعبير عن عامل ربط الحمض النووي الريبي hnRNPC في أنسجة سرطان الكبد (HCC) يرتبط بشكل كبير ببقاء المريض. نظهر أيضًا أن التعبير عن بروتين HBx من HBV يؤدي إلى تعديلات في ملامح AS للجينات الخلوية. أخيرًا ، باستخدام تداخل الحمض النووي الريبي ومنصة فحص النسخ العكسي لـ PCR ، قمنا بفحص الآثار المترتبة على البروتينات الخلوية المشاركة في الربط بين النصوص المشاركة في موت الخلايا المبرمج وإظهار المساهمة المحتملة لهذه البروتينات في التحكم في AS.
الاستنتاجات: تقدم هذه الدراسة أول صورة شاملة للتغيرات العالمية في توقيعات الربط RNA التي تحدث في سرطان الخلايا الكبدية. علاوة على ذلك ، سمحت لنا هذه البيانات بتحديد التوقيعات الفريدة للجينات التي يُساء تنظيم AS لها في الأنواع المختلفة من سرطان الكبد.

الحديث المتبادل miRNA-miRNA - من علم الجينوم إلى علم الظواهر.
Xu J ، Shao T ، Ding N ، Li Y ، Li X
موجز Bioinform. 2016 أغسطس 21

أدى اكتشاف microRNA (miRNA) - تداخل ميرنا إلى تحسين فهمنا بشكل كبير لشبكات تنظيم الجينات المعقدة في الظروف الفسيولوجية الطبيعية والخاصة بالمرض. تم اقتراح العديد من الأساليب لنمذجة شبكات miRNA-miRNA بناءً على التسلسلات الجينية ، وتنظيم miRNA-mRNA ، والمعلومات الوظيفية والظواهر وحدها ، أو عن طريق دمج البيانات غير المتجانسة. بالإضافة إلى ذلك ، من المتوقع إعادة برمجة الحديث المتبادل لـ miRNA-miRNA في أنسجة مختلفة أو أمراض معينة. وبالتالي ، تم أيضًا دمج بيانات النسخ لإنشاء شبكات miRNA-miRNA خاصة بالسياق. في هذه المراجعة ، نلخص أحدث أساليب نمذجة شبكة miRNA-miRNA ، والتي تتراوح من علم الجينوم إلى علم الظواهر ، حيث نركز على الحاجة إلى دمج أنواع غير متجانسة من بيانات omics. أخيرًا ، نقترح اتجاهات مستقبلية لدراسات الحديث المتبادل حول الحمض النووي الريبي غير المشفر. يقدم هذا التلخيص والمناقشة الشاملان الموضحان في هذا العمل رؤى بناءة في الحديث المتبادل لـ miRNA-miRNA.
الشبكات التنظيمية لما بعد النسخ: من تعريف التعبير إلى التحليل التكاملي لبيانات mRNA و MicroRNA.
سوانهيلد يو ماير ، وكاثرينا ستويكر ، وستيفن ساس ، وفابيان جيه. تيس ، ومايكل دبليو بفافل
الفصل 15 في PCR الكمي في الوقت الحقيقي: الطرق والبروتوكولات (طرق في البيولوجيا الجزيئية)
بقلم روبرتو بياسوني ، أليساندرو راسو

تشريح دقيق لالتقاط الليزر: بيانات كبيرة من عينات صغيرة.
داتا إس ، مالهوترا إل ، ديكرسون آر ، تشافي إس ، سين سي كيه ، روي إس
هيستوباثول. 2015 30 (11): 1255-1269.

يتكون أي نسيج من مزيج غير متجانس من أنواع الخلايا الموزعة مكانيًا. استجابة لأي إشارة فسيولوجية (مرضية) ، قد تكون استجابات كل نوع خلية في أي نسيج معين فريدة ولا يمكن تجانسها عبر أنواع الخلايا والإحداثيات المكانية. على سبيل المثال ، استجابة لاحتشاء عضلة القلب ، من ناحية ، تستجيب الخلايا العضلية والخلايا الليفية في أنسجة القلب بشكل مختلف. من ناحية أخرى ، تستجيب الخلايا العضلية في قلب الاحتشاء بشكل مختلف مقارنة بتلك الموجودة في منطقة ما حول الاحتشاء. لذلك ، يعد عزل الخلايا المستهدفة النقية خطوة مهمة وأساسية للتحليل الجزيئي للخلايا المشاركة في تطور المرض. يعتبر التقسيم الدقيق لالتقاط الليزر (LCM) قويًا للحصول على مجموعة فرعية نقية من الخلايا المستهدفة ، أو حتى خلية واحدة ، بسرعة وبدقة تحت المجهر ، مما يؤدي بنجاح إلى معالجة مشكلة عدم تجانس الأنسجة في التحليل الجزيئي. تقدم هذه المراجعة لمحة عامة عن تقنية LCM والمبادئ والمزايا والقيود وتطبيقاتها اللاحقة في مجالات البروتينات والجينوميات وعلم النسخ. مع التقنيات القوية والتطبيقات المناسبة ، توفر هذه التقنية رؤى غير مسبوقة في بيولوجيا الخلية من الخلايا المزروعة في موطن أنسجتها الطبيعية بدلاً من تلك المزروعة في ظروف أطباق بتري الاصطناعية.

GenEx هو برنامج شائع لمعالجة وتحليل بيانات qPCR. بنيت في نمط معياري توفر GenEx العديد من الوظائف لمجتمع qPCR ، بدءًا من تحرير البيانات الأساسية وإدارتها إلى تحليل البيانات المتقدم المتطور.

تحرير البيانات الأساسية وإدارتها
يمكن القول إن أهم جزء من تجارب qPCR هو المعالجة المسبقة للبيانات الخام في شكل لتحليلات إحصائية لاحقة. يجب تنفيذ خطوات المعالجة المسبقة بشكل متسق وبترتيب صحيح وبثقة. تضمن الواجهة المبسطة وسهلة الاستخدام GenEx standard & # 8217s معالجة خالية من الأخطاء. تسمح أدوات العرض التقديمي البديهية والقوية بالرسوم التوضيحية الاحترافية حتى للتصاميم التجريبية الأكثر تعقيدًا.

تحليل بيانات متقدم متقدم
عندما تحتاج إلى مزيد من التحليلات المتقدمة ، فإن GenEx 6 هو المنتج المناسب لك. قوية بما يكفي لإثبات الجدوى ، وغالبًا ما تثبت أنها كافية لمتطلبات معظم المستخدمين. تشمل الميزات الحالية الاختبارات الإحصائية البارامترية وغير المعلمية ، وتحليل المكونات الرئيسية ، والاختبارات العصبية الاصطناعية الشبكات. تتم إضافة ميزات جديدة باستمرار إلى GenEx مع الاهتمام الشديد باحتياجات العملاء # 8217.

ميزات جديدة
غالبًا ما تساهم معالجة العينات وعينات البيولوجيا الفردية في التباين التجريبي المربك. باستخدام ميزة ANOVA المتداخلة الجديدة في GenEx ، سيتمكن المستخدم من تقييم مساهمات التباين من كل خطوة في الإجراء التجريبي. من خلال معرفة جيدة بمساهمات التباين ، يمكن تحديد التوزيع المناسب للتكرارات التجريبية لتقليل التباين المربك وزيادة قوة التصميم التجريبي إلى أقصى حد! بالنسبة للتجارب ذات السمات المعقدة ، مثل الأمراض متعددة العوامل على سبيل المثال ، قد لا تكون العلاقات التحليلية والتصنيفات متاحة بسهولة. تعد ميزة آلة المتجه الداعمة في الإصدار الجديد من GenEx سهلة الاستخدام لدرجة أنها ستجعل طريقة التصنيف المتقدمة الخاضعة للإشراف هذه متاحة بسهولة للمستخدمين المبتدئين ، مع توفير الوصول إلى المعلمات المتقدمة للخبراء.

تعتبر الطرق مناسبة لتحديد الجينات المرجعية والتحقق من صحتها ، وتصنيف العينات ، وتجميع الجينات ، ومراقبة العمليات التي تعتمد على الوقت وغير ذلك الكثير.
يرجى الاطلاع على صفحة ويب GenEx أو البرامج التعليمية عبر الإنترنت
3Omics - أداة لبيولوجيا الأنظمة المستندة إلى الويب لتحليل وتكامل وتصور بيانات النسخ البشرية والبروتينية والأيض.
كو تك ، تيان تي إف ، تسينج يج.
BMC Syst Biol. 2013 يوليو 237: 64

استدلال التعبير الجيني مع التعلم العميق.
Chen Y، Li Y، Narayan R، Subramanian A، Xie X
المعلوماتية الحيوية. 2016 يونيو 1532 (12): 1832-1839

التحفيز: تم استخدام التنميط الواسع للتعبير الجيني على نطاق واسع لتوصيف الحالات الخلوية استجابة لحالات مرضية مختلفة ، واضطرابات وراثية ، وما إلى ذلك. على الرغم من أن تكلفة ملفات تعريف الجينوم الكامل قد انخفضت بشكل مطرد ، مما أدى إلى إنشاء مجموعة من التنميط التعبيري لأكثر من الآلاف من العينات لا تزال باهظة الثمن. اعترافًا بأن التعبيرات الجينية غالبًا ما تكون مترابطة بشكل كبير ، طور باحثون من برنامج NIH LINCS استراتيجية فعالة من حيث التكلفة لتحديد السمات المميزة فقط & # 87641000 الجينات البارزة المختارة بعناية والاعتماد على الأساليب الحسابية لاستنتاج التعبير عن الجينات المستهدفة المتبقية. ومع ذلك ، فإن النهج الحسابي المعتمد من قبل برنامج LINCS يعتمد حاليًا على الانحدار الخطي (LR) ، مما يحد من دقته لأنه لا يلتقط علاقة معقدة غير خطية بين تعبيرات الجينات.
النتائج: نقدم طريقة تعلم عميقة (مختصرة باسم D-GEX) لاستنتاج التعبير عن الجينات المستهدفة من التعبير عن الجينات البارزة. استخدمنا مجموعة بيانات Gene Expression Omnibus القائمة على ميكروأري ، والتي تتكون من ملفات تعريف تعبير 111K ، لتدريب نموذجنا ومقارنة أدائه بأداء الطرق الأخرى. من حيث متوسط ​​الخطأ المطلق في جميع الجينات ، يتفوق التعلم العميق بشكل كبير على LR مع تحسن نسبي بنسبة 15.33٪. يُظهر التحليل المقارن الجيني أن التعلم العميق يحقق خطأ أقل من LR في 99.97 ٪ من الجينات المستهدفة. اختبرنا أيضًا أداء نموذجنا الذي تعلمناه على مجموعة بيانات GTEx مستقلة قائمة على RNA-Seq ، والتي تتكون من 2921 ملف تعريف للتعبير. لا يزال التعلم العميق يتفوق على LR مع تحسن نسبي بنسبة 6.57٪ ، ويحقق خطأ أقل في 81.31٪ من الجينات المستهدفة.
التوفر والتنفيذ: D-GEX متاح على https://github.com/uci-cbcl/D-GEX

على طرق تصنيف الميزات الفعالة لتحليل البيانات عالية الإنتاجية.
Liao B، Jiang Y، Liang W، Peng L، Peng L، Hanyurwimfura D، Li Z، Chen M.
IEEE / ACM Trans Comput Bioinform. 2015 12 (6): 1374-1384

أصبح التعدين الفعال للبيانات عالية الإنتاجية أحد الموضوعات الشائعة في عصر البيانات الضخمة. تركز طرق تصنيف الميزات الحالية المتعلقة بالبيولوجيا بشكل أساسي على المعلومات الإحصائية والتعليقات التوضيحية. في هذه الدراسة ، يتم تقديم طريقتين فعالتين لترتيب الميزات. تم دمج الانحدار متعدد الأهداف ودمج الرسم البياني في إطار عمل التحسين ، ويتم تحقيق تصنيف الميزات من خلال تقديم معيار التشتت المنظم. على عكس الطرق الحالية ، تتمتع الطرق المقدمة بميزتين: (1) تقوم مجموعة الميزات الفرعية في نفس الوقت بالحساب لمعلومات الهامش العام بالإضافة إلى معلومات المنطقة المحلية. وبالتالي ، يتم النظر في كل من المعلومات العالمية والمحلية. (2) يتم تحديد الميزات عن طريق الدُفعة وليس بشكل فردي في إطار عمل الخوارزمية. وبالتالي ، يتم النظر في التفاعلات بين الميزات ويمكن ضمان مجموعة الميزات المثلى. بالإضافة إلى ذلك ، تقدم هذه الدراسة تبريرًا نظريًا. توضح التجارب التجريبية فعالية وكفاءة الخوارزميتين بالمقارنة مع بعض طرق تصنيف الميزات الحديثة من خلال مجموعة من مجموعات بيانات التعبير الجيني في العالم الحقيقي.
KnowEnG - محرك المعرفة لعلم الجينوم.
Sinha S، Song J، Weinshilboum R، Jongeneel V، Han J
J Am Med Inform Assoc. 2015 22 نوفمبر (6): 1115-1119

نصف هنا الرؤية والدوافع والخطط البحثية لمركز المعاهد الوطنية للصحة للتميز في حوسبة البيانات الضخمة في جامعة إلينوي ، أوربانا شامبين. يتم تنظيم المركز حول إنشاء "محرك المعرفة لعلم الجينوم" (KnowEnG) ، وهو إطار عمل للعلوم الإلكترونية لعلم الجينوم حيث سيتمكن علماء الطب الحيوي من الوصول إلى الأساليب القوية لاستخراج البيانات والتعدين الشبكي والتعلم الآلي لاستخراج المعرفة من علم الجينوم البيانات. سيأتي العالم إلى KnowEnG مع مجموعات البيانات الخاصة به في شكل جداول بيانات ويطلب من KnowEnG تحليل مجموعات البيانات هذه في ضوء قاعدة معرفية ضخمة لمجموعات بيانات المجتمع تسمى "شبكة المعرفة" والتي ستكون في قلب النظام. ينفذ المركز مشاريع استكشافية تهدف إلى اختبار فائدة KnowEnG لتحويل البيانات الضخمة إلى معرفة. تغطي هذه المشاريع نطاقًا واسعًا من الاستقصاء البيولوجي ، بدءًا من علم الجينوميات الصيدلانية (بالتعاون مع Mayo Clinic) إلى نسخ السلوك البشري. طرق استخراج البيانات الخاصة بـ Omics ومعرفة النباتات الطبية الخام نحو بيولوجيا البيانات الضخمة.
أفندي إف إم ، أونو إن ، ناكامورا واي ، ناكامورا ك ، داروسمان إل كيه ، كي بينجي إن ، موريتا إيه إتش ، تاناكا ك ، هوراي إتش ، ألطاف-الأمين إم ، كانايا إس
Comput Struct Biotechnol J. 2013 4: e201301010 - eCollection 2013


المواد والأساليب

تنبؤات موقع ربط TF

قمنا بدمج 89 مصفوفة وزن خاصة بالموضع (PWMs) من Zhu et al. (2009) ، 112 PWMs من باديس وآخرون. (2008) ، و 72 PWMs من Erb and van Nimwegen (2006). بشكل عام ، يشير الفحص البصري لنماذج TF التي يتم استنتاجها بأكثر من طريقة واحدة إلى وجود اتفاق جيد بين مجموعات البيانات الثلاث. تم الحصول على PWMs واحد لكل TF باستخدام إجراء Bayesian الذي يأخذ مجموعة من PWMs كمدخلات ويحدد المحاذاة النسبية لـ PWMs التي تزيد من احتمالية أن المجموعة بأكملها مشتقة من PWM أساسي واحد وتستنتج أيضًا PWM الأساسي (FANTOM Consortium 2009). تحدد هذه الطريقة أيضًا ما إذا كانت البيانات متوافقة مع جميع PWMs المشتقة من PWM واحد مشترك.بالنسبة لـ 12 TFs ، تم الاتفاق على طريقتين بينما كانت الطريقة الثالثة خارجة عن المألوف ، لذلك بالنسبة لكل من هذه الصناديق ، تمت إزالة الخارج يدويًا وتمت محاذاة اثنين من PWMs المتبقيين. بالنسبة إلى اثنين من TFs ، اختلفت طرق المصفوفة الدقيقة المرتبطة بالبروتين بين عزر dimer و monomer لذلك قمنا بحل هذه الحالات يدويًا. بالنسبة إلى TFs الأخرى ، قمنا أولاً بمحاذاة PWMs ميكروأري المرتبط بالبروتين ثم قمنا بمحاذاة متوسط ​​ميكروأري المرتبط بالبروتين الناتج مع PWM رقاقة ChIP. أخيرًا ، قمنا بقص حدود النموذج يدويًا لاستبعاد المواضع ذات المحتوى القليل من المعلومات وتجاهلنا فكرة FHL ، وهي عبارة عن TF تشبه رأس الشوكة والتي ، بناءً على فحوصات في المختبر ، يُشتبه في عدم ارتباطها بالحمض النووي مباشرة (Rudra et al. 2005).

تم إجراء جميع التحليلات على إصدار قاعدة بيانات الجينوم Saccharomyces (SGD) في أبريل 2006 من S. cerevisiae تسلسل الجينوم لتسهيل المقارنة مع تنبؤاتنا السابقة لـ TFBS (Erb and van Nimwegen 2006). لم تكن هناك تغييرات كبيرة في S. cerevisiae الجينوم منذ عام 2006. تم محاذاة المناطق الجينية إلى س. مفارقة, S. mikatae, S. kudriavzevii، و S. bayanus باستخدام MLAGAN واستخدامها كمدخل لبرنامج MOTEVO كما هو موضح سابقًا (Erb and van Nimwegen 2006).

تحليل الحساسية / الخصوصية

من قواعد بيانات SCPD (Zhu and Zhang 1999) و TRANSFAC (Matys et al. 2003) ، قمنا برعاية مجموعة من 452 رابطًا للمواقع التي يمكن تحديد TF ملزم بشكل لا لبس فيه (Erb and van Nimwegen 2006). لكل TF تم توفير كل من تنبؤات MotEvo وموقع واحد معروف على الأقل ولكل منطقة جينية ، قمنا بحساب مجموع الأجزاء الخلفية لجميع مواقع الربط في المنطقة. تم بعد ذلك ترتيب مجموعات المناطق المستهدفة المتوقعة TF / المروج & # x02013 من خلال مجموع العناصر الخلفية وفي فترات قطع مختلفة ، كان جزء جميع الأهداف المعروفة التي كانت من بين التنبؤات (الحساسية) وكسر جميع التوقعات التي تتوافق مع الأهداف المعروفة (الخصوصية) محسوب. بالنسبة لبيانات رقاقة ChIP الخاصة بـ Harbison et al. (2004) ، تم فرز مجموعات أهداف المنطقة TF / المروج & # x02013 بواسطة ص تم حساب قيمة الارتباط والحساسية والنوعية على اختلاف ص قطع القيمة.

تحليل جينوم السكان

في معالجة بيانات تعدد الأشكال النوكليوتيد الفردي الخام (SNP) ، استخدمنا عتبة 40 على درجة Phred وقمنا بتطبيع تردد الأليل من خلال تغطية التسلسل ، باتباع Liti et al. (2009). كانت النتائج متشابهة بالنسبة للقطع Phred البالغ 20 أو عند استبعاد الأشكال المتعددة الأحادية (البيانات غير معروضة). بالنسبة لتوزيعات تردد الأليل المشتق (DAF) ، قمنا بمحاذاة S. cerevisiae و س. مفارقة مرجع الجينوم مع MAVID (Bray and Pachter 2004) وجذر S. cerevisiae النيوكلوتايد مع س. مفارقة التسلسل المرجعي والعكس صحيح. لقد حددنا العناصر المحفوظة على أنها 7 أمتار (ربما متداخلة) محفوظة في نفس الأنواع الخمسة المستخدمة في تنبؤ TFBS لأن متوسط ​​درجة المعلومات الخاصة بـ PWMs كان 14 بت. قمنا بتغيير المعلمات من خلال اختبار 6 إلى 12 مترًا و 4 أو 5 أنواع. كانت النتائج متسقة تمامًا من حيث أن القيد الانتقائي المستنتج زاد بزخارف أطول أو أنواع أكثر.

تحليل تغييرات نقاط PWM

لقد جمعنا جميع TFBSs التي تم توقعها في السلالة BY واحتوتنا على SNP واحدًا بالضبط بالنسبة لسلالة RM وحددنا الفرق dل في احتمالية تسجيل تسلسل BY و RM لـ PWM المقابل. من هذا ، حددنا توزيع دل بالنسبة لجميع SNPs التي تمت ملاحظتها ، يتم وزن كل SNP من خلال الاحتمال الخلفي لـ TFBS الذي يحدث فيه. قارنا توزيع الملحوظة دل بتوزيعين عشوائيين. أولاً ، استخدمنا توزيع دل من جميع الطفرات أحادية النقطة لـ TFBS التي تحتوي على SNPs ، مرة أخرى تزن الطفرات في TFBS من خلال الاحتمال الخلفي لـ TFBS. ثانيًا ، استخدمنا توزيع دل من جميع الطفرات أحادية النقطة في نفس الموضع حيث حدث SNP المرصود. لمراعاة تكوين تسلسل المناطق الجينية ، تم أيضًا وزن الطفرات النقطية المختلفة في المجموعات العشوائية من خلال التردد الكلي للنيوكليوتيدات المقابلة في المناطق الجينية.

ارتباط التسلسل بالتعبير الجيني

ما لم ينص على خلاف ذلك ، استخدمنا 600-nt المنبع لموقع بدء النسخ لتحديد منطقة المروج. تم تحديد بدايات النسخ في Zhang and Dietrich (2005) و David et al. (2006). بالنسبة للجينات المنسوخة بشكل متباين حيث كانت المنطقة بين الجينات أقل من 1200 نانومتر ، قمنا بتقسيم المنطقة إلى منطقتين محفزتين متساويتين الحجم ، بناءً على نتيجة Erb و van Nimwegen (2006) التي من المحتمل أن تنظم معظم TFBSs جينًا واحدًا فقط. أزلنا TFs التالية باعتبارها لا يتم نسخها في الوسائط الغنية بناءً على بيانات صفيف التجانب (David et al. 2006): DAL80 و GAL4 و SIP4 و THI2.

لتحليل الارتباط ، قمنا بتغيير طول منطقة المروج من 400 إلى 1000 بزيادات 200 ، وقطع الاحتمال الخلفي من 0.3 إلى 0.9 بزيادات قدرها 0.2 ، وقطع تغيير أضعاف من 0 إلى 0.6 بزيادات قدرها 0.2. جربنا استراتيجيات أخرى ، مثل أخذ المجموع أو التوقع بدلاً من الحد الأقصى ، باستخدام مجموعتين من تغييرات الطيات المقدرة (Brem and Kruglyak 2005 Wang et al.2007) واستخدام الأنشطة المقدرة لـ TFs على جميع الفواصل ، مناسبة باستخدام نموذج خطي مشابه للأعمال السابقة (Sun et al. 2007 Ye et al. 2009). لم تؤد أي من هذه الاستراتيجيات إلى تحسين الارتباطات على الرغم من أن إحصاء المجموع يعطي نتائج مماثلة للإحصاء الأقصى (الجدول التكميلي S1 ، المواد التكميلية عبر الإنترنت). لقد حاولنا أيضًا تقسيم الجينات إلى مجموعات والتي بموجبها ينظمها فريق العمل. من الناحية النظرية ، قد يؤدي هذا التجميع إلى تحسين بسبب الطرق المختلفة التي قد تؤثر بها التغييرات في درجة PWM على التغييرات في التعبير. من الناحية العملية ، كانت المجموعات صغيرة جدًا وأدت إلى تباين كبير في متوسط ​​معامل الارتباط ، مثل 51 TFs مع & # x0003e2 الجينات في مجموعتهم ، 21 كان لها ارتباط سلبي. لتحليل البيانات من Emerson et al. (2010) ، استخدمنا الطريقة التابعة لتقدير المعلمات (Emerson et al. 2010) لأنها تتمتع بدقة أعلى والعلاقة بين رابطة الدول المستقلة و عبر التأثيرات ليست ذات صلة في تطبيقنا.


نتائج

تكيف SmiFISH مع أجنة وأنسجة المفصليات

تم اختبار smiFISH في الأصل في خلايا الثدييات المستزرعة 16. هنا طبقنا بروتوكول SmiFISH ، مع التعديلات ، على أجنة من خمسة أنواع مختلفة من نماذج المفصليات -ذبابة الفاكهة سوداء البطن و ذبابة الفاكهة فيريليس (ذباب الفاكهة)، ناسونيا فيتريبينيس (دبور طفيلي) ، تريبوليوم كاستانيوم (خنفساء الدقيق) ، و Parhyale hawaiensis (قشريات أمفيبود). أوقات الاختلاف التطوري لهذه الأنواع موضحة في الشكل التكميلي 1. قمنا أيضًا باختبارها ذبابة الفاكهة المبيض والأقراص التخيلية. يعمل بروتوكولنا على تبسيط المخازن المؤقتة الأصلية لـ SmiFISH ، مع الإهمال الإشريكية القولونية الحمض الريبي النووي النقال ، و BSA ، ومركب الفاناديل الريبونوكليوزيد. يتم استبدال 1X PBS بـ 1X PBT لتجنب تكتل الأجنة أو الأنسجة ، ونزيد أيضًا عدد ومدة الغسل ، لمراعاة حقيقة أن الأجنة والأنسجة أكثر سمكًا وأكثر تعقيدًا من الخلايا ، وهذا الإزالة الكاملة للحلول بين غسل أقل جدوى.

تم استخدام بروتوكول مماثل لجميع الأنواع والأنسجة ، وكانت الاختلافات الطفيفة الوحيدة في طريقة تثبيت العينة ، والتركيب النهائي (مفصل في الطرق عبر الإنترنت). عبر الأنواع ، قمنا بتلوين نفس الجينين ، حتى تخطي (حواء) في الأجنة المبكرة ، و محفور (en) في الأجنة اللاحقة (الشكل 1). تم تحقيق دقة mRNA الفردية في أجنة جميع الأنواع ، مع خلفية منخفضة جدًا غير محددة ، واضحة من المناطق خارج الخطوط الخالية من الإشارة. معا ذبابة الفاكهة الأنواع (متباينة

قبل 50 مليون سنة) ، حواء يتم التعبير عنها في سبعة خطوط. كلاسيكيا حواء تميل الشرائط التي تم اكتشافها باستخدام ISH العادي أو التلميع المناعي إلى أن يكون لها مظهر منفصل 18،19،20 ، ولكن هنا تظهر اللوحات المكبرة التي تظهر المناطق الواقعة بين الشرائط بدقة جزيء واحد أن حواء يتم التعبير عنها في جميع أنحاء المنطقة المحاطة بالخطوط السبعة. تمثل الخطوط موجات بالتناوب في التعبير العالي والمنخفض. وفقا للملاحظات السابقة ، حواء يظهر أنماطًا مختلفة في تريبوليوم, بارهيالي و ناسونيا، والتي قد تعكس مدخلات تنظيمية متميزة في المنبع ، وأنماط مختلفة من التجزئة في هذه الأنواع مقارنة بـ ذبابة الفاكهة 21,22,23 .

smiFISH لجينات التجزئة حتى تخطي (حواء) و محفور (en) في الأجنة المبكرة واللاحقة لخمسة أنواع مختلفة من المفصليات ، ذبابة الفاكهة سوداء البطن (D.mel), ذبابة الفاكهة فيريليس (د), تريبوليوم كاستانيوم (T.cas), ناسونيا فيتريبينيس (نفيت) و Parhyale hawaiensis (P.haw). يتم توجيه الأجنة من الأمام إلى اليسار. smiFISH ل بلا أجنحة (wg) و en يظهر في D.mel قرص الجناح التخيلي. تم تلطيخ المبايض من أجل الحمض النووي الريبي المحمّل من الأم بيكويد (بى سى دى) و النانو (لا) ، والتي تتراكم عند القطبين الأمامي والخلفي للبيضة النامية ، على التوالي. تظهر غرفة واحدة من مرحلة 10 بيضة ، موجهة بالخلايا الممرضة والجزء الأمامي من البويضة النامية إلى اليسار. تم استخدام DAPI لتلطيخ نواة الخلية. تم الحصول على جميع الصور باستخدام مجهر متحد البؤر يمسح بالليزر بالضوء الأبيض بأهداف 40X أو 100X. يتم تكبير الصناديق البيضاء المتقطعة إلى اليمين. تكون mRNAs واحدة مرئية لجميع العينات التي تم اختبارها.

كانت الأقراص التخيلية ملطخة من أجل en و بلا أجنحة (wg) (رسم بياني 1). كلا الجينين لهما مناطق داخل قرص الجناح مع مستويات تعبير مختلفة بشكل ملحوظ (en، لوحة مكبرة) ، وحدود حادة ومنتشرة (wg، اللوحات المكبرة) ، التي يُفترض أنها ناشئة عن الاختلافات الإقليمية في تنظيم النسخ. كانت المبيض ملطخة ل بيكويد (بى سى دى) و النانو (لا) الحمض النووي الريبي (الشكل 1). في المرحلة 10 من حجرة البيض الموضحة ، يتم التعبير عن كلا الجينين بشكل كبير في الخلايا الممرضة. كما هو متوقع، بى سى دى تتراكم الحمض النووي الريبي بكثافة عالية عند الحافة الأمامية للبويضة 24،25 ، مع انحدار تركيز متناقص نحو الخلف. لا RNAs وفيرة أيضًا عند الحافة الأمامية للبويضة ، ولكنها تُظهر أيضًا بدايات بعض التراكم في القطب الخلفي ، المرئي في اللوحة المكبرة 26. تكشف الحساسية العالية لـ smiFISH عن أول ظهور للظهر لا توطين الحمض النووي الريبي في المرحلة 10 ، في وقت أبكر مما لوحظ سابقًا بواسطة الكلاسيكية في الموقع 26،27 (المرحلة 12) ، ولكنها مماثلة لتقارير من التصوير الحي 28 وتلطيخ FISH 29 (المرحلة 10). غالبية التوطين الخلفي لا تحدث RNAs خلال المراحل الأخيرة من تكوين البويضات (المراحل 13/14) 26،28 ، وبالتالي ، فإن التوطين الخلفي للـ RNAs في المرحلة 10 من غرفة البيض الموضحة يكون ضئيلًا.

تصور متعدد الجينات في وقت واحد بدقة جزيء واحد

تسانوف وآخرون أوضِح أنه منذ أن يتم تلدين ألواح smiFISH لأول مرة في المختبر ، يمكن استخدام المجسات باستخدام نفس تسلسل الرفرف ولكن مع الفلوروفورات المختلفة معًا بدون تقاطع 16. باستخدام تسلسل X رفرف فقط لجميع مجموعات مجسات smiFISH ، قمنا باختبار أداء الفلوروفورات المتعددة ، بمفردها وبالاقتران ، بهدف تحديد مجموعة قصوى بأطياف قابلة للفصل ، والتي من شأنها أن تسمح بالكشف المتزامن لأنماط التعبير الجيني المتعددة المتميزة في وقت واحد قرار الجزيء. تمكنا من فصل تسعة ألوان ثمانية ذبابة الفاكهة جينات Hox بدقة جزيء واحد معًا في نفس الجنين ، بالإضافة إلى DAPI لتلطيخ النوى (الشكل 2). يتم توفير مجموعات المسبار / الفلوروفور في البيانات التكميلية 2. يتم توفير الصورة كصورة تكميلية عالية الدقة 1 (متوفرة على https://github.com/LliliansCalvo/smiFISH_Arthropods) ، حيث يمكن ملاحظة مواقع النسخ و mRNAs الفردية مع التكبير. تميل الجينات الطويلة إلى إظهار مواقع نسخية كبيرة ساطعة ، تمثل تراكمًا موضعيًا للعديد من الحمض النووي الريبي الوليدة في عملية النسخ على طول طول الجين ، على سبيل المثال النملة (

78 كيلو بايت). اعتمادًا على السؤال ، قد يكون من المفيد تحديد رقم RNA الوليد. يمكن تحقيق ذلك عن طريق حساب نسبة كثافة موقع النسخ إلى كثافة بقعة mRNA الفردية ، لاستنتاج شغل البوليميراز 30.

تمتد المرحلة 10 من العصابة الجرثومية D. melanogaster جنين (منظر جانبي ، أمامي يسار) مع تلطيخ سميفيش لجميع جينات Hox الثمانية ، بالإضافة إلى DAPI لإظهار النوى. تم استخدام تسلسل X-flap لجميع المجسات ، مع الفلوروفورات التالية: شفوي كالفلور 610 ، بروبوسكيبيديا كوازار 570 مشوه AlexaFluor 488 ، أمشاط الجنس مخفضة كوازار 670 أنتينابيديا المروج 1 CalFluor 540 ، Ultrabithorax كوازار 705 البطن- A CalFluor 590 و البطن- ب CalFluor 635. تم الحصول على مجموعة الصور باستخدام مجهر متحد البؤر لايكا SP8 ، مع هدف 40X وضوء ليزر أبيض ، مما يتيح أطوال موجات الإثارة المثلى لكل فلوروفور. تم التقاط ذروة الانبعاثات من خلال ضيق

نوافذ تجميع قابلة للضبط 20 نانومتر ، والصورة غير مختلطة طيفيًا في برنامج Leica LAS X لتصحيح أي تسييل متبقي. تشير البقع المضيئة الكبيرة إلى تراكمات الحمض النووي الريبي الوليدة في مواقع النسخ الأصغر ، والبقع الأكثر خفوتًا هي mRNAs مفردة.

لعرض ثمانية جينات معًا ، فإن الإثارة المثلى والتجميع من كل فلوروفور ضروري لتجنب النزيف بين القنوات. تم الحصول على هذه الصورة باستخدام متحد البؤر Leica SP8 مع ليزر الضوء الأبيض ، قابل للضبط لكل طول موجي مثير للإثارة. نوافذ التجميع الضيقة من

تم تعيين 20 نانومتر ، المقابلة لقمم انبعاث كل فلوروفور. تمكّن تنسيق الخط الذي يبلغ متوسطه 16X والدقة العالية 4096 × 4096 من حل RNAs الفردي. على الرغم من الإعدادات التي قللت من النزيف إلى الحد الأدنى ، لا يزال بعضها قائمًا بين قنوات معينة ، لذلك لم يتم خلط الصورة طيفيًا بعد الاستحواذ. لتجنب الحاجة إلى فك المزج الطيفي ، فإن صبغة الألوان الستة باستخدام DAPI و AlexaFluor 488 و Quasar 570 و CalFluor 610 و Quasar 670 و Quasar 705 تعتبر مثالية.

تجزئة الجنين بالكامل لتقدير الحمض النووي الريبي متعدد الجينات وحيدة الخلية

الميزة الأساسية لـ smFISH هي قياس الحمض النووي الريبي على أساس كل خلية على حدة ، مع الحفاظ على السياق الموضعي. يكون التمييز بين الخلايا الفردية في المزرعة أمرًا بسيطًا إذا كان التباعد ضئيلًا بدرجة كافية ، ولكن في الأجنة أو الأنسجة يكون أكثر صعوبة ، ويتطلب علامة على غشاء الخلية وتجزئة. اختبرنا توافق SmiFISH مع التألق المناعي لغشاء الخلية باستخدام لوحة مختلفة ذبابة الفاكهة الأجسام المضادة ، ووجدت أنه من الأفضل دمج التألق المناعي بعد smiFISH ، وليس قبل ذلك. لقد حددنا alpha-Spectrin كعلامة مثالية تحدد بوضوح حدود الخلايا وأقل تعرضًا للخطر من خلال خطوات smiFISH السابقة.

لتحديد كمية الحمض النووي الريبي من جينات متعددة في خلايا مفردة ، أجرينا smiFISH في ذبابة الفاكهة أجنة لأربعة جينات فجوة معبر عنها في مرحلة الأديم -أحدب (هب), عملاق (جي تي), عقبات (kni) و كروبيل (كر) ، الجين حكم الزوج حواء، وأغشية الخلايا المميزة بواسطة التألق المناعي للسبكترين (الشكل 3 أ). لمجموعات المسبار / الفلوروفور ، انظر البيانات التكميلية 2. يشكل تلطيخ سبكترين حدود خلية واضحة في ض- شرائح حيث تكون الخلايا في المقطع العرضي (الشكل 3 ب). في الأديم الخلوي ذبابة الفاكهة الأجنة ، أغشية الخلايا في طور الدخول بين النوى ، لكنها لم تغلق الجانب القاعدي بعد ، مما يتسبب في تلاشي تلطيخ السبيكترن بشكل أساسي. يمكن ملاحظة mRNAs في ض- الطائرات التي تتجاوز حد الغشاء القاعدي هذا ، ولكن ليس من الممكن معرفة على وجه اليقين أي خلية نشأت فيها هذه mRNAs القاعدية. لذلك ، لأغراض مقارنة التباين من خلية إلى أخرى ، اقتصر القياس الكمي على ض- الطائرات بين الجانب القمي والحد الأساسي لدخول الغشاء. للتجزئة ، مجموعة أساسية مكونة من 20 مبدئيًا ض- تم تحديد الشرائح (إجمالي 4 ميكرون) التي تظهر تلطيخًا مقطعيًا واضحًا للسبكترين ، ثم تم نسخ الشريحة السفلية من هذا اللب لتمتد من خلال 28 شريحة إضافية (إجمالي 5.6 ميكرون) إلى الحد الأساسي لدخول الغشاء حيث اختفى تلطيخ سبكترين. تم استخدام وحدة الخلايا في برنامج Imaris لتقسيم الجنين بشكل ثلاثي الأبعاد من خلال 48 شريحة كاملة (العمق الإجمالي 9.6 ميكرومتر) ض-المكدس ، وتعمل البقع على تحديد الحمض النووي الريبي الفردي لكل جين ، والتي يتم تخصيصها تلقائيًا للخلايا (الشكل 3 ب). يتم توفير تفاصيل خطوات تحليل Imaris في الطرق عبر الإنترنت.

أ المرحلة 5 الأديم الأرومي الخلوي D. melanogaster جنين (منظر جانبي ، أمامي يسار) مع إسقاطات قصوى لـ smiFISH لجين حكم الزوج حتى تخطي، وأربعة جينات فجوة: أحدب, عقبات, عملاق و كروبيل. تلطخ أغشية الخلايا بالتألق المناعي ، باستخدام مضاد للفأرذبابة الفاكهة alpha Spectrin ، والماعز المضاد للفأر Alexa Fluor 488. تتكون مجموعة الصور متحد البؤر من 48 شريحة عند 200 نانومتر. ض- فترات (العمق الكلي 9.6 ميكرومتر) ، من الحد القمي لبقع الرنا المرسال ، إلى المدى القاعدي لدخول الغشاء ، لالتقاط جميع الحمض النووي الريبي الذي يمكن تخصيصه بدقة لخلايا مفردة. ب تم استخدام وحدة الخلايا في برنامج Imaris v9.2 لتقسيم تلطيخ Spectrin تلقائيًا في صورة ثلاثية الأبعاد من خلال مكدس متحد البؤر ، مما يؤدي إلى إنشاء أحجام خلايا فردية (إجمالي 1982). تم استخدام وحدة بقع Imaris لتحديد بقع mRNA تلقائيًا لكل جين وتعيين نقاط تلقائيًا لأحجام الخلايا بناءً على س ، ص ، ض إحداثيات. ج تعرض خرائط الحرارة رقم mRNA لكل خلية لكل من الجينات الخمسة. د رسوم بيانية لعدد mRNA لكل خلية لكل جين ، باستخدام صناديق من خمسة مع استبعاد الصفر. شكل توزيعات المدرج التكراري هو نتاج لأنماط التعبير عن الجينات.

تعرض خرائط الحرارة عدد mRNAs لكل جين ، في كل خلية من الجنين حتى حد دخول غشاء الخلية القاعدية (الشكل 3 ج). يوضح هذا أن جميع الجينات الخمسة تظهر مجالات تعبير ذات حدود متدرجة ، وليست حادة ، بما يتوافق مع أنماط تعبير الفجوة التي يتم إنشاؤها استجابةً لتدرجات مورفوجين الأم مثل bicoid ، داخل الجنين المخلوي. تُظهر مجالات التعبير المنفصلة لنفس جين الفجوة مستويات تعبير عامة مختلفة ، مما يشير إلى أن تنظيم النسخ يختلف باختلاف موضع الخلية. تظهر الرسوم البيانية لبيانات الخلية المفردة في الشكل ثلاثي الأبعاد (الخلايا التي لا تحتوي على RNA مستبعدة). بالنسبة للخلايا المستنبتة ، تم استخدام شكل توزيعات المدرج التكراري من هذا النوع لعمل استنتاجات حول سلوك المروج 31 ، استنادًا إلى افتراض أن المحفز في كل خلية له سلوك مشترك مشترك عبر مجموعة الخلايا ، مما يؤدي إلى توقيع معين واضح من التوزيع.على سبيل المثال ، من المتوقع أن ينتج المروج الذي يحتوي على دفعات عالية من النسخ متبوعًا بفترات انقطاع طويلة توزيعًا ذا ذيل طويل إلى قيم عالية 31 ، على غرار ما تم العثور عليه هنا من أجل حواء. ومع ذلك ، من المهم ملاحظة أن مثل هذه الاستدلالات لا يمكن إجراؤها للجينات غير المعبر عنها في كل مكان في الأجنة والأنسجة الكاملة ، لأن الافتراض لا يصح. تمثل التوزيعات في الشكل ثلاثي الأبعاد مجموعة مختلطة من الخلايا ، حيث يُظهر كل جين مجموعة متنوعة من سلوكيات النسخ المختلفة ، اعتمادًا على الموقع المكاني داخل الجنين. وبالتالي فإن التنوع الناتج في أشكال المدرج التكراري هو مجرد انعكاس لأنماط التعبير الجيني المختلفة ، وليس نتاج سلوك مروج شائع. لتوضيح هذه النقطة ، قارن الرسوم البيانية لـ كر و حواء. كر يتم التعبير عنها بشكل أساسي في شريط عريض واحد. تمثل النسبة المنخفضة من الخلايا التي تحتوي على 15-65 RNA انتقالًا مكانيًا سريعًا بين خلايا الحافة منخفضة التعبير للغاية والخلايا عالية التعبير داخل الشريط ، بينما يتوافق النتوء بين 65 و 130 مع عدد كبير من الخلايا عالية التعبير داخل شريط. فى المقابل، حواء يتم التعبير عنها في سبعة خطوط ضيقة. تشير الشرائط المتعددة إلى المزيد من الحواف ، لذا فإن نسبة عالية من الخلايا لها أرقام وسيطة من الحمض النووي الريبي ، تملأ الخانات 6-65 ، ونسبة أقل من الخلايا عالية التعبير في وسط الخطوط ، وبالتالي فقد النتوء بين 65 و 130. لذلك يتم شرح أشكال المدرج التكراري لهذه الجينات من خلال أنماطها ، وليست خاصية ناشئة لسلوك المروج الثابت.

للتحقق من دقة الكشف عن البقع ، هناك مجموعتان متشابكتان لكل من 41 مجسًا من مجسات smiFISH كر تم تصنيف mRNA بلونين مختلفين (CalFluor 610 و Quasar 570) ، وتم تصويرهما في وقت واحد وتم عدهما (الشكل التكميلي 2 أ ، ب). أكد هذا الارتباط العالي في كر تم اكتشاف mRNA / خلية في كل لون (Spearman’s ص = 0.99, ص & lt 0.0001). للتحقق من دقة القياس الكمي عند 40X ودرجة التراجع بسبب ازدحام mRNA ، كر تم تصوير mRNAs في نفس الجنين أولاً بهدف 40X ، ثم مع 100X ، وتم تحديد كمية البقع باستخدام نفس عتبة الكشف (الشكل التكميلي 2 ج ، د). في كلا التكبيرين ، أكد الفحص البصري لبقع Imaris اكتشاف كل من البقع القوية والباهتة ، والفصل الناجح للبقع التي تلامس عن كثب (الشكل التكميلي 2 ج). مقارنة بين كر أظهر mRNA / الخلية بين التكبيرين زيادة طفيفة في معدل الكشف عند 100X ، ويرجع ذلك على الأرجح إلى تحسين الفصل بين mRNAs القريبة جدًا (الشكل التكميلي 2 د ، متوسط ​​40X = 54 ، الحد الأقصى = 136 ، متوسط ​​100X = 66 ، الحد الأقصى = 142 ، خلايا غير صفرية فقط). بالنسبة للأسئلة البيولوجية التي يكون فيها عدد الرنا المرسال المطلق أمرًا بالغ الأهمية ، أو بالنسبة للجينات ذات الرنا المرسال المعبر عنها بكثافة ، فقد يكون التصوير بمعدل 100 مرة مفيدًا. ومع ذلك ، بالنسبة للجينات المعبر عنها بشكل منخفض ، لتحليل موقع النسخ الناشئ ، أو حيث تكون بيانات الجنين بالكامل أكثر أهمية من الأرقام المطلقة ، فإن التصوير 40X بالتكبير الأقل هو الأفضل.

تم تصوير الجنين الموضح في الشكل 3 وقياسه كميًا فقط إلى المدى الأساسي لدخول الغشاء ، لضمان التخصيص الدقيق لبقع الرنا المرسال للخلايا الفردية. لتحديد أرقام mRNA المطلقة (ولكن بدون الدقة المؤكدة لتخصيص الخلية) ولتقييم التباين البيولوجي ، قمنا بتحليل كر تعبير mRNA في 12 أجنة جلدية إضافية من خلال العمق الكامل لإشارة SmiFISH ، بما يتجاوز مدى دخول الغشاء. تم الكشف عن بقع mRNA من خلال عمق يصل إلى 120 ض- شرائح (العمق الكلي 24 ميكرومتر) (الشكل التكميلي 2 هـ ، و). تم فرز الأجنة حسب الترتيب العمري عن طريق قياس درجة دخول الغشاء بين النوى ، والتي تم تحديدها من مستوى مقطعي في قناة Spectrin (الشكل التكميلي 2g) ، و كر تم تحديد كمية بقع mRNA لكل خلية باستخدام إعدادات تصوير متطابقة وكشف موضعية لجميع الأجنة (الشكل التكميلي 2 ح). كر أظهر تباينًا بيولوجيًا كبيرًا بين الأجنة ، ولكن لا يرتبط بعمر الجنين. أظهرت الأجنة حدودًا قصوى تراوحت بين 123 و 337 كر مرنا / خلية.

الكشف التلقائي عن الجار الخلوي لتحليل التباين من خلية إلى أخرى

لتقييم التباين في التعبير الجيني ، يمكن للمرء تحليل متوسط ​​قيم الحمض النووي الريبي وانتشارها داخل مجموعة الخلايا بأكملها ، ومقارنة الخلايا الفردية بهذا التوزيع. ومع ذلك ، نظرًا لأن الجين المعين قد يُظهر أنماطًا معقدة تشتمل على مجالات مختلفة معبرة على مستويات مختلفة ، فإن تحليل الخلايا معًا كمجموعة واحدة قد لا يكون مفيدًا. تتم معالجة التباين أحادي الخلية بشكل أفضل من خلال مقارنة التباين بين الخلية وجيرانها المباشرين. نحدد الخلايا المجاورة مباشرة على أنها تلك التي تشترك مباشرة في حدود غشاء في قناة Spectrin. باستخدام مستوى تجزئة ثنائي الأبعاد من الجنين الموضح في الشكل 3 ب ، تم حساب عدد الجوار المباشر لكل خلية يدويًا في نصف الجنين (الشكل 4 أ) ، مما يعطي نطاقًا يتراوح من 2 إلى 8 ، مع توزيع التردد الموضح في الشكل. 4 د. لأتمتة اكتشاف الجار ، تم استخدام وظيفة البقع في Imaris بعتبة منخفضة للكشف

80000 نقطة في قناة Spectrin ، مما يوفر تمثيلًا كثيفًا للغشاء على شكل بقع (الشكل 4 ب). تم تطوير رمز R المخصص الذي يستخدم كلاً من إحداثيات Spectrin الموضعية ومعرف الخلية الذي تنتمي إليه كل بقعة ، لإنشاء مضلعات ثلاثية الأبعاد تتطابق بشكل وثيق مع التجزئة الأصلية (الشكل 3 ج). تم توسيع كل مضلع بشكل طفيف في 3D بمقدار 0.6 ميكرومتر (حوالي 10٪ من قطر الخلية) ، مما تسبب الآن في تقاطع حدود المضلع مع جيرانها المباشرين فقط. يكتشف الرمز بعد ذلك جميع التقاطعات ، وينتج لكل مضلع قائمة بالمضلعات (الخلايا) المجاورة مباشرة. يتطابق التوزيع المجاور الذي تم الحصول عليه بهذه الطريقة الآلية عن كثب مع توزيع العد اليدوي (الشكل 4 د ، هـ). لتأكيد الاتفاق بين الطرق اليدوية والآلية لخلايا معينة ، تمت مقارنة رقم الجوار الذي تم الحصول عليه مع كل طريقة لأول 200 معرف خلية (الشكل 4f). من بين 200 خلية ، كان لدى 87 ٪ اتفاق كامل ، وكان الحد الأقصى للتناقض بين الطرق ± 1 جار.

أ طائرة تجزئة ثنائية الأبعاد من أديم أرومي خلوي D. melanogaster الجنين مع تلطيخ الغشاء المضاد للسبكترين. تم حساب عدد الخلايا المجاورة مباشرة (المعرفة على أنها مشاركة مباشرة لجزء من الغشاء) يدويًا ، لكل خلية في نصف الجنين. تم العثور على مجموعة من 2-8 جيران المباشرين. ب اكتشاف بقعة Imaris منخفضة العتبة في قناة Spectrin ، لتوليد تمثيل كثيف للغشاء مع البقع ، لتوليد مضلع ثلاثي الأبعاد. ج تم تطوير رمز R مخصص لإنشاء مضلعات ثلاثية الأبعاد من إحداثيات Spectrin الموضعية ومعرفات الخلية المعينة ، مما يؤدي إلى إعادة إنتاج التجزئة الأولية عن كثب. تم توسيع كل مضلع بشكل طفيف في ثلاثي الأبعاد بمقدار 0.6 ميكرومتر (

10٪ من قطر الخلية) ، مما يولد تقاطعات بين حدود الخلايا المجاورة مباشرة فقط. يكتشف الكود جميع التقاطعات ، وينتج لكل مضلع قائمة بالخلايا المجاورة مباشرة. د مخطط بياني يلخص عدد الجوار اليدوي (1028 خلية) في (أ). ه رسم بياني يلخص عدد الجيران الآلي (1982 خلية) في (ج) ، لتأكيد الاتفاق الوثيق مع العد اليدوي. F رسم بياني يلخص مقارنة مباشرة خلية تلو خلية لرقم الجوار بين العد اليدوي والطريقة التلقائية ، لأول 200 معرف خلية ، محسوبة على أنها يدوية مطروحًا منها آليًا.

تكمن قوة طريقة المضلع هذه على نهج نصف قطر البحث المجاور الأكثر بساطة في أن عامل توسيع المضلع عبارة عن جزء صغير (

10 ٪) من متوسط ​​قطر الخلية ، وبالتالي يعمل على تحديد الخلايا المجاورة فقط بشكل حصري ، حتى في الأنسجة ذات الأحجام والأشكال المختلفة للخلايا. بالنسبة لبعض الدراسات ، قد تكون مقارنة الخلايا داخل منطقة معينة من الأنسجة أكثر فائدة من الاقتصار على لمس الخلايا فقط. لتوفير هذا كخيار بديل لخط أنابيب التحليل ، قمنا أيضًا بتطوير الكود لحساب المسافة الإقليدية بين إحداثيات النقطة المركزية لكل خلية ، ثم التصفية حسب نصف قطر محدد ، لإرجاع قائمة بجميع الجيران داخل كل خلية هذا الشعاع. يتم توفير جميع الشفرات عبر الرابط الموجود أسفل "توفر الرمز".

تدابير جديدة لالتقاط التباين العددي والتناسب أحادي الخلية

تظهر لوحات smiFISH في الشكل 5 ب حواء- التعبير عن الخلايا من عصابة جرثومية مبكرة بارهيالي الجنين ، وتسليط الضوء على كيف يمكن أن يكون لخلية واحدة مستوى تعبير مختلف بشكل ملحوظ عن جيرانها المجاورة مباشرة. لقد ثبت أن هذا التباين أحادي الخلية داخل مجموعة سكانية له صلة بيولوجية مهمة ، على سبيل المثال في تحديد المصير 11 وسلوك الخلية 10 والمرض 12. عامل فانو هو مقياس شائع الاستخدام لتغير الحمض النووي الريبي المحلي ، ويتم حسابه على أنه تباين / متوسط ​​(الشكل 5 أ). التباين والمتوسط ​​عبارة عن مقاييس للمجتمع ، لذلك يتم تعيين نفس قيمة عامل Fano لجميع الخلايا في المجموعة ، وبالتالي يتم تحديد حلها حسب حجم المجموعة المجاورة. ومع ذلك ، لا يمكن لعامل Fano التمييز بين الخلايا المتغيرة الفردية داخل مجموعة الجيران. يتضح هذا من خلال مقارنة السيناريوهات الافتراضية الثلاثة الموضحة في الشكل 5 ج - هـ. تختلف الخلايا المركزية في الألواح (ج) و (هـ) بشكل متساوٍ عن جيرانها ، نسبيًا وعدديًا ، في حين أن الخلية المركزية في اللوحة (د) ليست متغيرة جدًا ، فهي نفس كل جيرانها باستثناء واحد. ومع ذلك ، فشل عامل فانو في التمييز بين أي فرق بين (ج) و (د) (كلاهما 6.11) ووجد بشكل غير صحيح (هـ) متغيرًا أكثر بكثير من (ج) (42.37 مقابل 6.11). للتغلب على هذا القيد ، ابتكرنا مقياسين بديلين للتباين ، وهما التباين العددي المحلي للخلية (NV) وتغير الخلية النسبي المحلي (PV) (الشكل 5 أ). يعبر كلا المقياسين عن مدى اختلاف الخلية الفردية عن جيرانها المباشرين. يتم تطبيع NV بواسطة الحد الأقصى من mRNA لكل خلية لمجموعة الخلايا بأكملها ، وبالتالي فإن قيمة NV المرتفعة تسلط الضوء على الخلايا التي يكون اختلاف قيمة mRNA بها مع جيرانها المباشرين كبيرًا عدديًا من حيث المستوى الأقصى الذي يمكن فيه التعبير عن هذا الجين. يتم تطبيع PV بواسطة الحد الأقصى فقط للمجموعة المجاورة ، ولا تعني PV العالية بالضرورة اختلافًا كبيرًا في رقم mRNA الفعلي ، فقط أن الخلية لديها فرق نسبي كبير من جيرانها. كلا المقياسين يعيدان القيم بين 0 (لا يوجد تباين) و 1 (أقصى تباين). في السيناريوهات الموضحة في الشكل 5 c-f ، يستخدم 550 كأقصى عدد من السكان. يجد كل من NV و PV أن الخلايا المركزية في السيناريوهين (ج) و (هـ) متغيرة بشكل متساوٍ ، و (د) تكون أقل تغيرًا. الأهم من ذلك ، أن NV هو نفسه بين السيناريوهات (ج) و (هـ) و (و) ، نظرًا لأن الاختلاف العددي في الحمض النووي الريبي بين الخلية المركزية وكل جار هو نفسه ، بينما يجد PV سيناريوهات (ج) و (هـ) متناسبة متغير أكثر من (و).

أ صيغ عامل Fano ، وهو مقياس شائع الاستخدام لتغير الخلايا ، و NV و PV ، وهما مقياسان بديلين مصممان لالتقاط تقلب الخلية الفردية بشكل أفضل. ب خلايا من الشريط الأمامي لـ حواء التعبير في P. hawaiensis جنين النطاق الجرثومي المبكر ، مما يبرز أن الخلايا الفردية يمكن أن تختلف اختلافًا كبيرًا في التعبير عن جيرانها المباشرين. تشبه الخلية المركزية (السهم الأبيض) في اللوحة اليسرى جميع الخلايا المجاورة لها باستثناء خلية واحدة ، بينما تختلف الخلية المركزية في اللوحة اليمنى اختلافًا كبيرًا عن جميع الخلايا المجاورة لها باستثناء خلية واحدة. ج - و سيناريوهات افتراضية لتغير الرنا المرسال لمجموعة الجوار ، لتسليط الضوء على قدرة كل صيغة لالتقاط تباين الخلية المركزية المفردة (الحد الأحمر المتقطع). هنا ، يتم استخدام 550 mRNA / خلية كأقصى عدد من السكان. قام عامل Fano بإرجاع نفس القيمة بشكل غير صحيح لـ (ج) و (د) ، والعثور بشكل غير صحيح على (ه) لتكون أكثر متغيرًا من (ج). ترجع NV بشكل صحيح نفس القيمة لـ (ج ، ه و F) ، وقيمة منخفضة لـ (د). إرجاع PV بشكل صحيح نفس القيمة لـ (ج) و (ه) ، وقيم أقل لـ (د) و (F). ز تُظهر خرائط الحرارة مقاييس التباين الثلاثة المختلفة ، المحسوبة لكل خلية مجزأة للجنين (إجمالي 1982 خلية) ، لخمسة جينات: حتى تخطي, أحدب, عقبات, عملاق و كروبيل. يتم قياس النقاط التي تمثل الخلايا من حيث الحجم واللون حسب قيمة التباين. يمكن أن تتراوح قياسات NV و PV من 0 كحد أدنى إلى الحد الأقصى 1. بالنسبة لخرائط الحرارة الكهروضوئية ، تم ترشيح الخلايا وفقًا لمعايير مجموعة الجوار يعني عدد خلايا mRNA التي فشلت في هذا المعيار تم تعيين درجة 0.

تم حساب عامل Fano و NV و PV للجينات الخمسة الموضحة في الشكل 3 ، باستخدام الجيران المحدد بواسطة طريقة الكشف الآلي للجوار (الشكل 4). يتم عرض درجات التباين كخرائط حرارة (الشكل 5 ز). الخلايا خارج مجالات التعبير التي تحتوي على مرنا واحد ، محاطة فقط بالجيران غير المعبرين ، لديها أقصى درجة PV قدرها 1. بينما هذا صحيح ، كنا مهتمين أكثر بتمييز الخلايا التي تحتوي على PV عالية داخل مجالات التعبير الفعلي. لذلك ، عند حساب PV ، تم تصفية الخلايا وفقًا لمعايير مجموعة الجوار ، حيث تم تعيين درجة 0 من الخلايا التي تفشل في هذا المعيار. تُظهر خرائط الحرارة كيف يسلط عامل Fano و NV و PV الضوء على جوانب مختلفة من التباين. عامل Fano يختار حواف مجالات التعبير. إنه يعمل كمتوسط ​​متغير متحرك ، وبالتالي يبرز المناطق (ولكن ليس الخلايا الفردية) حيث يتغير رقم الحمض النووي الريبي أكثر مع الموضع. ضمن مجالات التعبير ، يكون عامل Fano منخفضًا بشكل عام ، مما يشير إلى مستوى تعبير مماثل. في المقابل ، يمكن لـ NV تسليط الضوء على الخلايا الفردية داخل مركز المجالات التي لها اختلاف كبير في عدد الرنا المرسال من الخلايا المجاورة التي تم تجاهلها بواسطة عامل فانو. على سبيل المثال ، عامل التباين NV و Fano kni و كر. يُبرز PV الخلايا الأكثر اختلافًا نسبيًا عن الخلايا المجاورة ، والتي تميل إلى أن تكون خلايا في الحواف القصوى للنطاقات ، عند الانتقال بين التشغيل والإيقاف. ومع ذلك ، لا يزال من الممكن ملاحظة الخلايا الفردية ذات PV عالية في جميع أنحاء مجالات التعبير لكل جين.


المواد والأساليب

دراسة الأنواع

Galerucella pusilla و G.Calmariensis دورات حياة مماثلة. يقضون الشتاء كبالغين ويظهرون في مايو في منطقة الدراسة ، وسرعان ما يبدأون في وضع البيض على أوراق أو ساق L. salicaria النباتات المضيفة. يستغرق البيض بضعة أسابيع حتى يفقس ، و 2-3 أسابيع حتى تفرز اليرقات ، و 2-3 أسابيع أخرى حتى يخرج البالغون من العذارى. في السويد، G. pusilla يحدث فقط في الجنوب وحتى وسط السويد حتى سوندسفال (N62 ° ، E17 °) ، بينما G.Calmariensis يتم توزيعها أيضًا في الشمال (Fors et al. 2014). على الرغم من التشابه المورفولوجي بين الأنواع ، يمكن تمييزها بناءً على عدة سمات. يرقات G.Calmariensis عادة ما يكون لونها أصفر ساطع ، في حين أن يرقات G. pusilla تميل إلى أن يكون لها نغمة صفراء أفتح (Hambäck 2004) ، ويمكن تمييز الذكور البالغين من خلال وجود توتنهام على meso- و metatibiae (Cossé 2004).

Asecodes parviclava هو دبور طفيلي داخلي صغير (& lt1 ملم) يضع بيضًا في يرقات G. pusilla و G.Calmariensis، وكذلك في الأنواع الإضافية ، G. تينيلا. بمجرد التطفل بنجاح ، تستهلك يرقات الطفيليات الجزء الداخلي من يرقات العائل وتعوق التشرنق. خلال الصيف التالي ، تفقس الطفيليات البالغة وتخرج بعد ذلك من المومياء المضيفة (Hansson and Hambäck 2013). يختلف معدل التطفل على النوعين المضيفين باختلاف المنطقة ولكن بشكل عام ، G. pusilla يعاني من معدل تطفل أقل من G.Calmariensis في حالة تواجدهما معًا (Fors et al. 2014). كل من أحداث التغليف والصباغ شائعة جدًا في G. pusilla يرقات مصابة بالدبابير ، بينما في G.Calmariensisونادرًا ما يتم ملاحظة تكوين الكبسولة وتصبغ بيض الزنبور. إذا حدث التغليف بنجاح عند التطفل ، يبدأ تكوين الكبسولة عادة في غضون 4-6 ساعات ويكتمل بعد -48 ساعة (Fors et al. 2014). أثناء عملية التغليف ، غالبًا ما تكون الكبسولة مصبوغة ويمكن ملاحظة بيض الطفيل المصبوغ بوضوح عند الهضم بعد 48 ساعة. عادةً ما يحدث التئام الجروح سريعًا في مواقع الجرح خلال الساعات القليلة الأولى بعد التطفل ، حيث يلعب التئام الجروح أيضًا دورًا في اسوداد الجرح.

بالنسبة لتجاربنا ، تم جمع الخنافس البالغة في الحقل في Iggön (60 ° 52′18 ″ N ، 17 ° 19′29 E) ، حيث يتواجد كلا النوعين معًا في منتصف مايو ، وتم تربيتها في المختبر في الغرفة درجة الحرارة. لكل نوع من أنواع الخنفساء ، تم وضع ستة حشرات من كلا الجنسين على أ L. salicaria زرع في قفص بلاستيكي شفاف. تزاوجت الخنافس عشوائياً ووضعت بيضها على أوراق النبات. تم إزالة اليرقات حديثة الفقس بنفس الحجم تقريبًا من الأقفاص لاستخدامها في تجربة التطفل عندما وصلت إلى المرحلة الثانية. تم أخذ عينات من إناث الطفيليات لتجارب التطفل من الشرانق المصابة بالطفيل في الموسم السابق. تم جمع الطفيليات من G.Calmariensis في منطقة مختلفة ذات معدلات تطفل عالية جدًا: Ällön (63 ° 13′46 ″ N ، 19 ° 4′59 E).

تجربة التطفل

لاستكشاف المسار الزمني للاستجابة المناعية لكلا النوعين ، أجرينا تجربة عدوى في عامي 2013 و 2014. تم تحضير جميع العينات في عام 2014 باستثناء مجموعات المعالجة اللاحقة لمدة 12 ساعة (السيطرة والعدوى) ، والتي أجريت في عام 2013. لعلاج العدوى ، تم وضع ثماني يرقات خنفساء من نفس النوع تم تربيتها في المختبر في حاوية بلاستيكية شفافة سعة 200 مل مع أربعة A. بارفيكلافا الإناث لمدة 4 ساعات لضمان الوقت الكافي للتطفل. أكدنا بصريًا أن جميع الدبابير شنت هجمات متعددة خلال أول 10 دقائق وأصبحت أقل نشاطًا بعد ساعة واحدة. تم بعد ذلك نقل اليرقات المتطفلة إلى أطباق بتري جديدة لمدة 1 و 4 و 12 ساعة للسماح بالاستجابات المناعية للمضيف. تم التعامل مع المجموعات الضابطة بنفس الطريقة ، باستثناء أنه لم يتم إدخال أي طفيليات. تم إنشاء ثلاث مكررات بيولوجية ، تتكون كل منها من ثماني يرقات فردية ، في كل مجموعة معالجة في G. pusilla، في حين أن عدد التكرارات البيولوجية يتراوح بين اثنين إلى أربعة في G.Calmariensis (الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت). في المجموع ، في جميع العلاجات ، 18 عينة لكل منها غاليروسيلا تم تحضير الأنواع للاستخراج والتسلسل.

الاستخراج والتسلسل

تم تجميع اليرقات الثمانية لكل مكرر في أنبوب إيبندورف واحد ، وتم تجميدها في النيتروجين السائل ، وتخزينها عند درجة حرارة -80 درجة. تم تجانس جميع العينات واستخراج الحمض النووي الريبي الكلي باستخدام TRIzol LS Reagent (Invitrogen) باتباع تعليمات الشركة المصنعة.تم إجراء فحص الجودة باستخدام مقياس الطيف الضوئي NanoDrop ومحلل بيولوجي 2100. تمت معالجة العينات التي تحتوي على 260/280 و 260/230 بالقرب من أو أعلى من اثنين وبدون أي تدهور شديد مرئي على مخطط الفحص الكهربائي Aligent RNA 600 Nano Assay لإعداد المكتبة. تم إرسال جميع العينات الـ 36 (كما هو موضح في الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت) إلى SciLifeLab Stockholm لإعداد المكتبة وتسلسلها. على وجه التحديد ، تم إعداد 26 مكتبة من مجموعات المعالجة اللاحقة لمدة 1 و 4 ساعات في كلا النوعين مرة واحدة وتسلسلها في مسارين على نفس خلية التدفق ، في حين تم ترتيب عشر مكتبات من مجموعات معالجة 12 ساعة في حارة واحدة. تم إنشاء مكتبات الحمض النووي الريبي المخصب بـ Poly-A ، وتم إقران المكتبات فقط ذات التركيز و gt10 نانومتر بنهاية 2 × 125-بي بي على منصة HiSeq 2500 (Illumina).

ربما حدث التباين في التعبير الجيني بين التكرارات لأسباب لم نتمكن من السيطرة عليها. على سبيل المثال ، لم نتمكن من التحكم في عدد البيض الذي وضعته إناث الطفيليات في التجربة ، مما قد يؤدي إلى اختلاف في كل من قوة وتوقيت العدوى على المستوى الفردي وبالتالي إلى اختلافات في التعبير الجيني المناعي. علاوة على ذلك ، كان من الممكن تخفيف مستويات التعبير عن الجينات المهمة المرتبطة بالمناعة عن طريق تجميع ثمانية أفراد في كل عينة ، أو عن طريق استخدامنا لليرقات بأكملها بدلاً من أنسجة الغدة المحددة لأخذ عينات من الحمض النووي الريبي.

تجميع النسخ والتصفية

في المجموع ، 337 مليون G. pusilla و 310 مليون G.Calmariensis تمت معالجة القراءات الأولية الزوجية من جميع المكتبات أولاً إلى Stacks 2.0b من خلال clonefilter لإزالة تكرارات تفاعل البوليميراز المتسلسل (Catchen et al. 2013). تمت إزالة Ribosomal RNA باستخدام SortMeRNA v2.1 (Kopylova et al. 2012) ، وبعد ذلك تم إجراء Trimmomatic v0.32 (Bolger et al. 2014) لإزالة المحولات وقراءات منخفضة الجودة ، مما أدى إلى 271 و 224 مليون قراءة مزدوجة النهاية. ل G. pusilla و G.Calmariensis، على التوالى.

أجرينا مراقبة الجودة باستخدام FastQC v0.11.5 (Babraham Bioinformatics 2011) قبل التصفية وبعدها. يقرأ فقط 40 نقطة أساس وبدرجة جودة أعلى من 25 في كل من بداية القراءة والنهاية. تم تطبيع القراءات النظيفة لكلا النوعين باستخدام TRINITY v2.1.0 في silico تطبيع (Grabherr et al. 2011) لإزالة فائض كبير من القراءات المطابقة للنصوص المعتدلة والشديدة التعبير. تم دمج البيانات الناتجة وتوحيدها مرة أخرى قبل التجميع. تم إجراء تجميع نسخة De novo من القراءات باستخدام TRINITY 2.1.0 (Grabherr et al. 2011) مع المعلمات الافتراضية. في المجموع ، تم إنشاء 195422 جينًا مفترضًا و 262.505 نسخة من النسخ G. pusilla، في حين تم الحصول على 224904 جينات مفترضة و 300593 نسخة G.Calmariensis.

لتصفية النسخ بشكل أكبر ، قمنا بتشغيل DETONATE v1.11 (Li et al. 2014) لحساب الدرجات المستندة إلى النموذج التي تصف مدى جودة دعم contigs بواسطة بيانات RNA-Seq. في المجموع ، تم قطع 42،166 و 57،165 contigs مع درجات سلبية عبر جميع العينات من G. pusilla و G.Calmariensis التجميع الخام ، على التوالي.

من أجل إزالة التكرار الناتج عن تجميع النسخ ولتحسين جودة النصوص ، تمت معالجة مجموعة النسخ باستخدام خط أنابيب EvidenceGene tr2aacds (Nakasugi et al. 2014). بدأ خط الأنابيب باستنتاج تسلسل الحمض النووي المشفر (CDS) وتسلسل الأحماض الأمينية لكل contig ، ثم تم تشغيل fastanrdb و CD-HIT-EST و BLAST لتحديد أفضل CDS بناءً على الهوية والمحاذاة مع بعضها البعض. تم تصنيف مجموعة المخرجات من النصوص على أنها "رئيسية" و "بديلة" و "مسقطة" ، والتي لم تمر بمرشحات (Nakasugi et al. 2014 Postnikova et al. 2015). تم استخدام المجموعة "الرئيسية" فقط من تجميعات de novo في التحليلات اللاحقة. لتصفية التلوث من التجميع ، قمنا بتشغيل Kraken v1.0 (Wood and Salzberg 2014) لإزالة البكتيريا والعتيقات والفيروسات والبشر والمصادر النباتية (تم تنزيله من RefSeq سبتمبر 2017). في المجموع ، 484 و 528 ملوثات ملوثة من G. pusilla و G.Calmariensis أزيلت.

أخيرًا ، قمنا بتصفية جينات الطفيليات المحتملة عن طريق تعيين النسخ إلى ناسونيا فيتريبينيس البروتينات وإزالة القراءات التي تم تعيينها بشكل فريد إلى ناسونيا فيتريبينيس (التغطية 99.5٪ كحد أقصى). حدد هذا الإجراء 164 و 165 جينة طفيلي مرشحة من G. pusilla و G.Calmariensis التجمع ، على التوالي. أخيرًا ، احتفظنا فقط بالجينات التي تم التعبير عنها في العينات المعالجة بالعدوى لأنه لا يُفترض أن توجد جينات الدبور في العينات غير المصابة ، مما أدى إلى 144 و 145 جينة طفيلي. لم يلاحظ أي نمط تعبير تفاضلي في هذه الجينات بين أي مقارنات زوجية في مجموعات العلاج.

تقييم الجودة والشرح التوضيحي لتجميع النسخ

استخدمنا Benchmarking Universal Single-Copy Orthologs (BUSCO) من OrthoDB (_v1.22) (Simão et al. 2015) لقياس مدى اكتمال النسخ المجمعة من de novo من خلال البحث عن تقويم العظام المحفوظة بنسخة واحدة. يحدد تقييم تجميع BUSCO أولاً المناطق المرشحة من الجينوم / النسخ ليتم تقييمها باستخدام عمليات بحث TBlastN باستخدام تسلسل توافق BUSCO. يتم بعد ذلك توقع الهياكل الجينية وتقييمها باستخدام ملفات تعريف BUSCO الخاصة بنسب HMMER (في حالتنا ، ملفات تعريف BUSCO المفصلية كقاعدة بيانات) لتصنيف التطابقات على أنها كاملة أو مكررة أو مجزأة أو مفقودة. توفر هذه الأداة عملية تحقق خالية من الجينوم / خالية من المراجع لاكتمال تجميع النسخ وتتيح المقارنة بين التجميعات المتعددة.

لقد قمنا بمحاذاة مقايضات التخلف عن السداد الخاصة بنا مقابل الموجود D. melanogaster البروتيوم (تم تنزيله من NCBI في عام 2017) والعكس باستخدام BlastX v2.5.0 + مع ملف ه-قيمة القطع ≤10 −5 لمقارنة وجود الجينات في مجموعتنا مع D. melanogaster. قمنا أيضًا بمقارنة مقايضات التخلف عن السداد الخاصة بنا مع الأقرباء تريبوليوم كاستانيوم باستخدام نفس النهج والجينات المناعية المرشحة المحددة بشكل عام (الجدول التكميلي S3 ، المواد التكميلية عبر الإنترنت) بناءً على أطباء تقويم العظام في تريبوليوم (زو وآخرون 2007). للحصول على فهم أفضل للتشابه والاختلاف بين الأنواع ، أجرينا انفجارًا متبادلاً بين النوعين غاليروسيلا الأنواع في كل من مستوى النسخة الكاملة والنصوص المعبر عنها بدرجة عالية والتي تحتوي على متوسط ​​عدد قراءة أعلى من 10 عبر جميع العينات.

من أجل توسيع الاستدلالات الوظيفية على نطاق أوسع ، تم استخدام EggNOG v4.5 (Huerta-cepas et al. 2016) لتعيين مصطلحات الشرح الوظيفي وعلم الوجود الجيني (GO) للنصوص. تمت ترجمة النصوص أولاً إلى أحماض أمينية ثم إرسالها إلى EggNOG مع مفصليات الأرجل كنطاق تصنيفي و DIAMOND كبرنامج بحث.

تحليل التعبير التفاضلي

تم تعيين جميع العينات إلى النسخ المرجعية بواسطة Salmon v0.9.1 مع أعلام محددة لـ “–gcbias and –seqbias” (Patro et al. 2017). كانت معدلات رسم الخرائط متشابهة بين العينات (77٪ إلى 82٪). مصفوفة تحتوي على أعداد القراءة الموزونة المخصصة للجين أنا في العينة ي تم إنشاؤه وتحويله باستخدام تطبيع "تعبير السجل النسبي" المطبق في Deseq2 (Love et al. 2014). ثم تم استخدام Deseq2 لاختبار التعبير الجيني التفاضلي من خلال استخدام النماذج الخطية المعممة ذات الحدين السالبة. مكتبات مشتقة من نفس العينات (ن = 12 من أجل G. pusilla و ن = 14 من أجل G.Calmariensis، مكررات تقنيتان لكل عينة) أولاً من خلال وظيفة "-collapseReplicates". نظرًا لأن العينات من 12 ساعة تم جمعها وتسلسلها في عام مختلف ، فقد قمنا بتحليل عينات 12 ساعة بشكل منفصل عن الآخرين (1 و 4 ساعات) ، للتأكد من أن اختلاف التعبير المكتشف له صلة بيولوجيًا حقًا وليس بسبب الاختلافات في الإجراءات التجريبية ، التعامل أو التسلسل بين سنوات أخذ العينات. على وجه التحديد ، في مجموعة البيانات المكونة من عينات من 1 إلى 4 ساعات ، تمت مقارنة المعالجات مع بعضها البعض لتصحيح الاختلاف الناتج عن الوقت والمعالجة حسب الوقت. استخدمنا اختبار نسبة الاحتمالية لتحديد ما إذا كان العلاج وحده يؤدي إلى تغيير في التعبير الجيني في أي وقت من خلال مقارنة النموذج الكامل (∼ الوقت + العلاج + الوقت: العلاج) بالنموذج المصغر (الوقت + العلاج). بالنسبة لعينات مدتها 12 ساعة ، طبقنا النموذج الكامل (المعالجة) على النموذج المصغر (∼1) لأنه يتم تضمين نقطة زمنية واحدة فقط في مجموعة البيانات. ص تم تعديل القيم للاختبارات المتعددة للتحكم في معدل الاكتشاف الخاطئ (بنجاميني وهوتشبيرج 1995) والنصوص فقط مع تعديل ص تم تصنيف القيمة & lt0.05 على أنها معبر عنها تفاضليًا.

تم إجراء اختبار التخصيب GO لفئات العمليات البيولوجية بواسطة حزمة الموصلات الحيوية topGO (Alexa و Rahnenfuhrer 2010). كانت جينات الخلفية المضمنة في اختبار تخصيب GO هي تلك النصوص ذات مصطلحات GO الحالية في شرح EggNOG الخاص بنا. الجينات المعبر عنها تفاضليًا (DEGs) من مقارنات كل دورة زمنية عند اختبارها بعد ذلك للتخصيب مقابل الخلفية بناءً على اختبار فيشر الدقيق (ص & lt 0.05). بعد ذلك ، تم تبسيط قوائم مصطلحات GO المخصبة وتجميعها إلى مجموعات فرعية وظيفية تمثيلية باستخدام REVIGO ذبابة الفاكهة قاعدة البيانات (Supek وآخرون 2011). أخيرًا ، بحثنا في التعليقات التوضيحية لدينا عن مجموعة فرعية من الجينات المعروفة بأهميتها في الاستجابة المناعية ضد هجوم الدبابير الطفيلي في ذبابة الفاكهة. يتضمن ذلك قائمة من 166 جينًا تشارك في الإشارات ، والمستجيب ، والبروتياز ، والتعرف ، والتئام الجروح ، والصباغ ، وخلايا الدم (تكاثر وتمايز خلايا الدم) ، وتنظيم خلايا الدم (تنظيم التمايز والتكاثر) (Zettervall et al. 2004 Salazar-Jaramillo et 2014). من أجل استكشاف وجود وتنوع الجينات المرتبطة بالمناعة في كلتا مجموعتي النسخ ، بحثنا في الجينات المناعية في ذبابة الفاكهةالشرح المستند إلى. قمنا أيضًا بفحص مجموعة البيانات الخاصة بنا لتحديد ما إذا تم التعبير عن أي من هذه الجينات بشكل تفاضلي.


نتائج

يتم حفظ التعبير الجيني الظهاري المعوي في الفقاريات

من أجل فهم مدى تشابه التعبير الجيني عبر الظهارة المعوية للفقاريات ، قمنا بمقارنة بيانات التعبير الجيني التي تم إنشاؤها حديثًا من IECs المعزولة من القولون البشري البالغ ، وأمعاء الزرد البالغة ، وأمعاء أبو شوكة البالغة ، ومن البيانات التي أنشأناها سابقًا من القولون والدقاق بالفأر البالغ [16] (الشكل 1 أ). نجد ارتباطًا قويًا في التعبير الجيني بين IECs الأسماك والثدييات في جميع أنحاء النطاق الديناميكي للنسخة (الشكل 1B و 1 C ، S1A الشكل). باستخدام تحليل المكون الرئيسي (PCA) والتكتل الهرمي ، نجد أن التعبير عن الجينات المتعامدة أكثر تشابهًا بين IECs عبر الأنواع من الفئران IECs لأنسجة الفئران الأخرى (الشكل 1B – 1E ، S1 و S2 Figs). علاوة على ذلك ، بيانات تسلسل الحمض النووي الريبي (RNA-seq) غير ذات الصلة من مجموعة أمعاء الفأر الكاملة مع بيانات من جميع IECs الفقارية (الشكل 1D و 1E) [29]. تكشف هذه النتائج أن مستويات التعبير الجيني في IECs متشابهة عبر هذه الأنواع الفقارية الأربعة وتشير إلى أن العديد من جوانب فسيولوجيا IEC قد تم الحفاظ عليها منذ السلف المشترك للثدييات والأسماك.

(أ) (يسار) شجرة النشوء والتطور تظهر الوقت منذ سلف مشترك للإنسان (الانسان العاقل)، الفأر (موس العضلات) ، الزرد (دانيو ريريو) و stickleback (Gasterosteus aculeatus) محيط. (يمين) مخططات مبسطة توضح القناة المعوية لجميع الكائنات الحية الأربعة باللون الرمادي مع لون منطقة عينة IEC التي تم جمعها: أخضر (القولون البشري IECs) ، برتقالي (اللفائفي الفأري IECs) ، أحمر (القولون الفأري IECs) ، أزرق (الأمعاء الكاملة للزرد) IECs) ، والأرجواني (الأمعاء الكاملة الشوكة IECs). (ب) مخطط مبعثر للشظايا لكل كيلوباز من النسخة لكل مليون قراءة معيّنة (FPKM) لأخصائيي تقويم العظام من 1 إلى 1 من دقاق الفأر وعينات IEC الزرد تظهر معامل ارتباط موجب (بيرسون) ص 2 = .273 سبيرمان ص 2 = .416). (ج) مثل (B) لقولون الفأر IECs و IECs الزرد (Pearson ص 2 = .341 سبيرمان ص 2 = .379). (د) يُظهر التحليل الكامل لمجموعة الروابط باستخدام قيم FPKM لأخصائيي تقويم العظام تشابهًا بين مستويات mRNA لـ IECs مقارنة بأنسجة الماوس الأخرى. يمثل المقياس قيم مسافة بيرسون. مجموعات البيانات السوداء المميزة بعلامات نجمية هي تجارب تسلسل الحمض النووي الريبي (RNA-seq) من أنسجة غير IEC [29]. (هـ) مخطط مبعثر للمكون الرئيسي 1 و 2 (PC1 و PC2) باستخدام تحليل المكون الرئيسي (PCA) لقيم FPKM لجميع مجموعات بيانات IEC وأنسجة الماوس الأخرى. (F) أهم مصطلحات علم الجينات (GO) التي تم الإبلاغ عنها ومسارات موسوعة كيوتو للجينات والجينوم (KEGG) من قاعدة البيانات لتصور التعليقات التوضيحية والاكتشاف المتكامل (DAVID) باستخدام جينات توقيع IEC. إن إثراء هذه المجموعات الجينية لا يمسح عتبات تصحيح Bonferroni (جدول S2). (ز) تظهر الأنسجة العلوية تداخلًا مع جينات توقيع اللجنة الكهروتقنية الدولية من أطلس الجينات البشرية والفأرية باستخدام Enrichr. (ح) لقطة شاشة من جامعة كاليفورنيا سانتا كروز (UCSC) لمستويات تسلسل الحمض النووي الريبي في كاديرين 17 (CDH17) في 4 أنواع من IECs (أعلى) وأنسجة أخرى (أسفل) [29] يظهر التعبير مقصورًا إلى حد كبير على IECs.

في PCA الخاص بنا لتعبير mRNA من IECs وأنسجة الفئران ، وجدنا أن المكون الرئيسي 1 (PC1) فصل الثدييات والأسماك IECs من جميع الأنسجة الأخرى. حددنا 470 جينًا ترتبط مستويات تعبيرها ارتباطًا وثيقًا بـ PC1 وتظهر تعبيرًا عاليًا في IECs بالنسبة إلى الأنسجة الأخرى ، على الرغم من أن تعبيرها ووظيفتها لا يقتصران بالضرورة على IECs (الشكل 1D و 1E ، S1 الشكل ، جدول S1 ، المواد والطرق). تمثل جينات توقيع IEC هذه الوظائف الفسيولوجية وأنواع الخلايا في ظهارة الأمعاء وتشمل الجينات المشاركة في التمثيل الغذائي للدهون والكربوهيدرات والبروتين (الشكل 1F و 1G ، جدول S2). جينات توقيع IEC ، بما في ذلك بروتين ربط الريتينول 2 (RBP2، مع rbp2a تم تعيينه كطبيب تقويم الزرد من قبل Ensembl) ، بروتين رابط للأحماض الدهنية 6 (فاب 6) و cadherin 17 (CDH17) ، من بين الجينات الأكثر تعبيرًا في IECs من عدة أنواع (الشكل 1H ، S1D الشكل). بالإضافة إلى ذلك ، حددنا الجينات التي تشير إلى أنواع فرعية مختلفة من IEC داخل ظهارة الأمعاء بما في ذلك RBP2 [30] و فاب 6 (خلية معوية) [31] ، ببتيد YY (PYY الغدد الصماء المعوية) [32] ، وبولي ببتيد N-acetylgalactosaminyltransferase 6 (جالنت 6 الخلايا الكأسية) [33] ، بما يتوافق مع بيانات RNA-seq التي تمثل مجموعات غير متجانسة من IECs (الشكل S1D). كما تم تمثيل جينات البروتين الريبوزومي ومكونات الترجمة بشكل كبير في هذا التوقيع ، بما يتفق مع كون الظهارة المعوية واحدة من أكثر الأنسجة انتشارًا [33]. من بين جينات توقيع IEC ، وجدنا أن TFs معروفة بأنها متورطة في التطور والوظيفة في الأمعاء ، بما في ذلك E26 الخاص بالتحول (ETS) TF ELF3 [34], HNF4A [18], HNF4G [35], FXR [36], جاتا 5 [37] و OSR2 [38] ، مما يشير إلى شبكة نسخ IEC أساسية محفوظة. العديد من TFs التي تحمل توقيع IEC لها ارتباطات معروفة بأمراض الأمعاء الالتهابية البشرية (IBD) ، بما في ذلك SMAD7 [39], CEBPG [40], STAT3 [40–42], XBP1 [43], HNF4A [44], ELF3 [41], IRF1 [45] ، ومكونات NFκB IKBKB, IKBKG، و NFKBIZ [46]. علاوة على ذلك ، كانت الاضطرابات البشرية الأكثر شيوعًا المرتبطة بجينات توقيع IEC هي السمات المرتبطة بالسمنة ، و IBD ، ومرض السكري من النوع 2 (جدول S1). تسلط هذه البيانات مجتمعة الضوء على فائدة الفأر وسمك الزرد والشوكة في نمذجة تطور الأمعاء البشرية والمرض وتقترح تشابهًا أساسيًا في آليات النسخ الكامنة وراء التوازن الظهاري المعوي في الفقاريات.

دليل للحفاظ على النسخ والتنظيم على طول الأمعاء

كشفت النتائج الموصوفة أعلاه عن تواقيع IEC محفوظة عن طريق مقارنة مستويات الحمض النووي الريبي من IECs المعوية إلى الأنسجة الأخرى. ومع ذلك ، فقد توقعنا أن تواقيع الهوية المعوية يمكن حلها بشكل أكبر من خلال مقارنة التعبير الجيني على طول المحور الأمامي الخلفي للأمعاء في أسماك الزرد والفئران. باستخدام مجموعات البيانات المنشورة سابقًا ، حددنا أخصائيي تقويم العظام الذين أظهروا أنماط تعبير مماثلة على طول أمعاء سمك الزرد البالغة (مقسمة إلى 7 أقسام متساوية الطول) [15] وعلى طول أمعاء الفأر البالغة (مقسمة إلى الاثني عشر ، والصائم ، والدقاق ، والقولون) (الشكل 2 ، S3 الشكل ، المواد والطرق) [47]. من بين 493 جينًا أظهر تعبيرًا عاليًا في الجزء الأمامي من أمعاء الزرد ، وجدنا أكثر من 70 جينًا لها نفس التعبير العالي في الأمعاء الأمامية للفأر [15] ، بما في ذلك جينات توقيع IEC مثل Rbp2, الدوب، و إحدة (الشكل 2 أ و 2 ب ، S3 الشكل). العديد من هذه الجينات (على سبيل المثال ، Fabp2, Acsl5, أغبات 2, Slc27a4، و Dgat2) مهمة في استقلاب الدهون وامتصاصها ، وهو ما يتوافق مع امتصاص الدهون والتمثيل الغذائي الذي يحدث غالبًا في الأمعاء الدقيقة في الفأر والجزء الأمامي من الأمعاء في الزرد [48]. ومع ذلك ، فإن ترتيب الجينات حسب مستوى التعبير عن الاثني عشر للفأر يكشف أن بعض هذه الجينات لديها أوجه تشابه عالية بشكل مدهش في أنماط التعبير عبر الأنواع على طول الأمعاء (الشكل 2 أ و 2 ب ، S3C الشكل). على سبيل المثال ، ديميناز الأدينوزين (آدا) ، والذي يتم التعبير عنه بشكل كبير في الاثني عشر في الفأر [49] ، يتم التعبير عنه بشكل كبير في أقسام أسماك الزرد 1-2 (الشكل 2 ب ، S3C الشكل). بصورة مماثلة، Fabp2 و انبيب، والتي يتم التعبير عنها بشكل كبير في الصائم والدقاق في الماوس ، يتم التعبير عنها بشكل كبير في الأقسام 3-5 في أمعاء الزرد (الشكل 2C و S3C الشكل). يشير هذا إلى وجود تشابه غير مُقدَّر بين التعبير الجيني لـ IEC على طول الأمعاء الدقيقة في الثدييات (الفأر) والتليوست (الزرد) وإمكانية وجود أمثلة أخرى على التقسيم الفرعي في أمعاء الزرد التي لم يتم وصفها سابقًا [13-15].

(أ) خريطة حرارية تقارن درجات z الجينية المتمركزة في المتوسط ​​لأخصائيي تقويم العظام من 1 إلى 1 من مجموعات البيانات المنشورة سابقًا والتي تحدد مستويات التعبير على طول طول سمكة الزرد [15] وأمعاء الفأر (المواد والطرق ، الشكل S3) [47]. يتم ترتيب الجينات المعبر عنها بالمثل حسب قيم تعبير الماوس (أ) أو المناطق، (ب) الصائم (ج) الدقاق و (د) القولون. أسماء الجينات ذات العلامات النجمية هي أيضًا جينات توقيع الخلايا الظهارية المعوية (IEC) كما هو محدد في الشكل 1. يمكن أن توجد الجينات في تكوينات فرعية متعددة.

لدعم هذه المواصفات الإقليمية المحفوظة ، وجدنا أيضًا مجموعة صغيرة من الجينات التي يتم التعبير عنها بشكل كبير فقط في الجزء النهائي من الأمعاء الأمامية لسمك الزرد (القسم 5 [15]) ، والتي تحتل موقعًا مشابهًا لدقاق الثدييات (الشكل 2C) والتين S3D). دقاق الثدييات متورط في امتصاص الأملاح الصفراوية بعد استخدامها في استحلاب الدهون في الأمعاء الدقيقة الأمامية [50]. جينات توقيع IEC تشارك في التعامل مع الصفراء ، فاب 6 و Slc10a2، تظهر تعبيرًا عاليًا في هذه المنطقة الضيقة من أمعاء الزرد ودقاق الماوس (الشكل 2C و S3D الشكل). بالإضافة إلى البروتياز Lgmn, Scpep1، و 3 كاتيبسين في هذه المجموعة وتظهر تعبيرًا عاليًا مشابهًا إلى حد كبير في اللفائفي الفأري ، مما يشير إلى استخدام محفوظ إقليميًا من التحلل بوساطة الليزوزومال كاثيبسين (الشكل 2C و S3D الشكل) [51]. تشير هذه الملاحظات إلى أن التمايز الخلوي والبرامج الفسيولوجية المنتشرة في هذه المنطقة من أمعاء الزرد مخصصة لاستعادة ملح الصفراء ، مع تشابه قوي مع دقاق الثدييات. وجدنا أيضًا العديد من الجينات المعبر عنها بدرجة أكبر في النهاية الخلفية لأمعاء الفأر وأسماك الزرد ، مما يشير إلى وظائف فسيولوجية مماثلة في الأمعاء البعيدة لسمك الزرد وقولون الفأر (الشكل 2D و S3E و S3F) [15]. بشكل جماعي ، تشير هذه الملاحظات إلى أن الأمعاء البعيدة لديها القدرة على التعبير عن أنماط تمايز الجينات المعقدة على طول الأمعاء التي تشبه وظيفيًا ومكانيًا الأجزاء الموجودة في أمعاء الثدييات البعيدة تطوريًا.

يحدد التنميط الكروماتين الذي يمكن الوصول إليه لـ IECs في 4 أنواع المناطق التنظيمية المفترضة لـ IEC

لاختبار الفرضية القائلة بأن المناطق المحفوظة من الكروماتين الذي يمكن الوصول إليه تكمن وراء أوجه التشابه النسخية التي وجدناها في IECs ، قمنا بتوصيف الكروماتين الذي يمكن الوصول إليه في نفس تحضيرات الخلية التي استخدمناها لإنشاء بيانات RNA-seq الخاصة بنا باستخدام عزل تسلسل العناصر التنظيمية بمساعدة الفورمالديهايد (FAIRE- seq) من أبو شوكة وسمك الزرد والقولون البشري IECs. استخدمنا أيضًا البيانات التي تم نشرها مؤخرًا من مجموعتنا والتي حددت لمحة عن دقاق الفأر والقولون IECs باستخدام تسلسل المواقع شديدة الحساسية DNase I (DNase-seq) [16]. سمح لنا الجمع بين خرائط الكروماتين التي يمكن الوصول إليها من قبل IEC مع المعالم التنظيمية القابلة للتحويل للأنواع مثل موقع بدء النسخ (TSS) والعناصر غير القاتلة المحفوظة (CNEs) بتشكيل وتحديد المعلومات التنظيمية المشتركة المستخدمة في جميع الأنواع. تم إثراء قمم الكروماتين التي يمكن الوصول إليها بشكل متكرر في TSS المتعامد في IECs ، بما في ذلك جينات توقيع IEC مثل ELF3 (الشكل 3 أ ، الجدول S3 والشكل S2). تتوافق إشارة الكروماتين التي يمكن الوصول إليها مع التوزيعات النموذجية على مستوى الجينوم ، على الرغم من أن العلاقة مع إمكانية الوصول قد لا تكون مدفوعة بشكل صارم بالمناطق التنظيمية أو النسخ الخاص بـ IECs (الشكل 3 ب و 3 ج). ومع ذلك ، فإن قيم ارتباط IEC PC1 ذات الصلة ، ومستويات النسخ ، ووجود جينات توقيع IEC كانت أعلى في المتوسط ​​في TSS مع مستويات كروماتين أعلى يمكن الوصول إليها ، مما يشير إلى أن حجم الكروماتين الذي يمكن الوصول إليه أو وجوده يمكن حفظه في المناطق التنظيمية ذات الصلة في IECs في الأنواع ذات الصلة البعيدة (الشكل 3 ب و 3 ج ، S4A و S4B الشكل).

(أ) بيانات تسلسل الكروماتين والحمض النووي الريبي (RNA-seq) التي يمكن الوصول إليها من التكرارات التمثيلية لجين توقيع IEC ELF3 لكل كائن حي. لكل كائن حي ، يتم تمثيل النماذج الجينية بأشرطة سميكة (exons) وأشرطة رفيعة (إنترونات ومناطق غير مترجمة). (ب) إشارة الكروماتين التي يمكن الوصول إليها عند 1000 نقطة أساس المحيطة بموقع بدء النسخ (TSS) لأخصائيي تقويم العظام من 1 إلى 1 إلى 1 إلى 1 التي طلبها الزرد IEC عزل بمساعدة الفورمالديهايد لإشارة تسلسل العناصر التنظيمية (FAIRE-seq) في إشارة ينسق زوج القاعدة من TSS للجين لأسماك الزرد ، وشوكة أبو شوكة ، ودقاق الفأر ، وقولون الفأر ، والقولون البشري (يمين). يتم عرض المتوسطات المتحركة (يسار) لقيمة ارتباط PC1 المستخدمة لتحديد جينات توقيع IEC (نافذة 500 جين ، خطوة جينية واحدة سوداء) ، شظايا لكل كيلوباز من النص لكل مليون قراءة (FPKM) للجينات المرتبطة (250 نافذة جين ، 1 جين) مخطط ألوان الخطوة استنادًا إلى مجموعات البيانات المقدمة في A وطوالها) ، ويتم تمييز جينات توقيع IEC بأشرطة أفقية سوداء. (ج) يُبرز الوسيط المتحرك لإشارة الكروماتين التي يمكن الوصول إليها في TSS لشوكة أبو شوكة والدقاق والفأر وقولون الفأر والإنسان الذي تم طلبه بواسطة إشارة في TSS الزرد (نافذة جين 250 ، خطوة واحدة) العلاقة بين بيانات الكروماتين التي يمكن الوصول إليها من قبل IEC في أنواع متعددة. يمكن العثور على القيم العددية في جدول S1. (د) خريطة حرارة لتحليل الكتلة للتداخل بين مكالمات ذروة الكروماتين التي يمكن الوصول إليها لعينات IEC ومجموعات بيانات الكروماتين الإضافية المنشورة التي يمكن الوصول إليها مع المنطقة 1000 نقطة أساس في المنبع من TSS (TSS-1000 نقطة أساس) لجينات توقيع IEC (الأشرطة الحمراء). يتم تمثيل التداخل بين TSS-1000 نقطة أساس ومقاييس الحفظ بأشرطة زرقاء. يتم تمثيل العدد الإجمالي للتداخلات بين أقواس لكل عمود من أعمدة قياس الحفظ ، ويتم تعريف التداخلات على أنها تحتوي على زوج أساسي مشترك واحد على الأقل. تُستخدم الأحرف الأولى لتحديد مجموعات بيانات IEC: Zebrafish و S Stickleback و MI Mouse Ileum و MC Mouse Colon و HC Human Colon. (هـ) صورة مقربة للخريطة الحرارية للجينات المجمعة من اللوحة ثلاثية الأبعاد التي أظهرت في كثير من الأحيان كروماتينًا مفترضًا محفوظًا يمكن الوصول إليه في TSS في عينات IEC (أزرق فاتح وأخضر). نظام الألوان مشترك مع ثلاثي الأبعاد. (F) خريطة حرارية تسلط الضوء على إثراء عزر مواقع ربط عامل النسخ الشائعة (TFBS) داخل قمم الكروماتين التي يمكن الوصول إليها والتي تقع بين المنطقة 10000 نقطة أساس في المنبع من TSS و 10000 نقطة أساس في اتجاه موقع إنهاء النسخ (TTS) لجينات توقيع IEC. يشمل إثراء الحافز عوامل النسخ المعروفة (TFs) المتضمنة في بيولوجيا IEC والتي يتم التعبير عنها أيضًا بشكل كبير في عينات IEC الخاصة بنا. تشتمل عوامل التحويل الخاصة بـ E26 (ETS) على نماذج لـ ELF5 و EHF و ELF1 و GABPA و ETS و Elk1 و Fli1 و Elk4 و ETS1 و ERG و SPDEF و EWS: FLI. (ز) النسبة المئوية لقواعد الحمض النووي التي تكون إما أدينوزين أو ثايمين (AT٪) (20 نقطة أساس سلسة: نافذة 20 نقطة أساس ، خطوة 1 نقطة أساس) تحيط بـ TSS حسب طلب إشارة IEC zebrafish FAIRE من (B) وإشارة IEC mouse Ileum DNase (يمين) يظهر أنماط غير عشوائية في TSS أن (ح) تختلف في المتوسط ​​من نوع إلى نوع. (أنا) مقارنة نسبة AT (20 نقطة أساس سلسة) في العناصر غير القاتلة المحفوظة (CNEs) التي تظهر بطبيعتها بعض تكوين تسلسل مماثل.

قارنا تداخلات مكالمات TSS التي يمكن الوصول إليها في TSS لجميع عينات IEC والعديد من خطوط الخلايا والأنسجة من موسوعة عناصر الحمض النووي البشرية والفأر (ENCODE) / خارطة الطريق [52-54] لتحديد ما إذا كانت حالة الكروماتين التي يمكن الوصول إليها يمكن أن تحدد مناطق معينة من IEC. قمنا بتجميع هذه المعلومات لتحديد الأنماط الشائعة لحالة الكروماتين التي يمكن الوصول إليها في جميع هذه العينات (الشكل ثلاثي الأبعاد). في حين يبدو أن غالبية مناطق TSS يمكن الوصول إليها بشكل أساسي في معظم الجينات في معظم الأنواع والأنسجة الممثلة ، فإن مجموعة من جينات توقيع IEC لديها TSS يمكن الوصول إليها بشكل متكرر في IECs ولكن في كثير من الأحيان في الأنسجة الأخرى (الشكل 3E). الأهم من ذلك ، كان من الممكن أيضًا الوصول إلى الجينات داخل هذه المجموعة دائمًا تقريبًا في TSS في العديد من مجموعات البيانات المستقلة للأنسجة المعوية من الفئران والبشر (الشكل 3E). تضمنت هذه المجموعة الجينات الرئيسية المشاركة في بيولوجيا IEC مثل HNF4A, HNF4G, RBP2, A1CF, CFTR، و CDH17. علاوة على ذلك ، وجدنا 3 جينات ، فاب 6, SLC10A2، و TMIGD1، الذي أظهر تشابهًا كبيرًا في مستويات الرنا المرسال على طول الأمعاء عند دقاق الماوس وقسم الزرد 5 (الشكل 2 ج) وأظهر إمكانية وصول محدودة في الأنسجة غير المعوية مع إمكانية الوصول في بعض مجموعات البيانات المتعلقة بالأمعاء (الشكل 3E).

لتحديد ما إذا كانت المناطق التي تُظهر إمكانية الوصول إلى الكروماتين بشكل كبير في IECs أظهرت أيضًا الحفاظ على مستوى التسلسل ، استخدمنا مقاييس متعددة تقيس حفظ التسلسل من teleost إلى الثدييات. وشمل ذلك عناصر غير سامة محفوظة لأسماك الزرد (zCNEs) ، وهي مقارنة صارمة للمناطق غير المشفرة لـ 14 نوعًا ، بما في ذلك الإنسان والفأر [55]. استخدمنا أيضًا UCSC liftOver و zebrafish-to-human و zebrafish-to-Mouse-to-mouse block format (MAF) لتحديد المناطق التي يحتمل أن تكون محفوظة في الحمض النووي. على الرغم من أن المقاييس على مستويات الحمض النووي الريبي والكروماتين تشير إلى أوجه تشابه كبيرة بين أمعاء الثدييات وأمعاء الثدييات ، وغالبًا ما تُظهر هذه المناطق التنظيمية لـ TSS قيودًا على التسلسل على مستوى ما ، إلا أن أقل من 15 ٪ من جينات توقيع IEC كانت قابلة للاكتشاف من الزرد إلى الماوس أو الإنسان في مناطق TSS. هذا أعاق قدرتنا على استنتاج المناطق التنظيمية و TFBS المفترضة المحفوظة بالفعل عبر هذه الأنواع (الشكل 3E) [56]. بالإضافة إلى ذلك ، تم تحديد معظم هذه المناطق المحفوظة بواسطة كتل MAF ويبدو أن لديها مناطق صغيرة فقط من الحفظ المتسلسل المتدهور للغاية من teleosts إلى الثدييات التي كانت موجودة مباشرة في الجزء العلوي من المناطق المنسوخة وتوحي بحد أدنى من الحفظ الوظيفي. لقد توقعنا أنه لا يزال من الممكن مشاركة المعلومات التنظيمية المشتركة في مناطق TSS هذه لأن TFBS المعياري القصير يمكن أن يفلت من مقاييس الحفاظ على التسلسل [56-58]. بحثنا عن إثراء TFBS باستخدام مكتبة من 303 مصفوفات وزن (PWMs) (مشتقة أساسًا من مجموعات بيانات ChIP-seq البشرية) ضمن مجموعتين من قمم الكروماتين التي يمكن الوصول إليها: (1) تلك التي تتراوح بين 10 كيلو بايت من TSS إلى 10 كيلو بايت في اتجاه المصب. من موقع إنهاء النسخ (TTS) [59] (الشكل 3F) و (2) تلك الموجودة في TSS لجينات توقيع IEC (S4C و S4D الشكل). حدد الإثراء المشترك لـ PWMs في مناطق الكروماتين التي يمكن الوصول إليها في جينات توقيع IEC لأنواع مختلفة العديد من أشكال TF المعروفة بتنظيم تعبير IEC في الثدييات بما في ذلك HNF1 و HNF4A و GATA4 و KLF5 وعوامل ETS المتشابهة في كثير من الأحيان ، بما في ذلك ELF3 و SPDEF (الشكل 3F ، الشكل S4C و S4D) [60-63] ، الذي قد يمثل شبكة TF تتحكم في الجوانب الأساسية المحفوظة لـ IECs في الحيوانات.

تعتمد مقاييس الحفظ على امتدادات طويلة نسبيًا من تسلسل الحمض النووي ، لذلك حاولنا تحديد خصائص التسلسل التي تتنوع بين الأنواع وقد تقاطع صيانة التسلسل المحفوظ المكتشف بسهولة. من خلال مقارنة النسبة المئوية لقواعد الحمض النووي التي تكون إما أدينوزين أو ثايمين (AT٪) في TSSs المطلوبة بواسطة إشارة FAIRE الزرد ، وجدنا أن خصائص التسلسل الإجمالي تختلف اختلافًا كبيرًا في TSS لأخصائيي تقويم العظام بين الأنواع (الشكل 3G و 3 H). تنخفض نسبة AT في TSS من حوالي 51٪ في أسماك الزرد إلى 46٪ في أبو شوكة إلى 35٪ في الفئران والبشر (الشكل 3H). يتم الحفاظ على هذه الاختلافات في المتوسط ​​في المنطقة المحيطة بـ TSS (الشكل 3G و 3 H). من المحتمل أن يكون لهذه الظاهرة العامة تأثير كبير على الحفاظ على التسلسل في هذه المناطق التنظيمية [64،65] وقد تمثل تحديًا خاصًا لتحديد المناطق والمنظمين المحمية. ومع ذلك ، فإن الاختلاف الكبير في نسبة AT التي لوحظت في TSS غائب في المتوسط ​​في CNEs ، والتي ، بناءً على الطريقة التي تم تحديدها ، متشابهة بطبيعتها في التسلسل (الشكل 3I). يشير هذا إلى أن الاختلافات العامة في استخدام التسلسل التي شوهدت في TSSs في الأنواع المختلفة في المتوسط ​​مهمة ولكنها قد لا تؤثر على جميع المناطق التنظيمية.

الحفاظ على المنظمين الذين يحددون التعبير المعوي الإقليمي من الأسماك إلى الثدييات دون الحفاظ على التسلسل الواضح

اقترحت الصيانة الواضحة لإثراء TFBS أن بيانات الكروماتين و RNA-seq التي يمكن الوصول إليها كانت تحدد المناطق المحفوظة وظيفيًا ، على الرغم من أنها تفتقر في كثير من الأحيان إلى تسلسل الحمض النووي المحفوظ. لاختبار هذا ، قمنا باستنساخ مناطق منبع rbp2a و fabp6 TSS التي لم تظهر أي حفظ متسلسل جوهري من الأسماك إلى الثدييات ، ولكنها بدت متاحة إلى حد كبير في IECs ، واختبرتها باستخدام اختبار مراسل وظيفي في الجسم الحي لأسماك الزرد (المواد والطرق). لأن كليهما RBP2 و فاب 6 هي جينات توقيع IEC التي أظهرت حفظًا إقليميًا قويًا للتعبير في الزرد والفأر (الشكل 2) ، وهذا سمح لنا باختبار في وقت واحد ما إذا تم تفسير حفظ المعلومات التنظيمية بواسطة الزرد لتحديد الإقليمية المعوية بالإضافة إلى تعبير IEC بشكل عام.

لقد أنشأنا إنشاء مراسل معدّل وراثيًا مع منطقة 1.3 كيلو بايت المنبع من TSS لجين بروتين ربط ريتينول الزرد ، rbp2a، المستنسخة المنبع من الماوس سيفوس مروج الحد الأدنى والبروتين الفلوري الأخضر (GFP) [Tg (rbp2a:GFP)] (الأشكال 4 أ و 3 هـ ، S5A ، S6A التين والجدول S4). Tg (rbp2a:GFP) كان قادرًا على زيادة التعبير في الجزء الأمامي من ظهارة الأمعاء في اليرقات (الشكل 4 أ)، والتي كانت متوافقة مع أنماط التعبير المعروفة لـ rbp2a [15،66،67] ، مما يشير إلى أن المعلومات التنظيمية الكافية لدفع التعبير الإقليمي في IECs موجودة في هذا الجزء. يختلف نمط التعبير هذا عن بناء مراسل التحكم العام حيث لم يتم استنساخ أي DNA إضافي في الجزء العلوي من الماوس سيفوس الحد الأدنى من المحفز الذي يقود GFP ، ولم يتم العثور على تعبير IEC ثابت (S6B-S6I الشكل) [68]. باستخدام نفس مقايسة المراسل ، قمنا بعد ذلك باختبار المنطقة على الفور من المنبع Rbp2 من الفأر Tg (Mmu.Rbp2:GFP) و RBP2 من الإنسان Tg (Hsa.RBP2:GFP) ووجدت أن كلاهما كان قادرًا على قيادة GFP في IECs في الجزء الأمامي من أمعاء الزرد اليرقية (الشكل 4A و S5A الشكل). اختبرنا ما إذا كان بإمكاننا تحديد TFBS الصغيرة الشائعة التي ربما أفلتت من الكشف عن طريق مقاييس الحفظ في هذه المناطق ولكنها توضح الأنماط المحفوظة لتعبير IEC. TF عزر البحث داخل RBP2 شظايا لأسماك الزرد والماوس والإنسان والمطابقات القوية المشتركة مع عوامل HNF4A و GATA ضمن بضع مئات من قواعد TSS (الشكل 4 ب و 4 ج). لاختبار عدد المرات التي حدثت فيها أشكال HNF4A و GATA بشكل عام ، استفسرنا عن منطقة ذات حجم مماثل 150 نقطة أساس في بداية TSS لجميع الجينات. فقط 23٪ (79 جينًا) و 0.25٪ (51 جينًا) و 0.25٪ (47 جينًا) كان لديهم أشكال HNF4A و GATA4 في أسماك الزرد والفأر والإنسان على التوالي ، وليس هناك من 1 إلى 1. احتوى أخصائيو تقويم العظام على أشكال HNF4A و GATA4 في هذا الموقع في جميع الأنواع الثلاثة. يشير هذا إلى أن وجود مواقع HNF4A و GATA في RBP2 يتم حفظ TSS بين جينومات الفقاريات ومن غير المرجح أن تحدث بالصدفة. في الواقع ، من المحتمل أن يكون HNF4A و GATA4 عبارة عن كاسيت تنظيمي شائع للفقاريات حيث حددت الدراسات التي أجريت على أنواع متعددة أهميتها في بيولوجيا الأمعاء الدقيقة IEC (S3G و S3H الشكل) [26،69]. بشكل جماعي ، تثبت هذه النتائج أن خرائط الكروماتين التي يمكن الوصول إليها يمكن أن تساعد في تمييز معلومات الحافز المحفوظة وكيف يمكن استخدام فحوصات المراسل في الجسم الحي لاختبار النشاط التنظيمي الخاص بالأنسجة المحفوظة المحتملة.

(أ) (يسار) صور تألق مجسم كاملة التركيب لـ 7 خطوط مستقرة لأسماك الزرد dpf تعبر عن بناء مراسل بروتين فلوري أخضر (GFP) لـ rbp2a / Rbp2 / RBP2 تظهر المناطق التنظيمية التي يمكن الوصول إليها من الزرد والفأر والإنسان مستويات عالية من التعبير في IECs في الجزء الأمامي من الأمعاء. شريط مقياس 100 ميكرومتر. (يمين) مقاطع عرضية تمثيلية لأمعاء الزرد تؤكد تعبير IEC العالي لكل خط ثابت مقابل. تم أخذ المقطع العرضي لأسماك الزرد في الجزء الخلفي من البصلة المعوية ، وتم أخذ المقاطع العرضية للفأر والبشر في منتصف البصلة المعوية. شريط مقياس 25 ميكرومتر. (ب) تم الكشف عن الزخارف الشائعة في RBP2(أ) المنطقة المستنسخة لكل نوع ملون بواسطة درجات هوميروس. يتم مشاركة مقياس درجة الحافز مع الشكل 4G. (ج) رسم تخطيطي لمواقع ربط عامل النسخ الشائعة (TFBS) التي تم العثور عليها فورًا في بداية موقع بدء النسخ (TSS) RBP2 (أ) في الزرد والفأر والبشر. (د) (أزرق يسار) صور فلورة مجسمة كاملة التركيب لخط ثابت من سمك الزرد 7 dpf تيراغرام(fabp6:GFP) تظهر مستويات عالية من تعبير GFP في IECs في منتصف الأمعاء. (أدناه الأزرق) متوسط ​​إسقاط مكدسات متحد البؤر لأسماك الزرد الكاملة تيراغرام(fabp6:GFP). شريط مقياس 100 ميكرومتر. (أزرق يمين) مقطع عرضي تمثيلي لأمعاء الزرد يؤكد تعبير IEC العالي لـ Tg (fabp6:GFP). شريط مقياس 25 ميكرومتر. (برتقالي يسار) صورة فلورية مجسمة كاملة لخط ثابت من سمك الزرد 7 dpf Tg (Mmu.فاب 6:GFP) يُظهر مستويات عالية من تعبير GFP في IECs في منتصف الأمعاء. شريط مقياس 100 ميكرومتر. (برتقالي يمين) مقطع عرضي تمثيلي لأمعاء الزرد يؤكد تعبير IEC العالي لـ Tg (Mmu.فاب 6:GFP). شريط مقياس 25 ميكرومتر. منطقة محمية أصغر من الماوس ومنطقتين شاملتين من الإنسان فاب 6 لم يدفع تعبير IEC GFP في اختبار مراسل الزرد لدينا. طوال الوقت ، يشير الخط الأبيض المتقطع إلى حدود الأمعاء و IECs. (هـ) الحد الأقصى لصورة الإسقاط متحد البؤر كامل جبل تظهر عدم وجود تداخل بين Tg (fabp6:GFP) وعلامة الجزء 2 TgBAC (lamp2-RFP). شريط مقياس 100 ميكرومتر. (F) صورة إسقاط متوسط ​​متحد البؤر للعرق الكامل تظهر عدم وجود تداخل بينهما Tg (fabp6:GFP) وعلامة الجزء 1 تيراغرام (-4.5fabp2:DSRed). شريط مقياس 100 ميكرومتر. (ز) تم اكتشاف الزخارف الشائعة في المنطقة المستنسخة أو المقابلة لكل نوع ملون بواسطة درجة عزر هوميروس.

تقود المنطقة التنظيمية Fabp6 التعبير المحفوظ في منطقة من أمعاء الزرد بشكل موضعي ووظيفي مماثل لدقاق الثدييات

سعينا بعد ذلك إلى استجواب الإمكانات التنظيمية للمناطق المنبع من فاب 6، وهو جين توقيع IEC معبر عنه بشكل أساسي في الدقاق في الفأر والبشر والذي يمكن الوصول إلى TSS الخاص به في جميع IECs التي تم اختبارها باستثناء الفئران والقولون البشري (الشكلان 3E و 4 D). المنطقة 258 نقطة أساس في المنبع من الزرد fabp6 TSS [Tg (fabp6:GFP)] قاد مجال تعبير GFP محدد للغاية حصريًا في IECs في منتصف أمعاء سمكة الزرد اليرقية ، بما يتوافق مع النمط الداخلي لـ fabp6 تعبير mRNA (الأشكال 2C و 4 D ، S5B و S5G-S5J الشكل) [15،47،70]. على عكس rbp2a, fabp6 كانت منطقة صغيرة المنبع من fabp6 TSS التي تم حفظها للفأر والبشر. ومع ذلك ، يبدو أن هذا يتوافق فقط مع صندوق TATA (الشكل 4G و S5B و S5C الشكل) ، واستنساخ هذه المنطقة الصغيرة من الماوس للاختبار في اختبار مراسل الزرد لدينا لم يدفع التعبير في IECs. ومع ذلك ، عندما قمنا بتضمين منطقة الكروماتين التي يمكن الوصول إليها بالكامل من الماوس تيراغرام(ممو.فاب 6:GFP) (منطقة 503 نقطة أساس في المنبع من الماوس فاب 6 TSS) ، التي تضمنت الحد الأدنى من المنطقة المحفوظة ، وجدنا هذا التسلسل الأكبر كافياً لدفع نمط تعبير IEC الذي كان متطابقًا في موضعه مع المنطقة المقابلة من الزرد (الشكل 4 د). يشير هذا إلى المعلومات التنظيمية اللازمة لدفع تعبير IEC في دقاق الزرد المفترض داخل المنطقة الإضافية المحددة بواسطة الكروماتين الذي يمكن الوصول إليه من الماوس ولم يتم اكتشافه فقط عن طريق الحفظ.

من أجل تحديد العلاقة بين هذا fabp6 في سياق الأجزاء الكنسية الثلاثة لأمعاء الزرد [14] ، قارنا نمط التعبير اليرقي لـ تيراغرام(fabp6:GFP) مع علامة الجزء 2 من أسماك الزرد TgBAC (lamp2-RFP) [71] والجزء المعوي 1 علامة تيراغرام (-4.5fabp2:DSRed) [72،73]. اللافت للنظر ، وجدنا تيراغرام(fabp6:GFP) لا تتداخل مع أي منهما ، مما يشير إلى المنطقة المعوية التي تميزت بها تيراغرام(fabp6:GFP) عبارة عن قطعة مميزة جديدة من أمعاء يرقات الزرد (الشكل 4E-4F).مناطق مماثلة المنبع من الإنسان فاب 6 كانت سلبية لتعبير القيادة في IECs الزرد ، على الرغم من الوجود المفترض لـ TFBS المشتركة ذات الصلة بـ IEC مثل CDX2 و RBPJ و RXR (الشكل 4G و S5B الشكل والجدول S4). الدليل المشترك للتعبير الموضعي المحفوظ لـ فاب 6 وغيرها من الجينات اللفائفية (الشكل 2C و S3D الشكل) جنبًا إلى جنب مع الحفاظ على معلومات منظمة رابطة الدول المستقلة الخاصة بالمنطقة في أسماك الزرد والفأر فاب 6 يشير أخصائيو تقويم العظام (الشكل 4D-4G) إلى أن الجزء المعوي المتماثل وظيفيًا وإقليميًا مع دقاق الثدييات يتم الاحتفاظ به في يرقات الزرد ومن المحتمل أن يتم تحديده بواسطة منظمات مماثلة.

يتم الاحتفاظ بمجالات النسخ المحددة في أمعاء الزرد اليرقية في البالغين

لتحديد ما إذا كانت أنماط النسخ والمجالات التي نكتشفها في أمعاء الزرد اليرقية تحدث أيضًا في مراحل البالغين ، قمنا بتقييم أنماط التعبير في أمعاء الزرد البالغة (3 أشهر) باستخدام نفس الخطوط المعدلة وراثيًا المستقرة التي طلبناها في اليرقات. Tg (rbp2a:GFP) أظهر نمط تعبير مشابه يقتصر على الأمعاء الأمامية مثل الزرد اليرقي ، ومع ذلك ، بما يتوافق مع بيانات تعبير البالغين (الشكل 2 ب) ، لم يمتد تعبير GFP العالي إلى معظم IECs الأمامية (الشكل 5A-5B). يشير هذا إلى وجود مجالات نسخ إضافية أو اختلافات وظيفية في معظم أمعاء الزرد الأمامية. وجدنا ذلك أيضًا Tg (fabp6:GFP) كان له نمط مشابه جدًا بين اليرقات والمراحل البالغة مع منطقة صغيرة نسبيًا وسرية لتعبير IEC GFP مباشرة بعد الانحناء الثاني وبين علامة الجزء 2 TgBAC (lamp2-RFP) (الشكل 5F-5G) وعلامة القطعة 1 تيراغرام (-4.5fabp2:DSRed) مجالات التعبير (الشكل 5H-5I). بشكل جماعي ، يشير هذا إلى أنه يتم الحفاظ على برامج النسخ الإقليمية في أمعاء الزرد بين مراحل اليرقات والمراحل البالغة. علاوة على ذلك ، قد يكون مدى التماثل الوظيفي بين أمعاء الزرد والثدييات أكبر مما تم تقديره سابقًا (الشكل 5J-5K). نقترح نموذج عمل يحتوي على ما لا يقل عن 5 نطاقات نسخية / وظيفية في أسماك الزرد ، على الرغم من الحاجة إلى دراسات إضافية لحل هذه المجالات بشكل شامل ، وتفاعلها ، وحدودها ، والمنظمين ، فضلاً عن الطبيعة الكاملة وقيود التماثل بين teleost و mammalian Regional برامج IEC (الشكل 5 ك).

(أ) صورة مجهرية مجهرية لشخصين بالغين تم تشريحهما Tg (rbp2a:GFP) الأمعاء (أعلى) وأمعاء من النوع البري (WT) بدون بروتين فلوري أخضر (GFP) (أسفل) تُظهر تعبير GFP عاليًا بين الانحناء الأول والثاني للأمعاء البالغة في Tg (rbp2a:GFP). يمكن رؤية التألق الذاتي في عدة أمعاء بعد الانحناء الثاني ، ويفترض أن يكون ذلك بسبب الصفراء أو البراز (انظر الفحص المجهري في حقل مشرق في ب). شريط مقياس 1000 ميكرومتر. المقطع العرضي متحد البؤر للبالغين تيراغرام(rbp2a:GFP) تظهر الطيات المعوية مع DAPI باللون الأزرق تعبير GFP في الخلايا الظهارية المعوية (IECs) في اللوحة الداخلية. شريط مقياس 50 ميكرومتر. (ب) الفحص المجهري في برايتفيلد لشخصين بالغين تم تشريحهما Tg (rbp2a:GFP) الأمعاء (أعلى) و 2 من الأمعاء من النوع البري (أسفل). يمكن رؤية دبابيس التشريح كخطوط سوداء طويلة تثبت الأمعاء في البصيلة المعوية. (ج) صورة مجسمة مجسمة من تراكب برايتفيلد و GFP للأمعاء المشرحة للبالغين تيراغرام(fabp6:GFP) ، يظهر تعبير GFP في مجال سري بعد الانحناء الثاني مباشرة. تم استبعاد فتحة الشرج في هذا التحضير. شريط مقياس 1000 ميكرومتر. (د) صورة مجسمة مجسمة لـ GFP (أعلى) وحقل مشرق (أسفل) لأمعاء البالغين المشرحة تيراغرام(fabp6:GFP) بالطول لإظهار التفاصيل الداخلية للمجال السري لتعبير GFP. شريط مقياس 1000 ميكرومتر. (هـ) المقطع العرضي متحد البؤر للبالغين تيراغرام(fabp6:GFP) تظهر الطيات المعوية مع DAPI باللون الأزرق تعبيرًا عاليًا لـ GFP في IECs. شريط مقياس 50 ميكرومتر. (F) التصوير المجسم عن قرب لبروتين الفلورسنت الأحمر (RFP) و Brightfield للكبار WT و TgBAC (lamp2-RFP) تظهر خطوط الزرد (أعلى) الأمعاء بأكملها مع وضع موضع الجزء 2 النسبي بخط أحمر أفقي (وسط). شريط مقياس 2000 ميكرومتر. صورة مضان فقط توضح توزيع إشارة lamp2-RFP ، وهي الأعلى في الجزء 2 (أسفل). الاتجاه النسبي للوزن (أعلى) و TgBAC (lamp2-RFP) (القاع) يتم الاحتفاظ بها طوال الوقت. (ز) المقطع العرضي متحد البؤر للبالغين TgBAC (lamp2-RFP) تُظهر الطيات المعوية من الجزء 2 مع DAPI باللون الأزرق تعبيرًا عاليًا عن lamp2-RFP في IECs. شريط مقياس 50 ميكرومتر. (ح) (أعلى) صورة مجهرية مجهرية للأمعاء المشرحة للبالغين تيراغرام (-4.5fabp2:DSRed) يظهر تعبير DsRed بشكل كبير بين الانحناء الأول والثاني مع تعبير إضافي في البصيلة المعوية. يشير الخط المنقط الأبيض إلى الأمعاء المشرحة. مشابه Tg (fabp2:RFP) تم الإبلاغ عن النتيجة مسبقًا [15]. شريط مقياس 1000 ميكرومتر. يظهر التراكب بين DsRed و brightfield في الشكل الداخلي أعلى اليمين. (أنا) المقطع العرضي متحد البؤر للبالغين تيراغرام (-4.5fabp2:DSRed) تظهر الطيات المعوية مع DAPI باللون الأزرق تعبير DsRed عاليًا في IECs. شريط مقياس 50 ميكرومتر. (ي) رسم تخطيطي للأمعاء البالغة التي تم تشريحها يظهر ميزات تشريحية رئيسية متراكبة مع المجالات النسخية / الوظيفية المقترحة الموضحة في K. (ك) التمثيل التخطيطي الخطي للمجالات النصية والوظيفية المقترحة لأمعاء الزرد مع علامات الجينات الإقليمية المحتملة والتعليقات التوضيحية الإقليمية المحددة مسبقًا. لا ينبغي بالضرورة اعتبار الحدود منفصلة ، وقد تختلف المجالات أو تتداخل مع جينات مختلفة. تشير العلامات إلى علامات نصية مقترحة لتحديد المنطقة محددة باستخدام خطوط معدلة وراثيًا من هذه الدراسة (*) أو من Wang et al. (^) [15]. يمكن الاستدلال على علامات إضافية من الشكل 2 والشكل S3 ، بما في ذلك علامات المنطقة الأكثر خلفية لأمعاء الزرد.

نادرًا ما تكون zCNEs المحفوظة التي يمكن الوصول إليها في IECs خاصة بـ IEC ومن المحتمل أن تكون مفتوحة في معظم الأنواع والأنسجة

بالإضافة إلى مناطق TSS ، استفسرنا أيضًا بشكل خاص عن مجموعة بيانات منشورة تتكون من 54.533 zCNEs ، منها 11792 محفوظة أيضًا للماوس والبشر ، لإمكانية الوصول إليها في IECs [55]. حدد طلب zCNEs بواسطة إشارة FAIRE-seq من سمك الزرد أن الجينات المجاورة لأيسر CNEs التي يمكن الوصول إليها تم التعبير عنها أيضًا بشكل كبير في عينات IEC من الأنواع الأخرى (الشكل 6 أ). كان هناك أيضًا تداخل مفاجئ في حجم إمكانية الوصول في هذه المواقع المحفوظة بين الأنواع (الشكل 6 أ و 6 ب و 6 واو). ومع ذلك ، فإن 48 من 77 CNE التي كان يمكن الوصول إليها في جميع مجموعات بيانات أسماك الزرد والدقاق والقولون والقولون البشري يمكن الوصول إليها أيضًا في 82٪ على الأقل (14/17) من مجموعات بيانات ENCODE الإضافية غير المعوية وخريطة الطريق البشرية (الشكل 6B-6D ) [52-54]. يشير هذا إلى أن هذه المناطق ليست مسؤولة بشكل خاص عن تعبير IEC. ومع ذلك ، يمكن أن تمثل هذه المواقع المحفوظة التي يمكن الوصول إليها بشكل متكرر شبكات نسخ بدائية خاصة لعموم الفقاريات حيث توجد zCNEs بشكل شائع في TSSs والجينات التنموية و TF (الشكل 6B-6E) [55].

(أ) العناصر غير القاتلة المحفوظة (CNEs) التي تم طلبها بواسطة الزرد IEC IEC عزل بمساعدة الفورمالديهايد لإشارة تسلسل العناصر التنظيمية (FAIRE-seq) في مركز العناصر غير القاتلة المحفوظة (zCNE) لأسماك الزرد. (يسار) نقل متوسط ​​الأجزاء لكل كيلو بايت من النسخة لكل مليون قراءة معينة (FPKM) لمستويات CNEs الأقرب للجينات (250 نافذة جينًا ، مخطط ألوان بخطوة واحدة استنادًا إلى مجموعات البيانات المقدمة في الشكل 1 أ وطوالها) ، مما يوضح العلاقة بين إمكانية الوصول مستوى الكروماتين والنسخ في هذه المناطق المحفوظة. (يمين) الخرائط الحرارية لإشارات الكروماتين التي يمكن الوصول إليها عند 1000 نقطة أساس ، المحيطة بمركز CNE ، مما يبرز تشابه الإشارة في IECs في CNEs في جميع الأنواع الأربعة. لا يمثل اللون الرمادي أي إشارة يمكن رسمها أو فشلًا في الارتقاء إلى جينوم أبو شوكة ، حيث لم يتم تضمين جينوم أبو شوكة في مجموعة CNE [55]. (ب) تداخل الذروة لمجموعات بيانات الكروماتين التي يمكن الوصول إليها من قبل IEC ومجموعات بيانات ENCODE / Roadmap للإنسان والفأر مع CNEs في كل الأنواع المعنية. يتم تعريف التداخل على أنه وجود زوج أساسي مشترك واحد على الأقل. (ج) تحليل الكتلة من CNEs مع تداخل ذروة واحد على الأقل يمكن الوصول إليه بواسطة IEC من أي من مجموعات بيانات IEC. (د) مجموعة فرعية من CNEs تحتوي على ذروة تداخل من كل من مجموعات بيانات أسماك الزرد ودقاق الفأر وقولون الفأر والقولون البشري ، بالإضافة إلى تداخل كبير مع بيانات إضافية للماوس والبشر من أنسجة غير مرتبطة في الغالب. (هـ) المجموعة الكاملة من CNEs التي تتداخل مع أمعاء الزرد ، والدقاق الفأري ، وقولون الفأر ، والقولون البشري ، ولكن القليل من مجموعات البيانات الأخرى ، تحدد العناصر التنظيمية الخاصة بـ IEC التي يحتمل أن تكون محفوظة بدرجة عالية. (F) مخطط مبعثر لإشارة الكروماتين التي يمكن الوصول إليها في مركز CNEs لسمك الزرد IECs ودقاق الفأر IECs ، مما يُظهر علاقة إيجابية محفوظة بين إشارة الكروماتين التي يمكن الوصول إليها في هذه المواقع. (ز) بيانات الكروماتين التي يمكن الوصول إليها من EGR1 موقع يبرز CNE_11264 الذي يمكن الوصول إليه بشكل شائع في أنواع متعددة. (ح) تألق مجسم كامل لإيواء خط جيني مستقر egr1 Tg (zCNE_11264:GFP) تظهر أعلى تعبير عن بروتين الفلورسنت الأخضر (GFP) في IECs في منتصف الأمعاء. (أسفل) عرض عن قرب لسمك الزرد egr1 Tg (zCNE_11264:GFP) الأمعاء. شريط مقياس 100 ميكرومتر. (يمين) تأكيد الصور (كنفوكل) كاملة egr1 Tg (zCNE_11264:GFP) تعبير GFP في IECs. شريط مقياس 25 ميكرومتر. (أنا) نفس H للخط المستقر Egr1 Tg (mzCNE_11264:GFP). (ي) نفس H للخط المستقر EGR1 Tg (hzCNE_11264:GFP). (ك) يُظهر توزيع أشكال CA / T-rich-G (CArG) / MCM1 و AGAMOUS و DEFICIENS و SRF (صندوق MADS) و E26 (ETS) في الإنسان والفأر وسمك الزرد والسمك الشوكي CNE_11264 توزيعات مميزة على الرغم من التسلسل الحفاظ على. يمثل الشريط البرونزي المنطقة المحفوظة. يمثل الشريط المتقطع لـ hzCNE_11264 البشري المنطقة المحفوظة على ما يبدو المجاورة للحدود hzCNE_11264 المميزة بشريط برونزي صلب. (ل) تُظهر خريطة الحرارة رقم الحافز (يسار) وأعلى درجة عزر (يمين) للأشكال الشائعة المكتشفة في CNE_11264. (م) تُظهر علاقة التشابه بين مربعات CArG المكتشفة في CNE_11264 تنوع مواقع ربط عامل النسخ (TFBS) على الرغم من الحفاظ على التسلسل الشامل. ترقيم مواقع مربع CArG تعسفي.

كانت بعض هذه المناطق المحفوظة التي يمكن الوصول إليها في معظم الأنسجة بالقرب من الجينات المعروفة بأدوارها في بيولوجيا IEC ، مثل Egr1 [74], Nr1d1 [75] و يونيو [75] ، ولم نرغب في استبعاد أن هذه المناطق يمكن أن تظل مهمة في تعبير IEC. استنساخ المناطق التي يمكن الوصول إليها بشكل أساسي من nr1d1 و يونيو كانت سلبية لتعبير IEC. عندما قمنا باستنساخ ملف egr1- مناطق CNE المجاورة من أسماك الزرد (zCNE_11264) ، والماوس (mzCNE_11264) ، والبشر (hzCNE_11264) واختبرتها بشكل منفصل باستخدام اختبار المراسل الخاص بنا ، مما لا يثير الدهشة ، أظهرت الأنسجة المتعددة تعبير GFP. ومع ذلك ، لاحظنا نمطًا تفاضليًا متميزًا عبر الأمعاء ، مع تعبير GFP بشكل أكبر في IECs في منتصف الأمعاء في خطوط مراسل الزرد التي تمثل جميع الأنواع الثلاثة (الشكل 6G-6J). حدد البحث عن عزر TF عدة مواقع مربعة لـ ETS و CA / T-rich-G (CArG) / MCM1 و AGAMOUS و DEFICIENS و SRF (MADS) في جميع الأنواع الثلاثة في CNE_11264 ، والتي غالبًا ما تكون متجاورة على الفور (الشكل 6K) ، بما يتوافق مع عنصر استجابة مصل تم تمييزه عند الإنسان EGR1 [76–78].

لاحظنا حجم المنطقة المحفوظة والتباعد وعدد مواقع الربط CArG و ETS لـ zCNE_11264 (458 نقطة أساس) و mzCNE_11264 (352 نقطة أساس) أكبر من hzCNE_11264 (120 نقطة أساس) (الشكل 6G-6L). حدد البحث عن مواقع ربط CArG و ETS المحلية مجموعة مجاورة لمواقع ربط CArG و ETS إضافية ، حوالي 200 نقطة أساس خارج منطقة hzCNE_11264 المحفوظة (الشكل 6K). كان hzCNE_11264 قادرًا على توجيه تعبير IEC مماثل بدون مواقع الربط المحفوظة الإضافية المفترضة الزائدة (الشكل 6G و 6J و 6 K). ومع ذلك ، فإن هذا يسلط الضوء على الطبيعة غير الكاملة لتحديد المناطق المحفوظة عبر الأنواع ذات الصلة البعيدة ويقترح أن خرائط الكروماتين التي يمكن الوصول إليها جنبًا إلى جنب مع البحث عن بذور لغة عزر مجاورة شائعة قد تحدد معلومات إضافية لحفظ التسلسل (S7J-S7L الشكل). تم العثور على هذا المزيج نفسه من ETS و CArG TFBS على الفور في المنبع إيغر 1 في جينوم أبو شوكة ، على الرغم من أن zCNE لم يتم شرحه على وجه التحديد في أبو شوكة (الشكل 6K). يشير تحديد مواقع ربط ETS و CArG المنفصلة غير المتداخلة في CNE_11264 في أنواع متعددة إلى أن مواقع ETS و CArG المتعددة لها صلة وظيفية بهذه المنطقة التنظيمية (الشكل 6 ك). ومع ذلك ، يوضح هذا أيضًا مدى تعقيد تحديد الحفظ الذي يعتمد غالبًا على منطق تنظيمي مرن وفائض عن الحاجة (الشكل 6K و 6 L). وبالمثل ، فإن تنوع مربعات CArG المكتشفة يوضح أيضًا كيف يمكن أن تنحرف تسلسلات TF المنحلة مع الحفاظ على مخرجات وظيفية مماثلة (الشكل 6M) [79].

يمكن للكروماتين الذي يمكن الوصول إليه تحديد العناصر التنظيمية المحفوظة الخاصة بالأنسجة في الجينات المعبر عنها على نطاق واسع

في محاولة للعثور على zCNEs والمنظمين المنبعين الذين يعملون بشكل أساسي في IECs ، حددنا مجموعة من 15 zCNE لم يكن الوصول إليها متاحًا على الأقل في 9 من أصل 17 من الأنسجة غير التابعة لـ IEC ولكن كان من الممكن الوصول إليها دائمًا في IECs في الزرد والفأر والإنسان (الشكل 6E). كشف تحليل الحافز لهذه CNEs التي يمكن الوصول إليها بواسطة IEC عن TFBS الشائعة ذات الصلة بـ IEC في الزرد والفأر والبشر مثل GATA و HNF4A و HOX و CDX2 و HNF6 و HNF1 و TEAD (S7A-S7I و S8 Figs).

أحد جيران zCNE ، الجين المشعر ومحسن الانقسام 1 / ذو الصلة بالشعر 6 (HES1/لها 6) (zCNE_44665) ، خصوصية الكروماتين التي يمكن الوصول إليها بشكل ملحوظ ضمن مجموعات البيانات المعوية (الشكل 6E S9A و S9B الشكل). Hes1 هو مثبط نسخي معروف بأنه يلعب أدوارًا متنوعة في العديد من الأنسجة بما في ذلك التطور الجنيني وتطور الخلايا العصبية والتائية [80-82]. الأهم من ذلك ، أنه يلعب أيضًا أدوارًا مهمة في التمايز بين الأنواع الفرعية لـ IEC من أسلاف الخلايا الجذعية المعوية ويتم التعبير عن الفئران حصريًا في سرداب الأمعاء [17،83]. في حين أن الخبايا غير موجودة في أمعاء الزرد ، ولم يتم تمييز سلف IEC أو الخلايا الجذعية في الأسماك إلا مؤخرًا [11] ، HES1/لها 6 تم العثور على أن يتم التعبير عنها في مجموعة فرعية متميزة من IECs في حجرة مماثلة في قاعدة الطيات المعوية الزرد [84]. ليس معروفًا تمامًا ما الذي تنظمه المناطق الجينومية هس 1 التعبير IEC وإذا كانت هذه المناطق تتحكم في جوانب هس 1استجابة النسخ للميكروبات [85] أو في سرطان الأمعاء [86].

كنا نشعر بالفضول إذا كانت بيانات الكروماتين الخاصة بنا من IEC قد ميزت المناطق التنظيمية الهامة المحفوظة التي دفعت التعبير في IECs (الشكل 7 أ). في اختبار مراسلنا zCNE_44665 ، تبلغ المنطقة حوالي 3600 نقطة أساس في المنبع من Hes1 / لها 6 كشفت TSS في سمك الزرد عن تعبير وتعبير IEC قوي في الأنسجة الأخرى بما في ذلك الكبد (الشكل 7B-7D ، S10 الشكل). حدد التركيب الكامل والمقاطع العرضية لـ 7 dpf من الأسماك أن تعبير GFP العالي كان ضمن مجموعة فرعية من IECs ، غالبًا عند قاعدة الانغماس الطفيف لطبقة الخلية هذه (الشكل 7B-7E ، S10A الشكل). تشبه هذه الانغالات في النهاية قاعدة الطيات الظهارية (rugae) التي شوهدت في الأسماك الأكبر سنًا وسرداب الأمعاء في الثدييات ، على الرغم من أنه عند 7 dpf ، لا يتم التعبير عن الطيات الكبيرة (الشكل 7D و 7E) [12]. هذه Tg (zCNE_44665:GFP) لم يتداخل عدد السكان مع الخلايا التي كانت إيجابية مع علامة الخلايا المعوية تيراغرام (-4.5fabp2:DSRed) (الشكل 7F والشكل S10G) [73] ، علامة الغدد الصماء المعوية Tg (neurod1:TagRFP) (الشكل 7G والشكل S10H) [87] ، أو الخلايا ذات التشكل الخلوي الكأسي المميز. هذا يشير إلى HES1تقوم المنطقة المجاورة المحفوظة zCNE_44665 بتشغيل GFP في مجموعة سكانية غير محددة من IECs والتي تختلف عن الأنواع الفرعية المعروفة لـ IEC في أسماك الزرد.

(أ) كروماتين يمكن الوصول إليه في HES1 الموقع. (ب) تألق مجسم كامل للخط المعدّل وراثيًا ثابتًا 7 dpf مأوى لأسماك الزرد hes1 Tg (zCNE_44665:GFP) إظهار تعبير البروتين الفلوري الأخضر (GFP) في IECs. شريط مقياس 100 ميكرومتر. (ج) مثل B ، صورة مقربة تظهر GFP + IECs عالية في مجموعة من الخلايا. (د) مثل B ، إسقاط أقصى z-stack كامل البؤر لأمعاء الزرد يظهر GFP عاليًا في عدد سكان IECs. (هـ) صورة متحد البؤر للمقطع العرضي المعوي من 7 dpf hes1 Tg (zCNE_44665:GFP) إظهار تعبير GFP في IECs التي تظهر في قاعدة الانغماس الطفيف (الأسهم البيضاء). شريط مقياس 25 ميكرومتر. (F) يظهر المقطع العرضي المعوي متحد البؤر من 7 dpf الزرد عدم وجود تداخل بين hes1 Tg (zCNE_44665:GFP) وعلامة معوية تيراغرام (-4.5fabp2:DSRed). GFP + IECs تفتقر إلى Discosoma sp. يتم تمييز بروتين الفلورسنت الأحمر (DsRed) بسهم أبيض. شريط مقياس 25 ميكرومتر. (ز) عدم وجود تداخل بين hes1 Tg (zCNE_44665:GFP) وعلامة الغدد الصماء المعوية Tg (neurod1:TagRFP) [87]. يمكن رؤية انخفاض في GFP الخلفية في خلايا البروتين الفلوري الأحمر (RFP) + (السهم الأبيض). شريط مقياس 25 ميكرومتر. ح) تظهر صورة المقطع العرضي متحد البؤر التداخل بين hes1 Tg (zCNE_44665:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry) في 7 dpf الزرد. تظهر القنوات الفردية بشكل داخلي مع DAPI باللون الأزرق. شريط مقياس 25 ميكرومتر. أنا) صورة متحد البؤر لمقطع عرضي لطيات معوية سمكة الزرد عمرها 8 أسابيع في hes1 Tg (zCNE_44665:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry). (ي) صورة مجسمة تظهر تداخل الإنسان بكامله HES1 Tg (hzCNE_44665:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry) في مجموعة فرعية من IECs في 7 dpf من أسماك الزرد. شريط مقياس 100 ميكرومتر. (ك) مقطع عرضي متحد البؤر لسمك الزرد 7 dpf يظهر تداخل الإنسان HES1 Tg (hzCNE_44665:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry). شريط مقياس 25 ميكرومتر. (ل) خريطة الحرارة لأشكال TFBS الشائعة في CNE_44665 في أسماك الزرد والفأر والإنسان. (م) مخطط للطفرات الموجهة للموقع على العامل النووي للخلايا الكبدية 1 (HNF1) (أعلى) وبروتين ربط إشارة إعادة التركيب للغلوبولين المناعي لمنطقة كابا J (RBPJ) (أسفل) مواقع الربط المفترضة من zCNE_44665. (ن) صورة كاملة البؤر تظهر التداخل بين hes1 Tg (zCNE_44665 ΔHNF1 sdm:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry). شريط مقياس 25 ميكرومتر. ا) صورة كاملة متحد البؤر تظهر التداخل بين hes1 Tg (zCNE_44665 ΔRBPJ sdm:GFP) و تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry). شريط مقياس 25 ميكرومتر.

قمنا بمسح تسلسل CNE المتعامد من أسماك الزرد والفأر والإنسان ووجدنا TFBS للعامل النووي للخلايا الكبدية 1 (HNF1) ، والعامل المحفز لنقص الأكسجة 2 ألفا (HIF2A) ، وبروتين ربط إشارة إعادة التركيب للغلوبولين المناعي منطقة كابا J (RBPJ) في جميع CNEs الثلاثة (الشكل 7L S9A-S9C الشكل). من المعروف أن RBPJ ينظم HES1 التعبير في وجود إشارة Notch [88] ، مما يؤدي إلى تغيير نسبة سلالات IEC الإفرازية والامتصاصية [17]. لذلك ، اختبرنا ما إذا كان هذا Tg (zCNE_44665:GFP) كان عدد السكان موجبًا لإشارة Notch. الصلبان Tg (zCNE_44665:GFP) مع تيراغرام (EPV.Tp1- أوكو.Hbb2:hmgb1-mCherry)، الذي يستخدم مروجًا مشتقًا من الفيروسات مع مواقع ربط RBPJ مستجيبة للشق [89] ، كشفت عن تداخل كبير بين خلايا mCherry + و GFP + (الشكل 7H و 7I ، S10 ، S1 Movie). كانت mCherry + IECs دائمًا GFP + ، و 64.6٪ فقط من خلايا GFP + كانت mCherry + ، والذي يمكن أن يرجع جزئيًا إلى النضج البطيء نسبيًا لبروتين mCherry. يشير هذا التداخل إلى أن إشارات Notch مهمة في تنظيم هذا العنصر في اتجاه المنبع HES1 / her6 (الشكل 7H و 7I ، S10 الشكل). كشف مقطع عرضي للأمعاء المشرحة من سمكة عمرها 8 أسابيع عن نمط تعبير أكثر تعقيدًا فيما يتعلق بالطيات المعوية المفصلية الآن (الشكل 7I). تضمنت خلايا GFP + خلايا في القاعدة وعادةً في النصف السفلي من الطيات المعوية وتضمنت خلايا إيجابية لإشارات الشق. ومن المثير للاهتمام ، أن هذه الخلايا كانت تحتوي في كثير من الأحيان على نوى قمي أكثر من معظم IECs ، والتي توجد نواتها عادةً بشكل أساسي داخل الظهارة (الشكل 7I و S10E الشكل).

لتحديد ما إذا كان قد تم الحفاظ على قدرة تنظيمية مماثلة للثدييات ، قمنا بعد ذلك باختبار hzCNE_44665 من الإنسان (حوالي 10 كيلو بايت من TSS لـ HES1). قادت هذه المنطقة البشرية أيضًا تعبيرًا معويًا كان مقصورًا بالمثل على مجموعة فرعية من IECs التي غالبًا ما تتداخل مع الخلايا الإيجابية للشق (30.5 ٪ GFP + / mCherry + ، 33.6 ٪ GFP + فقط ، 35.7 ٪ mCherry + فقط) (الشكل 7J و 7 K). لتحديد ما إذا كانت TFBSs المفترضة الشائعة الموجودة في CNE_44665 تنظم التعبير في IECs ، أنشأنا خطًا من أسماك الزرد مع موقع ربط HNF1 الذي تم إلغاؤه من خلال طفرة في بناء مراسل zCNE_44665 GFP Tg (zCNE_44665 ΔHNF1:GFP) (الشكل 7 لتر و 7 م). ما زلنا نحدد تعبير GFP في مجموعة فرعية من الخلايا التي كانت متزامنة مع إشارات Notch في IECs من خطوط أسماك مستقرة تحتوي على هذا البناء (الشكل 7N). ومع ذلك ، عندما ألغينا موقع ربط RBPJ ، وجدنا أن تعبير GFP العالي قد فقد تمامًا في IECs ، بما في ذلك المجموعة الفرعية من الخلايا التي تداخلت مع الخلايا الإيجابية من Notch (الشكل 7O). يشير هذا إلى أن موقع ربط RBPJ المحفوظ ضروري للتعبير في IECs وقد يساهم في مشتركة HES1 التنظيم في الأسماك والثدييات في مجموعات IEC الأسلاف (الشكل 7O). بشكل جماعي ، فإن تحليل بيانات الكروماتين لدينا قادر على التمييز بين المناطق التنظيمية لـ IEC و TFBS المسببة المفترضة من المناظر الطبيعية التنظيمية المعقدة التي قد تنظم نسخ الجين المعبر عنه على نطاق واسع في IECs.


الملخص

بالنسبة للعديد من المستقلبات الثانوية ، يعد التوليف غير المتجانسة الخطوة النهائية لتحديد جينات التخليق الحيوي المطلوبة. استخدام نظام التعبير متعدد القطاعات في خميرة الخميرة، قمنا بإعادة تكوين ليس فقط نوعين من الستاتينات الطبيعية من نوعين من الفطريات ، بمعنى آخر.، لوفاستاتين من الرشاشيات الأرضية و FR901512 من Xylaria grammica، ولكن أيضًا هياكل الستاتين الجديدة عن طريق خلط جيناتها. كشفت تجارب التبادل الجيني التوافقي الاختلاط الوظيفي لاثنين من مركبات البوليكيتيد في A. terreus, الحب، و الحب يمكنهم تصنيع FR901512 مع زيلاريا الجينات. محددات البنية الأساسية للستاتينات هي جينات ملحقة أساسية لا يمكن الاستغناء عنها عبر الأنواع.


II. التهجين والبلويد والتوالد العذري

قادنا اهتمامنا بديناميات الكروموسومات والوراثة إلى مجموعة من السحالي التي تتكاثر بدون ذكور ، وتعرض تحملاً ملحوظًا للتغيرات في التعددية. في ذلك الوقت ، لم يُعرف الكثير عن الآليات الجزيئية التي تسمح لإناث بعض الأنواع باستنساخ نفسها عن طريق التوالد العذري. لقد عالجنا هذا من خلال سلسلة من التجارب التي كشفت عن كيفية إباضة سحالي whiptail الأنثوية للبويضات غير المخصبة التي تحمل مكمل الكروموسوم الكامل دون فقدان تغاير الزيجوت. نحن الآن نستخدم مزيجًا من زراعة أنسجة المبيض والفحص المجهري متحد البؤر والمجهر الإلكتروني لاكتساب نظرة ثاقبة للآليات الخلوية والجزيئية التي يتم من خلالها التغلب على العوائق التي تحول دون التفرقة الجنسية.

يمنح التهجين بين الأنواع السلالات النسيليّة مستويات عالية من تغاير الزيجوت ويلعب دورًا رئيسيًا في الانتقال من التكاثر الجنسي إلى التكاثر العذري في الفقاريات. يزيد الارتفاع البلويدي من تغاير الزيجوت حيث يوسع الجينوم الإضافي الذخيرة الجينية التي قد تسمح بالتكيف مع بيئة متغيرة أو استعمار منافذ بيئية جديدة. في الواقع ، ثلثي الأنواع التوالدية العذرية من سحالي whiptail هي ثلاثية الصبغيات ويعتقد أن العديد من الوسائط ثنائية الصبغيات قد انقرضت. من خلال الاستفادة من مستعمرتنا المختبرية ، قمنا بإنتاج أكثر من 100 نوع هجين بين الذكور والإناث التوالد. أسفرت هذه التجارب عن أول سحالي رباعية الصبغيات أسست سلالات جديدة معزولة وراثيًا. فتح توافر الهجينة المعقمة وأنساب التكاثر النسيلي زاوية جديدة للتحقيق في الأساس الجزيئي للتكاثر التكراري الوراثي وأسباب العقم الهجين. سنقارن الحيوانات العقيمة والخصبة باستخدام الأساليب الخلوية والجزيئية لفك رموز العناصر التي تمنع التوالد العذري في بعض الهجينة دون غيرها. لقد قمنا بالفعل بترتيب وتجميع الجينومات لثلاثة أنواع من سحالي whiptail ، ونحن بصدد تطوير مجموعة أدوات جينومية شاملة لإلقاء الضوء على الموضوعات التالية:

(أنا) في علم الأحياء التطوري ، كُتب الكثير عن العملية التي من خلالها تتراكم الطفرات الضارة في جينومات الأنواع اللاجنسية لتكوين عبء وراثي (سقاطة مولر) والحاجة إلى استمرار التكيف (مفهوم الملكة الحمراء). تشكل هذه الفرضيات إطارًا لشرح سبب عدم وجود التنوع الجيني والقدرة المحدودة على التطور من شأنه أن يحكم على الجنسين بالانقراض. ومع ذلك ، فإن إحدى القضايا المهمة التي لم تحظ باهتمام كبير في النقاش هي التقييم الفعلي للتنوع الجيني (والخلقي) الموجود في المجموعات السكانية ثنائية الجنس على الرغم من التكاثر "النسيلي". لقد أجرينا دراسة على نطاق صغير لتنوع السواتل المكروية ووجدنا أن بعض المواقع تختلف كثيرًا داخل الأنواع التوالدية كما هو الحال في الأنواع الجنسية. سنستمد فهمًا أكثر شمولاً لدرجة التنوع وتراكم الطفرات والاختلاف اللاجيني من تحليل بيانات تسلسل الجيل التالي.

(ثانيا) غالبًا ما يُستشهد بالأصل الهجين للأنواع الوراثية كعنصر أساسي في نجاحها على المدى الطويل. لكن الجمع بين الجينومات من نوعين أو أكثر في كائن حي واحد يمكن أن يؤدي أيضًا إلى عدم التوافق. توفر المقارنة جنبًا إلى جنب بين الجيل الأول الهجينة مع الأفراد التوالد العذري ، والتي نشأت من نفس الأنواع الأبوية في الطبيعة منذ عدة أجيال ، فرصة فريدة لفحص التكيف مع وجود جينومات متباينة في نفس الخلية والكائن الحي. سنقارن التعبير الجيني الخاص بالأليل في الهجينة المُصنَّعة في المختبر مع أفراد من الأنواع التوالدية التوالدية المعروف أنها تؤوي نفس الجينومين لآلاف الأجيال. ستوفر هذه الدراسات رؤى حول كيفية إنشاء التعبير الجيني الخاص بالأليل وتثبيته وصيانته بمرور الوقت.

توفر مستعمراتنا السحلية جنبًا إلى جنب مع الموارد الجينية التي أنشأتها مجموعتنا فرصة فريدة لتوضيح الأساس الجزيئي للتكاثر ثنائي الجنس وفهم العوائق التي تحد من التوالد العذري في معظم الفقاريات. يحمل مثل هذا البحث وعدًا بتعزيز معرفتنا بالتطور وتنظيم الجينات في سياق التهجين ، وتنوع التكاثر ، والتكاثر العذري.


الجمع بين بيانات التعبير الجيني من نوعين - علم الأحياء

أدى التقدم في البحث الجينومي إلى إدراك أن النماذج الفعالة للتنبؤ بالسلوك الخلوي يجب أن تأخذ في الاعتبار تفاعلات الشبكة التي تتوسط ديناميكيًا في تنظيم الجينات. نظرًا لأنه من الصعب التنبؤ بالسلوك الناشئ عن هذه التفاعلات المعقدة بدون نماذج كمية ، فهناك حاجة لمقاربات النمذجة الحسابية التي تم التحقق من صحتها تجريبياً والتي يمكن استخدامها لفهم تعقيدات تنظيم الجينات. بالتعاون الوثيق مع جيف هيستي في قسم الأحياء بجامعة كاليفورنيا ، نطور نماذج عشوائية غير خطية لديناميات الوحدات التنظيمية الجينية وتفاعلاتها في الخلايا الحية.

    مذبذبات الجينات الاصطناعية قمنا بتصميم وإنشاء مذبذب جيني جديد مكون من عنصرين في البكتيريا [i] E. coli [/ i] ، استنادًا إلى المبادئ التي لوحظ أنها بالغة الأهمية لجوهر العديد من شبكات الساعة البيولوجية [Stricker et al ، Nature ، 2008]. استند تصميم المذبذب على فكرة مشتركة بين حلقتين من حلقات التغذية الراجعة الإيجابية والسلبية. يؤدي التأخير البسيط في النسخ في حلقة التغذية المرتدة السلبية إلى تذبذبات الاسترخاء العشوائية التي يتم تضخيمها واستقرارها بواسطة حلقة التغذية المرتدة الإيجابية. نستخدم النمذجة الحسابية لتطوير معايير التصميم لتحقيق التذبذبات في هذا النظام. رسم تشبيه لدمج وإطلاق ديناميات في علم الأعصاب ، لقد صاغنا مصطلح "التذبذب والنار" [Mather et al ، PRL ، 2009] لوصف جوهر الديناميكيات.

أظهرت الدراسات الحديثة أن مكونًا مهمًا لتنوع التعبير ينشأ من عوامل خارجية يعتقد أنها تؤثر على جينات متعددة في تناغم [M.Elowitz ، 2002 ، 2005 ، Raser & O'Shea ، 2005] ، ومع ذلك فقد تم تلقي الأصول البيولوجية لهذا التباين الخارجي القليل من الاهتمام. نحن نجمع بين النمذجة الحسابية وبيانات التألق الناتجة عن إدخالات جينات متعددة في خميرة الخميرة لتحديد مصدرين رئيسيين للتنوع الخارجي [Volfson et al ، 2006]. مصدر واحد لا مفر منه ينشأ عن اقتران التعبير الجيني مع ديناميكيات السكان يؤدي إلى أرضية ضوضاء في كل مكان في تقلب التعبير. يوضح المصدر الثاني الذي ينشأ من عامل النسخ المنبع الشائع كيف يمكن للشبكات التنظيمية تحويل الضوضاء الداخلية أو الخارجية في تعبير المنظم إلى ضوضاء خارجية عند إخراج الجين المستهدف. تسلط نتائجنا الضوء على أهمية تفاعل شبكات تنظيم الجينات مع عدم تجانس السكان لفهم أصول التنوع الخلوي.

عادة ما تكون التفاعلات الكيميائية الحيوية العشوائية متزامنة باستخدام ما يسمى بخوارزمية Gillespie [Gillespie ، 1977]. ومع ذلك ، بالمعنى الدقيق للكلمة ، تنطبق هذه الخوارزمية فقط على ردود الفعل الماركوفية الخالية من الذاكرة في ظروف cnostant. لقد طورنا تعميمات لهذه الخوارزمية الكلاسيكية التي تسمح لنا بتطبيقها لنمذجة التفاعلات الكيميائية الحيوية في نمو الخلايا وتقسيمها [Lu et al ، 2004]. أيضًا ، قمنا بتطوير تعديل آخر لخوارزمية Gillespie التي تجعلها قابلة للتطبيق على التفاعلات المتأخرة غير الماركوفية [Bratsun et al ، 2005]. نستخدم هذه الخوارزميات لنمذجة الديناميكيات العشوائية لداراتنا الجينية الاصطناعية ، حيث غالبًا ما تلعب التعليقات السلبية المتأخرة الدور الرئيسي.

إذا كنت تريد معرفة المزيد حول التقلبات والضوضاء في علم الأحياء ، فاطلع على مراجعتي الأخيرة [Tsimring ، 2014]

دراسة التذبذبات اليومية وتكوين الأنماط الزمانية المكانية ذات الصلة في نيوروسبورا كراسا نيوروسبورا كراسا، إلى جانب ذبابة الفاكهة ، أحد الكائنات الحية البارزة التي يستخدمها علماء الأحياء لدراسة طبيعة التذبذبات اليومية [دنلاب ، 1999 ، لاكين توماس ، 2000]. يمكن رؤية الإيقاع اليومي في Neurospora في طبق بتري من خلال تكوين البوغ الدوري على شكل عصابات على سطح الآجار (انظر الصورة أدناه).

في هذا العمل نقدم ونحقق في نموذج عشوائي لتشكيل النمط المكاني والزماني في Neurospora مدفوعًا بمذبذب الساعة البيولوجية. تعتمد الديناميات المحلية للنموذج على الاقتران المتأخر بين جينين تردد لجنة الاتصالات الفدرالية وذوي الياقات البيضاء مجلس الوزراء مجمع غير متجانس. هذا النموذج يعيد إنتاج فترة ما يقرب من 24 ساعة من التذبذبات المحلية وتشكيل العصابات في الخلية النامية. يمكن تطبيق هذا النموذج لفهم آليات تشكيل النمط في النوع البري نيوروسبورا كراسا وكذلك في مختلف طفرات Neurospora.

في [Steiner et al. ، 2016] أظهرنا عمومًا أن الاصطفاف للحصول على مورد مشترك محدود في فئات واسعة من الشبكات الأنزيمية في ظروف معينة يؤدي إلى حالة حرجة تتميز بعلاقات قوية وطويلة المدى بين الأنواع الجزيئية. تصل الشبكة الأنزيمية إلى هذه الحالة الحرجة عندما يتم موازنة تدفق الإدخال من ركيزتها بواسطة أقصى سعة معالجة للشبكة. نحن أيضًا نعتبر الشبكات الأنزيمية مع التكيف ، عندما يتم إنتاج المورد المحدود (إنزيم أو عامل مساعد) بما يتناسب مع الطلب عليه. لقد أظهرنا أن الحالة الحرجة تصبح عامل جذب لهذه الشبكات ، مما يشير إلى بداية الحرجية ذاتية التنظيم. قد يكون شكل الطابور التكيفي الذي يؤدي إلى ارتباطات مهمة بين الأنواع المتعددة منتشرًا في الأنظمة البيولوجية.


جينمانيا

GeneMANIA هي أداة عبر الإنترنت من مختبر Quaid Morris في CCBR في تورنتو للتنبؤ السريع بوظيفة الجينات باستخدام مجموعات بيانات واسعة النطاق من Arabidopsis ، بما في ذلك التعايش وتفاعلات البروتين والبروتين والتوطين وغيرها. أدخل جينًا أو قائمة جينات وسيحاول GeneMANIA توسيع هذه القائمة بناءً على مجموعات البيانات هذه. مرتبط أيضًا في إخراج متصفح eFP الخاص بنا. تم تحميل AraNet من مختبر Sue Rhee في GeneMANIA لسهولة الاستكشاف.


شاهد الفيديو: صراع البلابل بين ليندا وعبود - 344 - (أغسطس 2022).