معلومة

4.2: تحليل منحنيات التجديد بمكونات متعددة - علم الأحياء

4.2: تحليل منحنيات التجديد بمكونات متعددة - علم الأحياء



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

في هذا القسم ، يتم تطبيق التحليل الوارد في القسم 4.2 كميًا في مثال على إعادة تشبع الحمض النووي الجيني. إذا كان الحمض النووي غير المعروف يحتوي على مكون حركي واحد ، مما يعني أن الجزء المعاد تكوينه يزيد من 0.1 إلى 0.9 كقيمة لـ ج0ر يزيد بمقدار 100 ضعف ، ثم يمكن للمرء حساب مدى تعقيده بسهولة. باستخدام المعادلة (6) ، كل ما يحتاجه المرء هو معرفته ج0ر1/2، بالإضافة إلى (C_0t_ {1/2} ) وتعقيد معيار مُعاد تشكيله في ظروف مماثلة (التركيز الأولي للحمض النووي ، تركيز الملح ، درجة الحرارة ، إلخ).

ينطبق نفس المنطق على تحليل الجينوم بمكونات حركية متعددة. تجدد بعض الجينومات على مدى نطاق من ج0رالقيم التي تغطي العديد من الطلبات من حيث الحجم ، على سبيل المثال من 10-3 حتى 104. بعض الحمض النووي يعيد تشكيله بسرعة كبيرة ؛ لديها تعقيد منخفض ، وكما سنرى ، تكرار تكرار عالي. المكونات الأخرى في الحمض النووي تتجدد ببطء ؛ هذه لها تعقيد أعلى وتكرار تكرار أقل. ومع ذلك ، فإن التجاعيد الجديدة الوحيدة للتحليل هي معالجة كل مكون حركي بشكل مستقل. هذا نهج معقول ، حيث يتم تقطيع الحمض النووي إلى أجزاء قصيرة ، على سبيل المثال 400 نقطة أساس ، ومن غير المحتمل أن يكون الحمض النووي سريع التجدد جزءًا من نفس الجزء مثل الحمض النووي البطيء إعادة التكوين.

يجب تعريف بعض المصطلحات والاختصارات هنا.

  • F = جزء من الجينوم يشغله أحد المكونات
  • (C_0t_ {1/2} ) للمكوِّن النقي = (F) ( (C_0t_ {1/2} ) تقاس بمزيج المكونات)
  • R = تردد التكرار
  • G = حجم الجينوم. يمكن قياس G كيميائيًا (مثل كمية الحمض النووي لكل نواة خلية) أو حركيًا (انظر أدناه).

يمكن للمرء قراءة وتفسير منحنى (C_0t ) على النحو التالي. على المرء أن يقدر عدد المكونات في الخليط التي تشكل الجينوم. في المثال الافتراضي في الشكل 4.5 ، يمكن رؤية ثلاثة مكونات ، واستنتاج آخر لأن 10٪ من الجينوم قد أعيد تشكيله بأسرع ما يمكن إجراء الفحص الأول. المكونات الثلاثة التي يمكن ملاحظتها هي الأجزاء الثلاثة للمنحنى ، ولكل منها نقطة انعطاف في مركز جزء من المنحنى الذي يغطي زيادة 100 ضعف في (C_0t ) (تسمى أحيانًا 2 سجلات (C_0t). جزء الجينوم الذي يشغله أحد المكونات ، F، على أنه جزء من تلدين الجينوم في هذا المكون. (C_0t_ {1/2} ) المقاسة هي قيمة (C_0t ) التي عندها تمت إعادة ترتيب نصف المكون. في الشكل 4.5 ، يعيد المكون 2 التسجيل بين قيم (C_0t ) من 10-3 و 10-1، وزاد جزء الجينوم المعاد تشكيله من 0.1 إلى 0.3 على هذا النطاق. هكذا F هو 0.3-0.1 = 0.2. ال ج0ر القيمة عند نصف إعادة التأهيل لهذا المكون هي القيمة التي تُرى عندما يصل الجزء المُعاد تشكيله إلى 0.2 (أي في منتصف الطريق بين 0.1 و 0.3 ؛ هذا ج0ر القيمة 10-2، ويشار إليه باسم ج0ر1/2للمكون 2 (يقاس في خليط المكونات). تم جدولة قيم المكونات الأخرى في الشكل 4.5.

الشكل 4.5.

جميع مكونات الجينوم موجودة في الحمض النووي الجيني المشوه في البداية. وبالتالي فإن قيمة ج0 هو لجميع الجينوم DNA ، وليس للمكونات الفردية. ولكن بمجرد معرفة جزء الجينوم الذي يشغله أحد المكونات ، يمكن للمرء حساب ج0 لكل مكون فردي ، ببساطة ج0 ´ F. وبالتالي فإن (C_0t_ {1/2} ) للمكون الفردي هو (C_0t_ {1/2} ) (يقاس في خليط المكونات) ´ F. على سبيل المثال ، (C_0t_ {1/2} ) للمكون الفردي (الصافي) 2 هو 10-2 ´ 0.2 = 2 ´ 10-3 .

بمعرفة (C_0t_ {1/2} ) المقاس لمعيار DNA ، يمكن للمرء حساب مدى تعقيد كل مكون.

[Nn = C_0t_ {1/2} _ {pure}، n ] ´

  • حيث تشير n إلى مكون معين ، أي (1 ، 2 ، 3 ، أو 4)

تكرار التكرار لمكون معين هو العدد الإجمالي للأزواج الأساسية في هذا المكون مقسومًا على مدى تعقيد المكون. العدد الإجمالي للأزواج الأساسية في هذا المكون معطى بواسطة الجبهة الوطنية ´ جي.

آكانيوز =

بالنسبة للبيانات الموجودة في الشكل 4.5 ، يمكن حساب القيم التالية:

مكونF (C_0t_ {1/2} ) ، امزج (C_0t_ {1/2} ) نقيN (بي بي)RR
1 قابل للطي0.1< 10-4< 10-4
2 سريع0.210-22 × 10-3600105
3 متوسط0.110.13 × 104103
4 بطيء (نسخة واحدة)0.61036001.8 × 1081
الحمض النووي البكتيري المنقولة جنسيا103 × 1061

حجم الجينوم ، جي، يمكن حسابه من نسبة التعقيد وتكرار التكرار.

جي=

على سبيل المثال إذا كانت G = 3 x 108 bp ، والمكون 2 يحتل 0.2 منها ، فإن المكون 2 يحتوي على 6 x 107 bp. لكن تعقيد المكون 2 هو 600 نقطة أساس فقط. لذلك ، سوف يتطلب الأمر 105 نسخ من تسلسل 600 نقطة أساس لتشتمل على 6 × 107 bp ، ونعتقد أن R = 105.

تمرين 4.1

إذا استبدل أحد المعادلة ل نن ولل جي في معادلة صن، علاقة بسيطة ص يمكن اشتقاقها من حيث قيم (C_0t_ {1/2} ) المقاسة لخليط المكونات. ما هذا؟

أنواع الحمض النووي في كل مكون حركي للجينومات المعقدة

عادة ما تحتوي جينومات حقيقيات النوى على مكونات متعددة ، مما يولد مركبًا ج0ر المنحنيات. يوضح الشكل 4.6 تخطيطي ج0ر منحنى يوضح المكونات الحركية المختلفة للحمض النووي البشري ، والجدول التالي يعطي بعض الأمثلة لأعضاء المكونات المختلفة.

الشكل 4.6.

الجدول 4.2. أربعة مكونات حركية أساسية للجينومات المعقدة
حركية إعادة التشبعج0ر واصفتردد التكرارأمثلة
سريع جدًا في القياس"طي الظهر"لا ينطبقيكرر مقلوب
تجديد سريعقليل ج0رمتكرر للغاية ،> 105 نسخ لكل خليةالتكرارات القصيرة المختلطة (على سبيل المثال ، الإنسان ألو يكرر) ؛ التكرارات الترادفية للتسلسلات القصيرة (السنتروميرات)
إعادة تهيئة وسيطةمنتصف ج0ريتكرر باعتدال ، 10-104 نسخ لكل خليةعائلات التكرارات المتقطعة (على سبيل المثال التكرارات L1 البشرية الطويلة) ؛ rRNA ، 5S RNA ، جينات هيستون
إعادة بطيئةعالي ج0رمنخفض ، 1-2 نسخة لكل خلية ، "نسخة واحدة"معظم الجينات الهيكلية (مع الإنترونات الخاصة بهم) ؛ الكثير من الحمض النووي بين الجينات

ن, ص لتكرار الحمض النووي المتوسطات للعديد من عائلات التكرارات. أفراد عائلات التكرارات متشابهون ولكن ليسوا متطابقين مع بعضهم البعض.

تكشف الصورة الناشئة للجينوم البشري عن ما يقرب من 30000 جينة تشفر البروتينات والحمض النووي الريبي الهيكلي أو الوظيفي. تنتشر هذه على أكثر من 22 جسمية و 2 من الكروموسومات الجنسية. تحتوي جميعها تقريبًا على introns ، وبعضها يحتوي على عدد قليل من introns القصير والبعض الآخر به عدد كبير جدًا من introns الطويل. دائمًا ما تفصل كمية كبيرة من الحمض النووي بين الجينات الجينات.

تتناثر عدة عائلات مختلفة من الحمض النووي المتكرر عبر التسلسلات الجينية والداخلية. جميع هذه التكرارات تقريبًا هي بقايا أحداث تبديل ، وفي بعض الحالات تم العثور على جينات المصدر لهذه الينقولات. بعض العائلات الأكثر وفرة من التكرارات تم نقلها عبر RNA وسيط ، ويمكن استدعاؤها الينقولات العكسية. الأسرة الأكثر تكرارا في البشر هي ألو يعيد، المسمى بموقع نوكلياز داخلي شائع داخلها. يبلغ طولها حوالي 300 نقطة أساس ، وحوالي مليون نسخة موجودة في الجينوم. من المحتمل أنها مشتقة من جين معدل لـ RNA صغير يسمى 7SL RNA. (يشارك هذا الحمض النووي الريبي في ترجمة البروتينات المُفرزة والغشائية). تمتلك جينومات الأنواع من رتب أخرى من الثدييات (وفي الواقع جميع الفقاريات التي تم فحصها) أعدادًا قابلة للمقارنة تقريبًا من التكرارات القصيرة المتفرقة المشتقة بشكل مستقل من الجينات التي تشفر RNAs قصيرة أخرى ، مثل نقل RNAs.

فئة بارزة أخرى من الينقولات العكسية المتكررة هي الطويلةL1 يعيد. يبلغ طول النسخ الكاملة من التكرارات L1 حوالي 7000 نقطة أساس ، على الرغم من اقتطاع العديد من النسخ من نهاية 5 '. يوجد حوالي 50000 نسخة في الجينوم البشري. تحتوي النسخ الكاملة من L1s التي تم نقلها مؤخرًا وجينات مصادرها على إطارين مفتوحين للقراءة (أي يمكنها ترميز بروتينين). أحدهما هو بروتين متعدد الوظائف مشابه لـ بول جين الفيروسات القهقرية. يقوم بترميز النسخ العكسي الوظيفي. قد يلعب هذا الإنزيم دورًا رئيسيًا في تبديل جميع الينقولات العكسية. تم العثور على التكرارات المشابهة لـ L1 في جميع الثدييات والأنواع الأخرى ، على الرغم من أن L1s داخل كل ترتيب للثدييات لها ميزات مميزة لهذا الترتيب. وهكذا تم توسيع وتكرار كل من التكرارات القصيرة المتقطعة (أو SINEs) والتكرارات الطويلة المتناثرة L1 (أو LINEs) ونشرها بشكل مستقل في رتب مختلفة من الثدييات.

كلا النوعين من الينقولات العكسية نشطة حاليًا ، وتولد دي نوفوالطفرات في البشر. تم ربط مجموعة فرعية صغيرة من SINEs كعناصر وظيفية في الجينوم ، مما يوفر إشارات معالجة ما بعد النسخ بالإضافة إلى exons لترميز البروتين لعدد صغير من الجينات.

يبدو أن الفئات الأخرى من التكرارات ، مثل L2s (التكرارات الطويلة) و MIRS (التكرارات القصيرة المسماة التكرارات الثديية المتناثرة) ، تسبق إشعاع الثدييات ، أي يبدو أنها كانت في أجداد الثدييات eutherian. الفئات الأخرى من التكرارات هي عناصر قابلة للنقل تتحرك بواسطة وسيط DNA.

متواليات متكررة أخرى مشتركة في البشر


إعادة التشبع

يعتمد اختبار تراكب الترابط على إعادة تشبع البروتينات المثبتة على مرشح النيتروسليلوز من أجل اختبار تفاعلات البروتين والبروتين المحتملة مع يجند قابل للذوبان ، والذي يمكن اكتشافه بسهولة. في هذه الحالة ، يتم إعادة تنظيم EEA1 المنقى على النيتروسليلوز واحتضانه مع GST – Rab5: GTPγS أو GST – Rab5: الناتج المحلي الإجمالي القابل للذوبان ، متبوعًا باكتشاف GST – Rab5 المرتبط باستخدام الأجسام المضادة لـ GST. يتم إجراء الأشكال النشطة (GTPγS) وغير النشطة (GDP) من GST-Rab5 كما هو موضح أعلاه لإعداد عمود التقارب. يتم التخلص من Rab5 المرتبط بالنيوكليوتيدات المستقرة من الحبيبات مع محلول شطف الجلوتاثيون مع 1 م م من النوكليوتيدات المقابلة. تتم إزالة الجلوتاثيون عن طريق التحلية على عمود PD-10 معاير مسبقًا مع محلول NS يحتوي على 100 ميكرومتر من النوكليوتيدات المقابلة. نتج عن هذا الإجراء عادةً 3 مجم / مل من GST-Rab5 بأي شكل.

يتم تحميل EEA1 المنقى (عمود Superose 6 ، الجزء 18) على هلام SDS-PAGE (بدون الغليان المسبق) ونقله إلى غشاء النيتروسليلوز. يتم بعد ذلك غسل اللطخة 2 × لمدة 10 دقائق باستخدام برنامج تلفزيوني يحتوي على 0.1 ٪ توين 20 ، ويتم حظره طوال الليل عن طريق الحضانة باستخدام محلول مانع للتسرب (تتم جميع الحضانات عند 4 درجات ما لم ينص على خلاف ذلك). ثم يتم تحضين البقع 2 × لمدة ساعة واحدة مع محلول ربط ، متبوعًا بحضانة مع 1 ميكروغرام / مل GST-Rab5: GTPγS أو GST-Rab5: الناتج المحلي الإجمالي في محلول ربط يحتوي على 100 ميكرومتر GTPγS أو الناتج المحلي الإجمالي ، و 1٪ BSA ، لمدة 1 ساعة. بعد ذلك ، تُغسل البقع 5 × لمدة 5 دقائق باستخدام محلول ربط يحتوي على 10 ميكرومتر من النوكليوتيدات المناسبة (احتوت جميع الغسلات اللاحقة على هذا التركيز من النوكليوتيدات) ، واحتُضنت بالأجسام المضادة لـ GST (الأدوية) بتخفيف 1: 2000 في محلول ربط يحتوي على 1٪ من مساحة سطح الجسم. تُغسل البقع 5 × لمدة 5 دقائق مع محلول ربط وتحضينها بمضاد الأرانب IgG المترافق مع HRP بتخفيف 1: 1500 في محلول ربط يحتوي على 1٪ BSA ، يليه خمس غسلات لمدة 5 دقائق مع محلول ربط مؤقت ، و 2 سريع يغسل مع برنامج تلفزيوني. أخيرًا ، يتم معالجة البقع باستخدام نظام الكشف عن اللمعان الكيميائي المعزز (ECL) (Amersham) وتعريضها للتصوير الإشعاعي الذاتي. توضح هذه الطريقة أن EEA1 المنقى قادر على ربط GST-Rab5: GTPγS ولكن ليس GST-Rab5: الناتج المحلي الإجمالي (الشكل 5 أ).

الشكل 5. فحوصات تنقية EEA1. (أ) تم تحميل EEA1 المنقى (الكسر 18 ، 400 نانوغرام) على SDS-PAGE متدرج بنسبة 7-17٪ متبوعًا بالنقل على مرشح نيتروسليلوز. ثم تمت إعادة تكوين البقع ، واحتضانها بالشكل المحدد من Rab5 (1 ميكروغرام / مل) ، وتم تحديد موضع GST-Rab5 المرتبط باستخدام أضداد الماعز المضادة لـ GST ، متبوعًا بحضانة الأرانب المضادة IgG المضادة للماعز مقترنة بـ HRP و HRP و الكشف عن طريق ECL. يوضح الشكل الوزن الجزيئي المتوقع لـ EEA1 (على الجانب الأيسر) ومعايير الوزن الجزيئي (على الجانب الأيمن). (ب) الاندماج بين الإندوسومات المبكرة في وجود العصارة الخلوية (القاعدية) ، أو المخزن المؤقت ، أو تركيزات مختلفة من EEA1 في وجود أو عدم وجود ZnCl2. يتم التعبير عن مدى الاندماج كنسبة مئوية من القاعدية.

يتم أيضًا اختبار نشاط EEA1 في في المختبر فحص الانصهار الداخلي المبكر الذي تم وصفه من قبل. في هذه الحالة ، يتم خلط الإندوسومات المبكرة المعزولة مع EEA1 المنقى ويتم قياس نسبة الاندماج باستخدام محلل Origen (IGEN ، Gaithersburg ، MD). الجزء من كروماتوغرافيا استبعاد الحجم الذي يحتوي على EEA1 (جزء 18) قادر على دعم الاندماج بين الجسيمات الداخلية المبكرة في غياب العصارة الخلوية (الشكل 5 ب). عند استخدام EEA1 في حالة عدم وجود ZnCl2، يتم تقليل الاندماج بشكل كبير ويتطلب تركيزًا أعلى بكثير من الجزء الذي يحتوي على EEA1 من أجل التعويض عن تقليل ZnCl2. ومن المحتمل أن يكون إجراء التنقية (العلاج بـ 20 مم EDTA أثناء الشطف من عمود التقارب) جردت أيونات Zn 2+ من إصبع FYVE في EEA1 ، بما يتوافق مع التقارير السابقة. 27 ، 28 جهودنا لاستخراج المؤثرات من عمود التقارب في غياب EDTA باستخدام تركيزات عالية من الملح والمنظفات أثبتت فشلها.

يوضح المعياران أعلاه المستخدمان لاختبار نشاط EEA1 (الارتباط بـ Rab5 النشط وتحفيز اندماج الجسيم الداخلي) أن طريقة التنقية الموصوفة تؤدي إلى تحضير فعال لمستجيب Rab5 هذا.


4.1 أهداف هذا الفصل

قم بتوليد بيانات نموذج المزيج الخاص بنا من التوزيعات المكونة من مجموعتين طبيعيتين.

تعرف على كيفية خوارزمية التعظيم والتوقع (EM) وتسمح لنا "بعكس هندسة" الخلائط الأساسية في مجموعة البيانات.

استخدم نوعًا خاصًا من المزيج يسمى التضخم الصفري للبيانات مثل بيانات ChIP-Seq التي تحتوي على العديد من الأصفار الإضافية.

اكتشف التوزيع التراكمي التجريبي: مزيج خاص يمكننا بناؤه من البيانات المرصودة. سيمكننا ذلك من رؤية كيف يمكننا محاكاة تنوع تقديراتنا باستخدام التمهيد.

قم ببناء توزيع لابلاس كمثال لنموذج خليط لا نهائي - مع العديد من المكونات. سوف نستخدمه لنمذجة أطوال المروج وشدة ميكروأري.

احصل على أول لقاء لنا مع توزيع جاما بواسون ، وهو نموذج هرمي مفيد لبيانات RNA-Seq. سنرى أنه يأتي طبيعيًا من خلط مصادر Poisson الموزعة المختلفة.

شاهد كيف تمكّننا النماذج المختلطة من اختيار تحويلات البيانات.


مقدمة

يتعامل التعلم متعدد العلامات (MLL) مع المشكلات التي يمكن فيها تخصيص مثيل لفئات متعددة في وقت واحد [1] ، [2]. بالنظر إلى مجموعة الملصقات L = ، التعلم التقليدي أحادي التسمية (SLL) [3] ، [4] يبني نموذجًا يقوم بتعيين المثيلات من مساحة الميزة إلى مجموعة الملصقات المنفصلة ، على سبيل المثال ، h: x → L ، بينما يبني MLL نموذجًا يقوم بتعيين المثيلات من مساحة الميزة إلى مجموعة القوى لمجموعة الملصقات ، أي h: x → 2 L. في العقود الأخيرة ، تمت دراسة MLL على نطاق واسع وتم تطبيقها على مجموعة واسعة من مجالات التطبيق مثل تصنيف النص [5] ، [6] ، [7] ، التعرف على الصور [8] ، [9] ، [10] ، و تصنيف الموسيقى [11] ، إلخ.

الحل المباشر لـ MLL هو طريقة مجموعة الطاقة (LP). إنه يحول المشكلة الأصلية متعددة العلامات إلى مشكلة تسمية واحدة عن طريق معالجة كل عنصر في 2 لتر كفئة واحدة. ومع ذلك ، فإن تعقيد طريقة LP مرتفع نظرًا لأن عدد الفئات ينمو بشكل كبير مع زيادة | لام | . يعد تدريب نماذج MLL الفعالة مع تعقيد زمني معقول تحديًا كبيرًا. بشكل عام ، تم اقتراح ثلاث مجموعات من الطرق التقريبية ، أي طرق تحويل المشكلة (PTMs) [2] ، وطرق التجميع (EM) [12] ، [13] ، وطرق التكيف الخوارزمية (AAMs) [14] ، [15 ] ، [16]. من بينها ، تعد PTM أكثر الطرق فعالية عن طريق تحليل المشكلة متعددة العلامات إلى مجموعة من المشكلات ذات التسمية الفردية الأصغر في حالة ثنائية أو متعددة الفئات. تتضمن أكثر نماذج PTM أهمية الارتباط الثنائي (BR) [17] وترتيب الملصق المعاير (CLR) [18]. تقوم BR بتدريب مصنف ثنائي لكل تسمية بشكل مستقل ، بينما تقوم CLR بتدريب مصنف ثنائي لكل زوج من الملصقات. هاتان الطريقتان يسهل تنفيذهما مع تعقيد زمني منخفض نسبيًا ، لكنهما يتجاهلان التأثيرات المتبادلة بين الملصقات [19] ، [20] ، [21] التي قد تؤثر على الأداء النهائي. على سبيل المثال ، نظرًا لمشكلة التعرف على الصور المكونة من خمس ملصقات مع L = ، قد توجد بعض العلاقات التي تشير إلى أن قرار تسمية واحدة (يُشار إليها بـ ls L) له تأثير على قرار تسمية أخرى (يشار إليها باسم le L). إذا تعاملنا مع كل تسمية على أنها عقدة واستخدمنا حوافًا موجهة لربط العقد ذات الصلة ، على سبيل المثال ، ls → le ، فيمكن إنشاء شبكة موجهة تربط جميع الملصقات كما هو موضح في الشكل 1. يمكن أن يساعد اكتشاف ارتباطات التسمية هذه ودمجها في إنشاء نموذج MLL أفضل.

عادة ، هناك نوعان من العلاقات بين التسميات ، أي العلاقة الإيجابية والعلاقة السلبية. تشير العلاقة الإيجابية إلى التواجد المشترك أو الاختفاء المشترك للتسميات ، كما هو موضح في الشكل 2 (أ) ، عندما يظهر Rural في صورة ما ، من المحتمل أيضًا أن تظهر Village أو Paddy بينما تشير العلاقة السلبية إلى العلاقات الحصرية المتبادلة بين الملصقات ، كما هو مبين في الشكل 2 (ب) ، عندما يظهر Rural ، من غير المحتمل أن تظهر المباني العالية أو التكنولوجيا. تعتبر العلاقات الإيجابية والسلبية مفيدة في نمذجة ارتباطات التسمية.

سلسلة المصنفات (CC) عبارة عن PTM تحاول الاستفادة من ارتباطات التسمية [22]. على غرار BR ، يبني CC | لام | المصنفات الثنائية وكل مصنف مسؤول عن توقع أهمية تسمية واحدة. ومع ذلك ، يتم تدريب المصنفات بالتسلسل باتباع ترتيب محدد مسبقًا للملصقات ، ويتم تمديد متجه ميزات الإدخال لملصق واحد بواسطة التسميات المطلوبة قبله. تتمثل المشكلة الرئيسية في نهج CC في العثور على ترتيب الملصق الأمثل. إذا كانت أسلاف الملصق مرتبطة ارتباطًا وثيقًا به ، فيمكن أن تساعد الميزات الموسعة في تحسين أداء المصنف المقابل ، وإلا لا. يحدد نهج CC الأصلي ترتيب الملصق بشكل عشوائي ، والذي ينطوي على مخاطر الأداء المنخفض والمتانة المنخفضة. في وقت لاحق ، تم اقتراح العديد من المتغيرات لطريقة CC ، مثل مجموعة CC (ECC) [23] ، و Double-Monte Carlo CC (M2CC) [24] ، و CC الحساسة للمجموعة (GCC) [25] ، و CC المعزز مع ك-يعني خوارزمية التجميع (كm-CC) [26] و CC الحساسة للتكلفة (CSCC) [27] ، إلخ. يمكن أن تساعد هذه الأساليب في تحسين أداء نهج CC ، ولكن التعقيد الزمني عادة ما يكون مرتفعًا. إلى جانب ذلك ، يحلل معظمهم ارتباطات التسمية بناءً على التواجد المشترك ، في حين يتم إهمال العلاقات المتنافية. وفقًا لهذه العيوب ، يُطلب نموذج شامل لتحليل ارتباط التسمية.

شبكة بايز (BN) ، والمعروفة باسم الرسم البياني غير الدوري الموجه (DAG) ، هي نموذج رسومي احتمالي يتعلم خصائص مجموعة من المتغيرات العشوائية وتوزيعاتها الاحتمالية المشروطة [28]. بشكل عام ، تمثل العقد في BN متغيرات عشوائية ، وتمثل الحواف التي تربط عقدتين العلاقات بين المتغيرات. إذا لم تكن هناك حافة تربط بين عقدتين ، فإن المتغيرين العشوائيين يكونان مستقلين عن بعضهما البعض. على العكس من ذلك ، إذا كانت عقدتان متصلتان بحافة ، فإن ملف الأبوين العقدة (أي نقطة بداية الحافة) و طفل العقدة (أي نقطة نهاية الحافة) تعتمد بشكل سببي أو غير مشروط ، مما سيولد قيمة احتمالية مشروطة. من خلال فرض قيود BN على الترتيب العشوائي ، تم اقتراح نهج CC محسن مع هيكل قائم على الأشجار [29]. علاوة على ذلك ، يتم استخدام مصنفات Bayes الساذجة المزودة بـ BN كنماذج أساسية لنهج CC [30]. ومع ذلك ، على حد علمنا ، لم يتم التحقيق بعد باستخدام نموذج BN لتحليل ارتباط التسمية الشامل ، والذي سيكون محور التركيز الرئيسي لهذه الورقة. من خلال تقديم طريقة ترتيب سريعة للملصقات ، تم اقتراح نهج CC جديد قائم على BN (BNCC). تم سرد مساهمات هذه الورقة على النحو التالي: •

يتم استخدام الانتروبيا الشرطية لنمذجة درجة التبعية للتسمية على الملصقات الأخرى ، والتي تدمج العلاقات الإيجابية والسلبية. تم إنشاء الرسم البياني الدوري الموجه (DCG) المتصل بالكامل كهيكل أولي ، حيث تمثل العقد الملصقات وتشير أوزان الحواف إلى درجات التبعية بين الملصقات المتصلة.

تم اقتراح خوارزمية لتنقيح DCG إلى DAG عن طريق كسر الدورات بشكل متكرر ، مما يضمن إنشاء بنية BN فعالة. نقترح أيضًا استخدام الفرز الطوبولوجي على عقد DAG ، من أجل الحصول على ترتيب فعال للملصقات من بنية BN.

تم اقتراح وظيفة تسجيل جديدة لتقييم جودة BN ، والتي تتضمن درجة التبعية المحسوبة بواسطة الانتروبيا الشرطية ومصطلح عقوبة التعقيد. نظرًا لأن تعلم BN الأمثل هو الاستدلال مستعصًا على الحل ، فقد تم اقتراح خوارزمية إرشادية للحصول على حلول تقريبية بناءً على وظيفة التسجيل.

نجري مقارنات تجريبية واسعة النطاق بين الطريقة المقترحة والعديد من مناهج MLL الحديثة. تظهر الدراسات التجريبية أن الطريقة المقترحة يمكن أن تولد نموذج CC فعال مع تعقيد زمني منخفض نسبيًا في كل من التدريب والاختبار.

تم تنظيم ما تبقى من هذه الورقة على النحو التالي: في القسم 2 ، نقدم المعرفة الأساسية والأعمال ذات الصلة في القسم 3 ، ونقدم طريقتنا المقترحة في القسم 4 ، ويتم إجراء مقارنات تجريبية واسعة النطاق لإظهار مزايا الطريقة المقترحة أخيرًا ، الاستنتاجات الواردة في القسم 5.


نتائج

وجدت حسابات معدل الطفرات لـ SARS-CoV-2 ، استنادًا إلى جينوم ووهان المرجعي ، أن تغير النيوكليوتيدات شهريًا هو 1.7 (95٪ CI 1.4-2.0) ، على غرار التقديرات الأخرى 11 ، مع حدوث بدائل عند 0.9 × 10 - 3 (95٪ CI 0.5 - 1.4 × 10 –3) بدائل لكل موقع في السنة. قدم هذا الثقة في أن الجينوم المرجعي كان مناسبًا لهذه الدراسة ، لذلك شرعنا في تحديد ديناميكيات تفشي وباء COVID-19 من خلال تصنيف حالة كل بلد وفقًا لمرحلة epicurve مع إطار من المراحل: (أ) الفهرس (ب) الإقلاع ( ج) الانخفاض الأسي (د) كطريقة واضحة يمكن استخدامها لقياس المقاييس التي تسمح بالتكامل المتسق بين R وقياس تنوع الجينوم الفيروسي. أولاً ، تم تحديد R باستخدام الطريقة اللحظية مع فترتين متسلسلتين مختلفتين - 2 و 7 أيام (الجدول 1). اعتبارًا من 1 آذار (مارس) 2020 ، حدد هذا الإطار اللافتات العالمية على أنها تكتسب زخمًا عالميًا مع 52 دولة في مرحلة المؤشر. كانت ثلاثة بلدان في المرحلة الأسية وخمسة بلدان في مرحلة الإقلاع (الشكل 1). كانت الصين هي الدولة الوحيدة التي وصلت إلى ذروة المنحنى وتميزت بأنها في مرحلة الانحدار. لا يوجد دليل على وجود أي بلد آخر بالقرب من مرحلة الانحدار ، وكانت بعض البلدان على استعداد للانتقال إلى مرحلة الإقلاع والمرحلة الأسية على أساس المنحنى وحده.

توزيع تصنيف الدولة على أساس حالة السارس- CoV-2 epicurve.

وصف اللحظية R بشكل حساس التحولات في الوقت الحقيقي للوقوع التي تم التقاطها داخل كل مرحلة من مراحل اللقيمة (الشكل 2). انعكست مرحلة الانخفاض في الصين من خلال انخفاض في تقديرات R في المراحل الأخيرة من الفاشية وفيما يتعلق بالتقديرات المبكرة: 1.6 (95٪ CI 0.4-2.9) و 1.8 (95٪ CI 1.0-2.7) لل 2 و 7 الفاصل الزمني التسلسلي-أيام ، على التوالي. انتشرت الأحداث بشكل كبير في تقديرات R المتضخمة التي شوهدت في المرحلة الأسية التي لوحظت في كوريا الجنوبية: 2.8 (95٪ CI 0.6-5.3) و 25.6 (95٪ CI 3.0-48.2) للفاصل التسلسلي 2 و 7 أيام ، على التوالي. تم وضع مكافحة مميزة للمرض في سنغافورة مما مكنها من البقاء في مرحلة المؤشر بينما كانت اليابان تنتقل إلى مرحلة الإقلاع التي تتميز بتقديرات R المتزايدة 3.6 (95٪ CI 0.4-7.3) 2.2 (95٪ CI 1.3-3.0) لـ2 و 2 و الفاصل الزمني التسلسلي 7 أيام ، على التوالي. تداخلت تقديرات R لجميع المراحل النموذجية لتفشي المرض في البلد في سيناريوهين للفاصل التسلسلي ، مما يشير إلى أن الإرسال قد يكون قصيرًا مثل يومين. كانت هذه التقديرات أقل نسبيًا مما تم الإبلاغ عنه سابقًا ، مما يسلط الضوء على إمكانية انتقال العدوى خلال فترة الحضانة المرتبطة بانتشار الفاشيات سريعًا ، وهو ما لوحظ في العديد من البلدان الأوروبية في هذا الوقت أثناء الجائحة.

تقديرات عدد التكاثر اللحظي لمراحل مختلفة من منحنى وباء SARS-CoV-2: أ الفهرس (سنغافورة) ، ب الإقلاع (اليابان) ، ج أسي (كوريا الجنوبية) ، د رفض (الصين) باختصار (يومين) وفاصل تسلسلي قياسي (7 أيام). ينتج عن مرحلة التباطؤ من منحنى الوباء إلى رقم تناسلي أقل من 2 لكل من الفترات التسلسلية ، ومنحنى الوباء مع مقدمات متعددة ينتج فاصلًا تسلسليًا لمدة يومين مع رقم تكاثر أعلى والفاصل التسلسلي الأسي ينتج عنه رقم تناسلي أعلى للفاصل التسلسلي لمدة 7 أيام. يتوافق الارتفاع في منحنى الوباء في الصين مع تغيير تعريف حالة SARS-CoV-2 من خلال توسيع الحالات المؤكدة المصابة بالالتهاب الرئوي المؤكدة من خلال التصوير المقطعي المحوسب. يُعزى العدد الأكبر من التكاثر في كوريا الجنوبية إلى الانتقال الخفي المرتبط بعبادة سرية مع تغيير سلوك البحث عن الصحة.

لوحظ انخفاض اكتشاف حالات الإصابة بـ COVID-19 في البلدان الممثلة في مرحلة المؤشر بقيم R & lt 2 التي تُعزى إلى التباعد الاجتماعي الفعال (أي هونغ كونغ) أو قيد الاكتشاف للبلدان ذات الاختبار المحدود (أي الولايات المتحدة) (الشكل 3) -فهرس). حدث انتقال محلي مستدام في خمسة بلدان كانت تتقدم في مرحلة الإقلاع (اليابان وألمانيا وإسبانيا والكويت وفرنسا) بقيم R & gt 2 (الشكل 3 الإقلاع). كان حجم الانتشار واضحًا مع تقديرات R الأعلى نسبيًا (& gt 10) في إيطاليا وإيران وكوريا الجنوبية ، والتي أظهرت ارتفاعات مفاجئة في الحدوث بسبب مجموعات سابقة غير مكتشفة من الحالات (الشكل 3). أدى هذا إلى زيادة كبيرة في تقديرات R اللحظية بالنسبة لطرق التقدير الأخرى ولكنه سمح بتصوير أكثر وضوحًا لتزايد الحالات التي ميزت بدقة مرحلة الإقلاع عن المرحلة الأسية.

تقديرات Epicurve بفترات تسلسلية مختلفة. يمثل مؤشر اللوحة Epicurves وقيم R اللحظية لبلدان مرحلة الفهرس باستخدام فاصل تسلسلي من 2 إلى 7 أيام. ديناميات إقلاع اللوحة العالمية لـ SARS-CoV-2 باستخدام التقدير الفوري للرقم الإنجابي مع فاصل تسلسلي مدته يومان. في ظل سيناريو العدوى بفترة ما قبل الحضانة ، فإن الزيادة العالمية في نسبة R & gt 2. في إيطاليا R = 8 هي الأعلى بسبب الاكتشاف المتأخر لمجموعات العدوى. يرجع هذا التقدير الأعلى لـ R إلى حدوث نتوء كبير في الحالات المقترنة بفجوة تشخيصية لحدوث منخفض المستوى. نفس ديناميكيات الطفرة شوهدت في كوريا الجنوبية. الديناميات العالمية لـ SARS-CoV-2 باستخدام التقدير الفوري للرقم الإنجابي مع فاصل زمني 7 أيام. تتضخم قيمة R الإيطالية إلى 57 مع افتراض الفاصل التسلسلي لمدة 7 أيام وتتداخل مع الحد الأدنى لتقدير الفاصل التسلسلي لمدة يومين R. يصور هذا التقدير نمطًا متناقصًا لدول مقدمات متعددة مثل سنغافورة وهونج كونج.

درسنا كذلك ارتباط تقديرات R اللحظية الخاصة بالبلد من خلال مقارنة نطاقات درجات الحرارة المحلية المختلفة (الاستوائية مقابل المعتدلة) والكثافة السكانية للمدن التمثيلية مع تفشي المرض. تم استخدام نطاق درجة الحرارة الأعلى والكثافة السكانية لبلدان مختارة ومع ذلك ، لم يلاحظ أي ارتباط مباشر (الجدول 2). ارتبطت الزيادات في الحالات في كوريا الجنوبية إلى حد كبير بتفشي المرض بين مجموعة دينية سرية Shinsheonji (73 ٪ من حالات COVID-19 في كوريا الجنوبية) ، وتقع بشكل رئيسي في دايجو بكثافة سكانية منخفضة 883 / كم 2 مقارنة ببقية المناطق. المناطق التي تفشى فيها المرض 25 وقد يفسر توسع الفاشية في وقت مبكر من منطقة اللقيمة بدلاً من الكثافة السكانية للمنطقة. في حين أن معظم البلدان التمثيلية (الجدول 2) لديها درجات حرارة أكثر برودة (10-6 درجات مئوية) ، فإن درجات الحرارة المرتفعة في سنغافورة تشير إلى أن انتقال العدوى محليًا حدث في درجات حرارة أعلى ويشير إلى أن التغيرات في درجات الحرارة لن تغير على الأرجح انتقال العدوى. لم تفسر درجة الحرارة والكثافة السكانية التغيرات في اللقيمة. قادنا هذا إلى الافتراض بأن التباين الجينومي الفيروسي دعم التغييرات في اللقيمة في كل بلد.

لقد حددنا علاقة مرحلة اللقيمة بالتنوع الجيني الفيروسي باستخدام مقياس يدمج الاختلاف المطلق في الجينوم مع معدل تغيير الجينوم لإنشاء درجة GENI. رسخ هذا النهج تنوع الجينوم الفيروسي مع معدل تطور SARS-CoV-2 لإنشاء مؤشر قابل للمقارنة بين البلدان وتطور الفاشية. لدراسة كيفية ارتباط تنوع الجينوم الفيروسي بالمراحل اللقيمة ، قمنا أولاً بفحص مرحلة المؤشر (سنغافورة) والمرحلة الأسية (كوريا الجنوبية). نجح دمج درجات GENI في تمييز الفهرس والمراحل الأسية (الشكل 4). ارتبطت الزيادة في درجة GENI بالمرحلة الأسية بمتوسط ​​درجة = 4 ، مما يشير إلى أن التنوع الفيروسي ومعدل الطفرة كان متناسبًا بشكل مباشر مع زيادة الحالة خلال هذه المرحلة. حصلت سنغافورة (مرحلة الفهرس) على درجة GENI = 2. تم العثور على هذا في نقاط زمنية متعددة أثناء التفشي ، حيث ارتبطت أحداث الطفرات المتعددة ارتباطًا مباشرًا بزيادة في الحالات. بينما كانت الصين في مرحلة التدهور ، قدم الارتباط بأثر رجعي مع R والحالات ودرجة GENI دليلًا طوليًا على توسعات الحالات المتعددة مع أحداث الطفرة الفيروسية. كانت هذه الملاحظة واضحة بشكل خاص في وقت مبكر من المنحنى وأشارت إلى أن SARS-CoV-2 كان ينتشر في الصين قبل شهر واحد على الأقل من الإعلان الرسمي عن الفاشية (الشكل 4). قدم دمج هذه التقديرات دليلاً على أن الطفرات الفيروسية المتكررة تشير إلى حدوث تغيير في اللقيمة. تم ربط هذه المقاييس في كل نقطة زمنية على مدار 3 أشهر ، في ثلاثة بلدان ، وفي ثلاث مراحل تفشي مختلفة. هذه النتيجة مفيدة في دمج تنوع جينوم الفيروس ومعدل التطور في تقييم حالة التفشي. نجح النهج في تكرار الملاحظة في الحركة الفيروسية بين البلدان وداخل البلد عندما تم دمج اللقيمة في ثالوث مع تقديرات R فورية. تشير تناسب درجات GENI مع مرحلة epicurve إلى مرحلة التفشي بالإضافة إلى تحديد حالة الفاشية (الجدول 3).

علاقة درجة هوية الجينوم الممرض (GENI) بالإشارة الزمنية على طول منحنى الوباء. يتم التقاط الانتقال المحلي عن طريق طفرة الفيروس كما هو معبر عنه في قيم نقاط GENI. درجات GENI لعزلات SARS-CoV-2 مرتبطة بسلالة ووهان المرجعية Wuhan-Hu-1 NC_045512.2. يمثل الخط الأحمر في الصين اللقيمة الوقت قبل تحديد تفشي المرض ، ومع ذلك كانت تسلسلات الجينوم تنتشر. تشير المنحنيات المظللة باللون الأزرق إلى درجات GENE متراكبة مباشرة مع منحنى التفشي. يمثل الخط المنقط النقطة المشتركة في الوقت المناسب كمرجع للتصور. تُظهر درجة GENI و epicurve تشابهًا باستثناء الصين حيث تقدم تفشي المرض للإقلاع وزادت درجة GENI الأسية بينما في مثال مرحلة المؤشر في سنغافورة تم احتواء التفشي وظلت درجة GENI & lt 2.

تم إجراء مزيد من الفحص لهذا النهج باستخدام منحنيات الجينوم وعلم الأوبئة المقترنة بتباين SNP ، وليس تباين النسب ، من فبراير إلى أبريل 2020 ، والتي سجلت ارتفاعات موثقة في الفاشيات التي كانت متوافقة مع درجة GENI ومتغيرات SNP الناشئة حديثًا في المملكة المتحدة. أدى هذا التحليل إلى مزيد من التحقق من أن التباين الجيني كان يحدث حتى أثناء الإغلاق الذي كان يهدف إلى الحد من تفشي المرض وكان ينبئ بالطفرات المتكررة في العدوى باستخدام & gt 20.000 جينوم (الشكل 5). لوحظت أعداد قليلة من الحالات الجديدة (الشكل 5 داخليًا) ارتبطت بدرجات متغيرة من GENI (فبراير 2020). مع ارتفاع الحالات في أبريل 2020 ، ارتفعت درجة GENI بمعدل ثابت مما يشير إلى أن التباين الجيني كان يتزايد مع تزايد الحالات. أدى إنشاء إغلاق حكومي يهدف إلى تقليل التعرض إلى تغييرات متغيرة في منحنى تفشي المرض ، ولم يكن له أي تأثير على درجة GENI ، والتي استمرت في الارتفاع مشيرة إلى أنه عند حدوث التعرض ، كان الفيروس قادرًا على إصابة الشخص بسهولة. يشير هذا إلى أن الأسباب الكامنة للحالات الجديدة لها مكونان - اختلاف الجينوم الفيروسي (التطور) والتعرض الفردي. مع وضع هذا المفهوم في الاعتبار ، يمكن أن يشرح أحداث "الانتشار الفائق" استنادًا إلى تطور الجينوم المستمر للحفاظ على أو توسيع نطاق المضيف الذي يصيب الأشخاص الذين يشكلون مجموعات كبيرة بسهولة لتؤدي بسرعة إلى حالات جديدة. إن إظهار هذه الملاحظة المتكررة باستخدام تحليل طولي مع جينوم & GT 13000 ومئات من الحالات يقدم دعمًا قويًا للغاية لفكرة أن قياس التنوع الأليلي ينبئ بانتقال أعلى وسيتم ملاحظته عندما تكون الظروف المناسبة في مجموعات كبيرة أو التعرض باستخدام منحنيات التفشي . ومع ذلك ، هناك حاجة إلى عمل إضافي للإشارة على وجه التحديد إلى الطفرات الدقيقة التي ستبدأ حالات جديدة بسرعة أكبر ، كما يتضح من ظهور سلالة B.1.1.7 في أواخر عام 2020 داخل المملكة المتحدة وانتشارها بسرعة على مستوى العالم.

تم الحصول على نقاط GENI باستخدام 20000 13،419 تسلسل SARS-CoV-2 من المملكة المتحدة (أعلى) جنبًا إلى جنب مع epicurve المقابل. يعرض اللاحق الداخلي المستوى المنخفض للحالات في فبراير التي تشير إلى أن تفشي المرض كان في مرحلة الفهرس. تشير درجة GENI الأولية العالية إلى انتقال فيروسي خفي بينما تشير درجة GENI المتسقة إلى زيادة في الانتقال مع تقدم الوباء. يشير هذا أيضًا إلى أن الطفرات المستمرة تزيد من تنوع الجينوم الفيروسي. بينما تباينت اللقيمة بعد الإغلاق ، زادت درجة GENI باستمرار مما يدل على استمرار إنتاج التباين الجيني.

أظهرت هذه الدراسة تقدمًا في كيفية استخدام الجينوميات السكانية باستخدام تباين SNP (أي السبب الجيني الكامن وراء المتغيرات الناشئة) في مرض معد ، لا سيما عندما يكون معدل الطفرات سريعًا ويكون تنوع الجينوم للسكان كبيرًا ، مثل SARS- CoV-2. قدمت نتائج GENI عنصرًا مفقودًا من الأدلة التي حددت كيفية تقدير الحالات الجديدة قبل ظهورها بحوالي 2-5 أيام. تزداد دقة تقدير نقاط GENI مع تحليل أعداد كبيرة من الجينومات (أي مجموعات الجينوم ومجموعات SNPs) ومن مواقع عالمية مختلفة كما هو موضح (الشكل 5). وبالتالي ، تم اشتقاق إطار عمل لدمج علم الأوبئة والجينوميات السكانية من هذه الدراسة كطريقة لدمج علم الأوبئة الجزيئي بشكل منهجي في الصحة العامة (الشكل 6). تطلب الأمر إجراء قياسات ديناميكية لجهود البحث والمراقبة لتحديد WGS لكل فيروس. من الناحية المثالية ، سيكون لكل حالة عدة WGS مع تقدم المرض ولكن هذا لم يكن متاحًا. قدم استخدام هذا الثلاثي من القياسات بدقة وسرعة نظرة ثاقبة لقياس تقدم تفشي المرض ولكنه قدم أيضًا طريقة قائمة على الأدلة للحكم على فعالية التدخل.

تكامل الوبائيات الجينومية والكلاسيكية للتحقيق في الفاشية. أساس علم الأوبئة هو الإبلاغ الدقيق وفي الوقت المناسب عن الحالات التي تمكن من حساب العدد. يتم صياغة نقاط الهوية الجينية (GENI) من البيانات الجينية لمسببات الأمراض للتمييز بين الحالات المستوردة مقابل الانتقال المحلي وقياس وقت الانتشار المشفر. تقدم هاتان القيمتان الوبيتان معًا نظرة ثاقبة يمكن استخدامها بشكل مباشر لاتخاذ معايير القرار لتدخل الصحة العامة.


تحسين تركيز Mg 2+

يلعب المغنيسيوم عدة أدوار في تفاعل البوليميراز المتسلسل. وهو مضاد أيون كاتيوني ثنائي التكافؤ مطلوب لـ dNTPs وعامل مساعد لجميع البوليمرات. تؤثر الكاتيونات ثنائية التكافؤ بشدة على تهجين خيوط الدنا المزدوجة. تؤدي زيادة تركيز المغنيسيوم إلى زيادة الاستقرار ، أو درجة حرارة الانصهار ، لثنائي الحمض النووي. ويترتب على ذلك أن مستويات المغنيسيوم العالية تزيد من تقارب البادئات نحو التهجين ، بما في ذلك أحداث التهيئة الخاطئة وتفاعلات التمهيدي. تصبح وحدات الدنا المزدوجة ذات التهيئة الخاطئة ركائز لبوليميراز الحمض النووي ، مما يؤدي في الواقع إلى إنشاء منتجات جانبية وتقليص كفاءة تفاعل البوليميراز المتسلسل. لذلك ، فإن تركيز MgCl2 له تأثير على كل من خصوصية وعائد PCR لأن المغنيسيوم يؤثر على تهجين التمهيدي إلى الهدف ، ومعالجة بوليميريز DNA Taq ، وكذلك معدل التحلل المائي بواسطة جزء نوكلياز خارجي عند استخدامه لانقسام المسبار في qPCR. ومن ثم ، فإن MgCl غير كاف2 ينتج عنه عوائد ضعيفة بسبب معدل البلمرة المنخفض لبوليميراز الحمض النووي ، والترابط التمهيدي المخترق وانقسام المسبار غير الفعال. إذا كان تركيز MgCl2 عالية جدًا ، سيتم اختراق خصوصية التفاعل لأن هذا سيؤدي إلى مزيد من الاستقرار في التهجين التمهيدي غير المحدد.

على عكس فحوصات PCR التقليدية التي تستخدم 1.5-2 ملي مولار MgCl القياسي2 التركيزات ، تتطلب فحوصات مسبار التحلل المائي qPCR تركيزات أعلى من حوالي 3-5 ملي مولار لتحقيق الانقسام الفعال للمسبار. وجود MgCl2 يزيد أيضًا من معدل تهجين الحمض النووي ، مما يتيح التهجين الفعال أثناء ظروف التدوير السريع التي تستخدمها العديد من الأدوات. تحسين MgCl2 تصبح التركيزات أكثر أهمية عند إجراء تفاعلات متعددة.

الأملاح ، مثل بوكل أو (NH4)2وبالتالي4, سيغير أيضًا DNA مزدوج Tم لكن التأثير أقل حدة بالنسبة لهذه الكاتيونات أحادية التكافؤ.

الشكل 9.5. آثار تركيز المغنيسيوم.

الآثار الموضحة في الشكل 9.5، يتم تكبيرها عند إجراء تعدد إرسال تفاعل البوليميراز المتسلسل. يؤدي إجراء تفاعلات متعددة بشكل متزامن إلى المنافسة على الكواشف ويؤدي إلى تفاقم أي ظروف دون المستوى الأمثل ، مما يؤدي إلى حدوث تغييرات كبيرة في كفاءة تفاعل البوليميراز المتسلسل.

معدلات المنحدر

هناك حالات نادرة عندما يتطلب رد الفعل الصعب مزيدًا من التعديل. عندما يتم استنفاد جميع الخيارات الأخرى ، قد يكون من الممكن استعادة الوضع المفقود عن طريق الاختبار التجريبي وتعديل معدل منحدر PCR.


المنهجية

نظام المرجع الأساسي

إن اختيار النظام المرجعي الأساسي هو ذلك الذي تم وضعه في اجتماع تسوكوبا (13). انظر عمل لو وأولسون (25) لمناقشة كاملة لتأثير هذا الاختيار. يمكن العثور على الموضع الرسومي لهذا النظام المرجعي فيما يتعلق بالبيورينات القياسية والبيريميدينات في مرجع Tsukuba. لتجنب الاضطرار إلى إعطاء النظام المرجعي بالإحداثيات الديكارتية لكل قاعدة قياسية ، نحسبه باستخدام ذرات القاعدة المختارة. هذه هي C1 'و N1 (Y) / N9 (R) و C2 (Y) / C4 (R) في القواعد القياسية (حيث Y عبارة عن بيريميدين و R عبارة عن بورين). يمكن للمستخدمين تغيير هذه الذرات للتعامل مع الحالات غير القياسية. على سبيل المثال ، للتعامل مع pseudouridine الأساسي RNA المرتبط بالعمود الفقري للفوسفوديستر من خلال C5 ، فإن الذرات المكافئة ستكون C1 و C5 و C4.من أجل الاكتمال ، نقدم طريقة البناء لدينا: يتضمن ذلك الذرات التي تشكل الرابطة الجليكوسيدية بين كل قاعدة والعمود الفقري للسكر والفوسفات ، N1 - C1 للبيريميدين و N9 - C1 للبيورينات والطبيعي إلى المستوى المتوسط ​​للقاعدة (يطلق عليه بن أدناه). يتم تحديد اتجاه الوضع الطبيعي من خلال حاصل الضرب العرضي (N1 – C1 ') × (N1 – C2) للبيريميدينات و (N9 – C1') × (N9 – C4) للبيورينات. النقطة المرجعية الأساسية (تسمى بص أدناه) عن طريق تدوير متجه الطول د (محاذيًا في البداية لاتجاه N – C1) في اتجاه عقارب الساعة بزاوية τ1 حول المتجه الطبيعي الذي يمر عبر ذرة N. المتجه التالي للنظام المرجعي ، مشيرًا نحو العمود الفقري للفوسفوديستر المرتبط بالقاعدة (يُطلق عليه بإل أدناه) من خلال دوران مماثل ، ولكن باستخدام متجه الوحدة والزاوية τ2. المتجه الأخير للنظام المرجعي ، مشيرًا إلى الأخدود الرئيسي ، بد، يتم الحصول عليها من الضرب التبادلي بإل × بن. بالنسبة لاتفاقية تسوكوبا ، τ1 = 141.47°, τ2 = -54.41 درجة و د = 4.702 Å. استخدم برنامج Curves السابق قيم 132.19 ° و −54.51 ° و 4.503 Å على التوالي. التأثير الرئيسي لهذا التغيير هو حركة النقطة المرجعية الأساسية نحو الأخدود الرئيسي ، مما يعني أن قيم Xdisp (قياس إزاحة القواعد أو أزواج القاعدة على طول الجسم الزائف فيما يتعلق بالمحور الحلزوني) تصبح أكثر إيجابية بمقدار 0.77 Å مع النظام المرجعي الجديد. هناك أيضًا تغيير في الشريحة ، والتي تكون أكثر إيجابية بمقدار 0.47 Å مع المرجع الجديد. للمقارنات مع النتائج السابقة ، Curves + يسمح للمستخدم باختيار النظام المرجعي القديم بشكل اختياري.

نظرًا لأن الهياكل منخفضة الدقة ، وكذلك لقطات من مسارات MD ، قد تحتوي على قواعد مشوهة ، فمن المستحسن أن تبدأ من خلال تركيب المربعات الصغرى (26) هندسة أساسية قياسية للذرات في بنية الإدخال قبل تحديد النظام المرجعي الأساسي. يوفر Curves + الأشكال الهندسية القياسية لعدد من قواعد DNA و RNA في ملف بيانات (standard_b.lib) يمكن تعديله وتوسيعه بواسطة المستخدم. يجب تحديد ذرات الحلقة فقط (بالإضافة إلى C1 ') في كل حالة. باستخدام هذه البيانات ، ستقوم Curves + تلقائيًا بتنفيذ المربعات الصغرى لبيانات الإدخال ، ولكن يمكن للمستخدم منع هذا الملاءمة إذا رغب في ذلك.

معلمات زوج داخل القاعدة

تتألف معلمات الزوج داخل القاعدة من ثلاث ترجمات ، القص ، والتمدد ، والترنح ، وثلاث دورات ، وإبزيم ، ومروحة ، وفتحة. وفقًا لاتفاقية Tsukuba ، تصف القيم الصفرية لهذه المعلمات أزواج قاعدة Watson-Crick الأساسية والقيم غير الصفرية تصف التشوهات فيما يتعلق بالمحور القصير للأزواج الأساسية ومحورها الطويل وطبيعتها على التوالي (انظر الشكل التكميلي S1). يتم حساب المعلمات من خلال تحديد تحويل الجسم الصلب الذي يحدد نظامًا مرجعيًا أساسيًا على الآخر. لمناقشة المناهج المماثلة والرياضيات الأساسية انظر المرجع (27-29). ومع ذلك ، لحساب التناظر الزائف لأزواج قاعدة Watson-Crick (بما في ذلك دوران 180 درجة حول متجه pseudodyad المحاذاة مع المحور القصير للأزواج الأساسية والإشارة إلى أخاديد DNA) ، فإن النظام المرجعي للقاعدة الثانية هو أولاً تحولت عن طريق عكس بإل و بن النواقل قبل حساب تحول الجسم الصلب. في حالة أزواج Watson – Crick العكسية ، يتوافق المحور الكاذب مع الزوج الأساسي الطبيعي وبالتالي يتضمن الانعكاس بد و بإل ثلاثة أبعاد.

يتم تعريف تحول الجسم الصلب بين قواعد الزوج الأساسي بحيث يحرك النظام المرجعي الأساسي الأول ب 1 على النظام الثاني (ثنائي مقلوب) ب 2 عبر ناقل الترجمة λأ = ب 2صب 1ص مقترنة بالدوران بزاوية θأ حول متجه محور الوحدة يوأ. من الملائم التعبير عن هذه المتجهات فيما يتعلق بالمكونات في نظام مرجعي متوسط ب مرتبط بالزوج الأساسي (يُشار إليه بواسطة المتجهات المتعامدة بإل, بد, بن والنقطة بص). للقيام بذلك بشكل متماثل قدر الإمكان ، نختار إطارًا متوسطًا يتم الحصول عليه بالتناوب والترجمة للنظام المرجعي الأساسي الأول ، ولكن الآن من خلال نصف الزاوية θأ/ 2 ، حول نفس متجه المحور يوأ، ونصف الترجمة λأ/2.

نحتاج إلى أن نكون قادرين على استخراج متجه محور دوران الوحدة يوأ وزاوية θأ من معرفة الإطارين ب 1 و ب 2 وعلى العكس من ذلك ، تكون قادرًا على إعادة بناء إطار واحد من الآخر نظرًا لمحور الدوران وزاوية الدوران.


7.4 التطبيع عن طريق المسامير

يعتمد التطبيع المتصاعد على افتراض أنه تمت إضافة نفس المقدار من RNA إلى كل خلية (A. T.Lun et al. 2017). لا يمكن أن تكون الاختلافات المنهجية في تغطية النصوص المتصاعدة إلا بسبب التحيزات الخاصة بالخلية ، على سبيل المثال ، في كفاءة الالتقاط أو عمق التسلسل. لإزالة هذه التحيزات ، فإننا نوازن التغطية الزائدة عبر الخلايا عن طريق التحجيم باستخدام "عوامل حجم الارتفاع". مقارنة بالطرق السابقة ، لا يتطلب التطبيع المفاجئ أي افتراض حول بيولوجيا النظام (أي عدم وجود العديد من جينات DE). بدلاً من ذلك ، تفترض أن النصوص المتصاعدة تمت إضافتها (1) بمستوى ثابت لكل خلية ، و (2) تستجيب للتحيزات بنفس الطريقة النسبية مثل الجينات الذاتية.

من الناحية العملية ، يجب استخدام التطبيع المفاجئ إذا كانت الاختلافات في محتوى الحمض النووي الريبي الكلي للخلايا الفردية ذات أهمية ويجب الحفاظ عليها في تحليلات المصب. بالنسبة لخلية معينة ، لن تؤدي الزيادة في الكمية الإجمالية من الحمض النووي الريبي الداخلي المنشأ إلى زيادة عامل حجمها الضخم. هذا يضمن أن تأثيرات محتوى RNA الكلي على التعبير عبر السكان لن تتم إزالتها عند القياس. بالمقارنة ، فإن طرق التطبيع الأخرى الموضحة أعلاه ستفسر ببساطة أي تغيير في إجمالي محتوى الحمض النووي الريبي كجزء من التحيز وإزالته.

نوضح استخدام التطبيع المفاجئ على مجموعة بيانات مختلفة تتضمن تنشيط الخلايا التائية بعد التحفيز باستخدام روابط مستقبلات الخلايا التائية ذات التقارب المتفاوت (ريتشارد وآخرون ، 2018).

نطبق طريقة computeSpikeFactors () لتقدير عوامل حجم الارتفاع لجميع الخلايا. يتم تعريف ذلك عن طريق تحويل إجمالي عدد الزيادة لكل خلية إلى عامل حجم ، باستخدام نفس المنطق كما في librarySizeFactors (). سيزيل التحجيم لاحقًا أي اختلافات في التغطية الزائدة عبر الخلايا.

نلاحظ وجود علاقة إيجابية بين عوامل حجم الارتفاع وعوامل حجم deconvolution داخل كل حالة معالجة (الشكل 7.3) ، مما يشير إلى أنهم يلتقطون تحيزات تقنية مماثلة في تسلسل العمق وكفاءة الالتقاط. ومع ذلك ، نلاحظ أيضًا أن التحفيز المتزايد لمستقبلات الخلايا التائية - من حيث زيادة التقارب أو الوقت - ينتج عنه انخفاض في عوامل الارتفاع المرتبطة بعوامل حجم المكتبة. يتوافق هذا مع زيادة نشاط التخليق الحيوي وإجمالي محتوى الحمض النووي الريبي أثناء التحفيز ، مما يقلل من التغطية النسبية في كل مكتبة (مما يقلل من عوامل الحجم الزائدة) ولكنه يزيد من تغطية الجينات الذاتية (وبالتالي زيادة حجم المكتبة عوامل).

الشكل 7.3: عوامل الحجم من التطبيع المفاجئ ، مرسومة مقابل عوامل حجم المكتبة لجميع الخلايا في مجموعة بيانات الخلايا التائية. كل قطعة تمثل علاجًا مختلفًا للرابطات وكل نقطة عبارة عن خلية ملونة حسب الوقت من التحفيز.

الاختلافات بين هاتين المجموعتين من عوامل الحجم لها عواقب حقيقية على تفسير المصب. إذا تم تطبيق عوامل حجم الارتفاع على الأعداد ، فسيتم تكبير قيم التعبير في الخلايا غير المحفزة بينما سيتم تصغير التعبير في الخلايا المحفزة. ومع ذلك ، فإن العكس سيحدث إذا تم استخدام عوامل حجم التفكك. يمكن أن يظهر هذا كتحولات في حجم واتجاه DE بين الظروف عندما ننتقل بين استراتيجيات التطبيع ، كما هو موضح أدناه لـ ملاط 1 (الشكل 7.4).

الشكل 7.4: توزيع قيم التعبير التي تم تسويتها بسجل لـ ملاط 1 بعد التطبيع مع عوامل حجم deconvolution (يسار) أو عوامل حجم الارتفاع (يمين). يتم تقسيم الخلايا إلى طبقات حسب التقارب الترابطي وتلوينها في الوقت الذي يلي التحفيز.

ما إذا كان محتوى الحمض النووي الريبي الكلي ذا صلة أم لا - وبالتالي ، فإن اختيار استراتيجية التطبيع - يعتمد على الفرضية البيولوجية. في معظم الحالات ، لا تكون التغييرات في إجمالي محتوى الحمض النووي الريبي مثيرة للاهتمام ويمكن تطبيعها من خلال تطبيق حجم المكتبة أو عوامل التفكك. ومع ذلك ، قد لا يكون هذا مناسبًا دائمًا إذا كانت الاختلافات في إجمالي الحمض النووي الريبي مرتبطة بعملية بيولوجية ذات أهمية ، على سبيل المثال ، نشاط دورة الخلية أو تنشيط الخلية التائية. سيحافظ التطبيع المفاجئ على هذه الاختلافات بحيث يكون لأي تغييرات في التعبير بين المجموعات البيولوجية العلامة الصحيحة.

لكن! بغض النظر عما إذا كنا نهتم بمحتوى الحمض النووي الريبي الكلي ، فمن الأهمية بمكان أن يتم تطبيع النسخ المتصاعدة باستخدام عوامل الحجم المرتفعة. لا ينبغي تطبيق عوامل الحجم المحسوبة من تعداد الجينات الذاتية على النصوص المتصاعدة ، على وجه التحديد لأن الأولى تلتقط الاختلافات في إجمالي محتوى الحمض النووي الريبي التي لم يختبرها الأخير. ستؤدي محاولة تطبيع أعداد الزيادة مع عوامل الحجم المستندة إلى الجينات إلى التطبيع المفرط والتقدير غير الصحيح. وبالتالي ، إذا كانت البيانات المعيارية المتصاعدة مطلوبة ، فيجب علينا حساب مجموعة منفصلة من عوامل الحجم للنصوص المتصاعدة التي يتم تنفيذها تلقائيًا بواسطة وظائف مثل modelGeneVarWithSpikes ().


تحليل نمط Multivoxel لبيانات الرنين المغناطيسي الوظيفي: مراجعة

1 Labour d'Informatique، Mathématique، Intelligence Artificielle et Reconnaissance de Formes (LIMIARF)، College of Sciences، Université Mohammed V-Agdal، 4 Avenue Ibn Battouta، BP 1014، Rabat، Morocco

2 Institut de Neurosciences de la Timone (INT)، UMR 7289 CNRS، and Aix Marseille Université، 27 boulevard Jean Moulin، 13385 Marseille، France

3 Institut de Neurosciences des Systèmes (INS)، UMR 1106 INSERM، and Faculté de Médecine، Aix Marseille Université، 27 boulevard Jean Moulin، 13005 Marseille، France

الملخص

يستغل التصوير بالرنين المغناطيسي الوظيفي (fMRI) التباين المعتمد على الدم والأكسجين (BOLD) لرسم خريطة للنشاط العصبي المرتبط بمجموعة متنوعة من وظائف الدماغ بما في ذلك المعالجة الحسية والتحكم الحركي والوظائف الإدراكية والعاطفية. يتم استخدام نهج النموذج الخطي العام (GLM) للكشف عن مناطق الدماغ ذات الصلة بالمهام من خلال البحث عن الارتباطات الخطية بين الدورة الزمنية للرنين المغناطيسي الوظيفي والنموذج المرجعي. أحد قيود نهج GLM هو الافتراض بأن التغاير عبر وحدات البكسل المجاورة ليس بالمعلومات حول الوظيفة المعرفية قيد الفحص. يمثل تحليل نمط Multivoxel (MVPA) تقنية واعدة يتم استغلالها حاليًا للتحقيق في المعلومات الواردة في الأنماط الموزعة للنشاط العصبي لاستنتاج الدور الوظيفي لمناطق وشبكات الدماغ. يعتبر MVPA مشكلة تصنيف خاضعة للإشراف حيث يحاول المصنف التقاط العلاقات بين النمط المكاني لنشاط الرنين المغناطيسي الوظيفي والظروف التجريبية. في هذا البحث ، نقوم بمراجعة MVPA ووصف الأساس الرياضي لخوارزميات التصنيف المستخدمة لفك تشفير إشارات الرنين المغناطيسي الوظيفي ، مثل آلات ناقلات الدعم (SVM). بالإضافة إلى ذلك ، نصف سير العمل لخطوات المعالجة المطلوبة لـ MVPA مثل اختيار الميزة ، وتقليل الأبعاد ، والتحقق من الصحة ، وتقدير أداء المصنف بناءً على منحنيات خصائص تشغيل المستقبِل (ROC).

1. الاستدلال الإحصائي الكلاسيكي في أبحاث الرنين المغناطيسي الوظيفي

يستغل التصوير بالرنين المغناطيسي الوظيفي (fMRI) التباين المعتمد على الدم والأكسجين (BOLD) لرسم خريطة للنشاط العصبي المرتبط بمجموعة متنوعة من وظائف الدماغ بما في ذلك المعالجة الحسية والتحكم في المحركات والوظائف المعرفية والعاطفية [1 ، 2]. ترجع التغييرات في إشارة BOLD إلى تعديلات الدورة الدموية والتمثيل الغذائي المرتبطة بالنشاط العصبي. تعكس استجابات BOLD بشكل أساسي المدخلات المشبكية التي تقود التجمعات العصبية ، بدلاً من نشاط إطلاق النار الناتج [3]. تحتوي قاعدة بيانات الرنين المغناطيسي الوظيفي النموذجية على دورات وقت إشارة BOLD مسجلة في وحدات بكسل متعددة في الدماغ. فوكسل هو مكعب مستطيل ثلاثي الأبعاد ، أبعاده في حدود المليمترات. من أجل تعيين المناطق الدماغية المشاركة في وظيفة معرفية معينة ، يتم تحليل إشارة BOLD في كل فوكسل [4]. يتم إجراء الاستدلال الإحصائي بشكل شائع باستخدام نهج النموذج الخطي العام (GLM) للكشف عن مناطق الدماغ ذات الصلة بالمهمة (أو "النشطة") من خلال البحث عن الارتباطات الخطية بين الدورة الزمنية للرنين المغناطيسي الوظيفي والنموذج المرجعي الذي حدده المجرب [5-9 ]. ثم يتم إجراء التحليل الإحصائي بشكل متكرر على جميع وحدات البكسل لتحديد مناطق الدماغ التي تعرض استجاباتها الجريئة تأثيرات إحصائية مهمة. غالبًا ما يُشار إلى هذا النهج بالتحليل القائم على النموذج أحادي المتغير ، وهو يمثل المعيار الذهبي في أبحاث الرنين المغناطيسي الوظيفي. هذا النهج ، ومع ذلك ، يعاني من العديد من القيود. أحد الأشياء الأكثر إقناعًا هو الافتراض بأن التغاير عبر وحدات البكسل المجاورة ليس بالمعلومات حول الوظيفة المعرفية قيد الفحص. سنراجع الأساليب الإحصائية المستخدمة في تحليل GLM ثم نقدم كيف تتغلب الأدوات الإحصائية متعددة المتغيرات والخالية من النماذج القائمة على أساليب التعلم الآلي على هذه القيود وتوفر نهجًا جديدًا في أبحاث التصوير العصبي.

1.1 نهج GLM: التحليل الشامل المتغير الشامل والتحليل المستند إلى النموذج لبيانات الرنين المغناطيسي الوظيفي

عادة ما يتم التعبير عن GLM في صياغة المصفوفة بواسطة & # 13

هو المتغير التابع وهو متجه عمود يحتوي على إشارة BOLD في فوكسل واحد هو متجه الخطأ الذي تكون عناصره مستقلة ومتشابهة ومتغيرات عشوائية عادية مع متوسط ​​صفر وتباين

هو متجه العمود لمعلمات النموذج حيث يكون عدد معلمات النموذج

مصفوفة التصميم وهي وصف شبه كامل للنموذج. يحتوي على متغيرات توضيحية (صف واحد لكل نقطة زمنية وعمود واحد لكل متغير توضيحي) تحدد المعرفة التجريبية حول الإشارة المتوقعة.

تقديرات المعلمة للنموذج الذي نشير إليه

يتم الحصول عليها عن طريق تقليل تربيع الفروق بين الإشارة المقدرة

. المجموع المتبقي للمربعات

هو مجموع تربيع الفروق بين القيم الفعلية والقيم المناسبة ، وبالتالي يقيس ملاءمة النموذج بتقديرات المعلمات هذه. أقل تقديرات المربعات هي -values ​​التي تصغر. يتم الحصول عليها عندما & # 13

& # 13 من أجل مقارنة الظروف التجريبية ، تي- أو F- تسمح الإحصائيات باختبار مجموعة خطية من القيم التي تتوافق مع الفرضيات الصفرية [10]. على سبيل المثال ، لاختبار ما إذا كان التنشيط مشروطًا

يختلف اختلافًا كبيرًا عن التنشيط في الحالة

، من عينتين ر- يمكن استخدام الاختبار. في هذه الحالة ، ستشير الفرضية الصفرية إلى أن قيم الشرطين لن تختلف ، أي ،

لتعميم هذه الحجة ، فإننا نأخذ في الاعتبار الدوال الخطية لتقديرات بيتا: & # 13

هي معاملات دالة "تتناقض" مع تقديرات بيتا. يشار إلى المتجه باسم التباين المتجه. بهذا التعريف ، يمكن كتابتها بعد ذلك باستخدام منتج عددي.

لاختبار ما إذا كانت مجموعات الشروط المحددة في تختلف اختلافًا كبيرًا عن الفرضية الصفرية ، فإن تي-يتم حساب الإحصاء في كل فوكسل كـ & # 13

& # 13 الأساليب الإحصائية الكلاسيكية ، مثل F-test أو ANOVA (تحليل التباين) ، هي حالات خاصة لتحليل GLM ويمكن استخدامها لأداء الاستدلال الإحصائي في كل فوكسل. تنشأ الخريطة المعيارية الإحصائية الناتجة (SPM) من اختبار فرضيات متعددة (أي في جميع وحدات البكسل). تقليديًا ، يتم التحكم في مستوى الأهمية للأخطاء العائلية باستخدام إجراءات مقارنة متعددة مناسبة (على سبيل المثال ، تصحيح Bonferroni). بالإضافة إلى ذلك ، تُستخدم نظرية المجال العشوائي الغاوسي (RFT) [11] لمراعاة السلاسة المكانية للخريطة الإحصائية. بدلاً من تعيين قيمة لكل فوكسل ، يتم إنشاء مجموعات من وحدات البكسل على أساس عتبة أولية ، ثم يتم تعيين قيمة لكل مجموعة [5 ، 12]. تعرض الخرائط الإحصائية العتبة الناتجة مناطق الدماغ التي يرتبط نشاطها BOLD بشكل كبير بالوظائف المعرفية قيد التحقيق (الشكل 1).


1.2 البحث عن تحليل بيانات الرنين المغناطيسي الوظيفي متعدد المتغيرات وخالي من النماذج

أحد قيود نهج GLM أحادي المتغير هو افتراض أن التباين المشترك عبر وحدات فوكسل المجاورة ليس بالمعلومات حول الوظيفة المعرفية قيد الفحص. يعتبر هذا التباين بمثابة ضوضاء غير مرتبطة ويتم تقليله عادةً باستخدام المرشحات المكانية التي تنعم إشارات BOLD عبر وحدات البكسل المجاورة. بالإضافة إلى ذلك ، فإن نهج GLM مقيد حتماً بالنموذج المستخدم للاستدلال الإحصائي.

تمثل طرق الرنين المغناطيسي الوظيفي متعدد المتغيرات والخالية من النماذج تقنيات واعدة للتغلب على هذه القيود من خلال التحقيق في الدور الوظيفي للأنماط الموزعة للنشاط العصبي دون افتراض نموذج معين. تعتمد الأساليب الخالية من النماذج متعددة المتغيرات على التعلم الآلي وخوارزميات التعرف على الأنماط. في الوقت الحاضر ، أصبح تحليل نمط multivoxel (MVPA) تقنية رائدة في تحليل بيانات التصوير العصبي ، وقد تم استخدامه على نطاق واسع لتحديد الركائز العصبية للوظائف المعرفية التي تتراوح من الإدراك البصري إلى معالجة الذاكرة [13-16].

الهدف من الورقة الحالية هو مراجعة الشكلية الرياضية الكامنة وراء MVPA لبيانات الرنين المغناطيسي الوظيفي في إطار أدوات التصنيف الخاضعة للإشراف. سنراجع الأدوات الإحصائية المستخدمة حاليًا ونحدد الخطوات المطلوبة لإجراء التحليل متعدد المتغيرات.

2. تحليل مولتيفوكسيل الرنين المغناطيسي الوظيفي كمشكلة تصنيف خاضعة للإشراف

يتضمن تحليل نمط متعدد الفوكسل (MVPA) البحث عن أنماط مكانية عالية التكاثر للنشاط تتمايز عبر الظروف التجريبية. لذلك يعتبر MVPA مشكلة تصنيف خاضعة للإشراف حيث يحاول المصنف التقاط العلاقات بين الأنماط المكانية لنشاط الرنين المغناطيسي الوظيفي والظروف التجريبية [17].

بشكل عام ، يتكون التصنيف في تحديد وظيفة القرار

تأخذ قيم "الميزات" المختلفة في "مثال" البيانات

ويتنبأ بفئة هذا "المثال". "الميزات" هو مصطلح عام يُستخدم في التعلم الآلي ليكون مجموعة من المتغيرات أو السمات التي تصف "مثالاً" معينًا. في سياق التصوير بالرنين المغناطيسي الوظيفي ، قد يمثل "المثال" تجربة معينة في التشغيل التجريبي ، وقد تمثل "الميزات" إشارات الرنين المغناطيسي الوظيفي المقابلة في مجموعة من وحدات البكسل. قد تمثل الظروف التجريبية الفئات المختلفة.

للحصول على وظيفة القرار ، يجب تقسيم البيانات (أي الأمثلة وتسميات الفصل المقابلة) إلى مجموعتين: "مجموعة التدريب" و "مجموعة الاختبار". يتم تدريب المصنف باستخدام مجموعة التدريب. يتكون التدريب من نمذجة العلاقة بين الميزات وعلامة الفصل عن طريق تعيين وزن

لكل ميزة. يتوافق هذا الوزن مع المساهمة النسبية للميزة في تصنيف فئتين أو أكثر بنجاح. عندما يكون هناك أكثر من فئتين في التصميم التجريبي ، يمكن تحويل التحليل إلى مجموعة من مشاكل من فئتين (أي ، كل فئة مقابل كل الفئات الأخرى). ثم يتم تقييم المصنف باستخدام مجموعة الاختبار لتحديد أدائه في التقاط العلاقة بين الميزات والفئات. نظرًا لوجود العديد من إمكانيات تقسيم البيانات (انظر القسم 4) ، يمكن للمرء أن يتدرب ويختبر العديد من المصنفات وينتهي به الأمر بأقصى أداء.

أصبحت آلات ناقلات الدعم (SVM) [18 ، 19] مؤخرًا شائعة كمصنفات خاضعة للإشراف لبيانات الرنين المغناطيسي الوظيفي نظرًا لأدائها العالي وقدرتها على التعامل مع مجموعات البيانات الكبيرة عالية الأبعاد ومرونتها في نمذجة مصادر البيانات المتنوعة [20- 22]. علاوة على ذلك ، تتوفر مكتبات قياسية تطبق SVM مثل SVM-light [23] و LIBSVM [24] و PyMVPA [25]. لذلك سنقوم بمراجعة الأساس الرياضي لـ SVMs.

2.1. الأساس الرياضي لآلات المتجهات الداعمة
2.1.1. خطي SVM

في أبسط شكل خطي من SVMs لفئتين ، الهدف هو تقدير حد القرار (المستوى الفائق) الذي يفصل بحد أقصى للهامش مجموعة من الأمثلة الإيجابية من مجموعة من الأمثلة السلبية (الشكل 2). كل مثال هو متجه إدخال () له

) ويرتبط بإحدى فئتين أو. على سبيل المثال ، في أبحاث الرنين المغناطيسي الوظيفي ، تحتوي متجهات البيانات على قيم BOLD في نقاط زمنية منفصلة (أو متوسطات النقاط الزمنية) أثناء التجربة ، ويمكن أن تكون الميزات عبارة عن مجموعة من وحدات البكسل المستخرجة في كل نقطة زمنية تشير إلى الحالة ، وتشير إلى الحالة ب.


(أ)
(ب)
(أ)
(ب) رسم توضيحي ثنائي الأبعاد لحد القرار للمصنف الخطي لآلة متجه الدعم (SVM). (أ) الهامش الصعب على الأمثلة القابلة للفصل خطيًا حيث لا يُسمح بأخطاء التدريب. (ب) الهامش الناعم حيث يتم إدخال خطأين تدريب لجعل البيانات غير قابلة للفصل بشكل غير خطي. تسمى الأمثلة المنقطة متجهات الدعم (وهي تحدد الهامش الذي يتم من خلاله فصل الفئتين).

إذا افترضنا أن البيانات قابلة للفصل خطيًا ، مما يعني أنه يمكننا رسم خط على الرسم البياني للميزة مقابل الميزة التي تفصل بين الفئتين عندما والمستوى الفائق على الرسوم البيانية للوقت

، ينتج SVM الدالة المميزة بأكبر هامش ممكن: & # 13

هو متجه الوزن الطبيعي للمستوى الفائق المنفصل ، ويشار إليه باسم "التحيز" ، وهو يترجم المستوي الفائق بعيدًا عن أصل مساحة الميزة ، وهو المنتج الداخلي: & # 13

يحاول SVM العثور على المستوى الفائق الأمثل الذي يزيد حجم الهامش

، وهذا هو ، يجد ومن خلال حل ما يلي البدائي مشكلة التحسين: & # 13

ومع ذلك ، من الناحية العملية ، لا يمكن فصل البيانات خطيًا في كثير من الأحيان. للسماح بأخطاء التدريب ثم زيادة أداء المصنف ، متغيرات فترة الركود

& # 13 عندما ، (على سبيل المثال ، (7)) ، يكون الهامش هو عرض الفجوة بين الفئات التي لا تسمح بأخطاء التدريب ، ويشار إليها باسم "الهامش الصعب".

يعني أنه يُسمح لأمثلة التدريب المقابلة أن تكون داخل الفجوة المحددة بواسطة المستوى الفائق والهامش. يسمح بتصنيف خاطئ لبعض أمثلة التدريب. في مثل هذه الحالة ، يشار إلى الهامش باسم "الهامش الناعم" (الشكل 2).

للتحكم في المفاضلة بين تعقيد الطائرة الفائقة وأخطاء التدريب ، عامل جزائي

تم تقديمه. ال البدائي تصبح مشكلة التحسين & # 13

& # 13 القيم العالية تجبر متغيرات الركود على أن تكون أصغر ، وتقريبًا لسلوك الهامش الصلب SVM (). يوضح الشكل 3 تأثير على حدود القرار. كبير لا يسمح بأي خطأ تدريب. () صغير ومع ذلك يسمح ببعض أخطاء التدريب. في هذا الشكل ، يُفضل عادةً لأنه يمثل مفاضلة بين أداء المصنف المقبول والتعميم على الأمثلة غير المرئية (على سبيل المثال ، التجهيز الزائد).


على حدود القرار. الخط الصلب (

) يسمح ببعض أخطاء التدريب (تم تصنيف المثال الأحمر في أعلى اليسار بشكل خاطئ). الخط المتقطع (

) لا يسمح بأي خطأ في التدريب. على الرغم من أن

لحل المذكور البدائي مشكلة التحسين حيث يجب تصغير الوظيفة وفقًا للقيود الخارجية الثابتة ، يتم استخدام طريقة مضاعفات لاجرانج. توفر هذه الطريقة استراتيجية لإيجاد الحد الأقصى المحلي والحد الأدنى لوظيفة تخضع لقيود المساواة. يتم تضمينها في هدف التصغير ، وتسمح مضاعفات لاغرانج بتحديد مقدار التأكيد عليها (انظر ، على سبيل المثال ، [26] لمزيد من التفاصيل).

يكونا مضاعفي لاغرانج. نستمد ما يسمى ب مزدوج مشكلة في استخدام ملف Lagrangian التالي

التابع البدائي المشكلة: & # 13

يحتاج Lagrangian إلى الحد الأدنى فيما يتعلق ، وتحت القيود ، و. وبالتالي ، يجب أن تختفي مشتقات فيما يتعلق بهذه المتغيرات: & # 13

باستبدال النتائج المذكورة أعلاه في نموذج لاغرانج ، نحصل على ما يلي: & # 13

وفقًا لنظرية لاجرانج ، من أجل الحصول على الأفضل ، يكفي تعظيمها فيما يتعلق بـ: & # 13

لأن هذا مزدوج المشكلة لها شكل تربيعي ، ويمكن إيجاد الحل تكراريًا عن طريق البرمجة التربيعية (QP) ، أو التحسين الأدنى المتسلسل (SMO) ، أو المربع الأقل (LS). هذا الحل له خاصية هي مزيج خطي من عدد قليل من أمثلة التدريب: & # 13 & # 13 الميزة الرئيسية لهذه المعادلة هي أنه لكل ما عدا تلك الموجودة داخل الهامش. تلك تسمى ناقلات الدعم. إنها الأقرب إلى حدود القرار وتحدد الهامش. لاحظ أنه إذا كان كل شيء نواقل غير الدعم ، سيتم العثور على نفس الحد الأقصى للهامش المفرط.

في الممارسة العملية ، يستخدم معظم المجربين بالرنين المغناطيسي الوظيفي SVMs الخطية لأنهم ينتجون حدودًا خطية في مساحة الميزة الأصلية ، مما يجعل تفسير نتائجهم واضحًا. في الواقع ، في هذه الحالة ، يسمح فحص خرائط الوزن مباشرة بتحديد السمات الأكثر تمييزًا [27].

2.1.2. غير الخطية SVM

غالبًا ما تستخدم SVMs غير الخطية لمشاكل التمييز عندما تكون البيانات قابلة للفصل بشكل غير خطي. يتم تعيين المتجهات إلى مساحة ميزة عالية الأبعاد باستخدام دالة

في SVMs غير الخطية ، ستعتمد وظيفة القرار على المستوى الفائق: & # 13

يمكن تطبيق أداة رياضية تُعرف باسم "خدعة النواة" على هذه المعادلة التي تعتمد فقط على حاصل الضرب النقطي بين متجهين. يسمح لكتابة عامل غير خطي كعامل خطي في مساحة ذات بعد أعلى. في الممارسة العملية ، يتم استبدال المنتج النقطي بـ "وظيفة kernel"

التي لا تحتاج إلى حساب صريح لتقليل مشكلة التحسين إلى الحالة الخطية: & # 13

يمكن استخدام عدة أنواع من النواة في نماذج SVM. النواة الأكثر شيوعًا هي النواة متعددة الحدود ووظائف الأساس الشعاعي (RBFs).

يتم تعريف النواة متعددة الحدود بواسطة & # 13

يتم تعيين المعلمات و المعلمات للتحكم في انحناء حدود القرار. يوضح الشكل 4 حدود القرار بقيمتين مختلفتين لـ و. نلاحظ أن الحالة مع نواة خطية.


(أ)
(ب)
(أ)
(ب)

يتم تعريف نواة دالة الأساس الشعاعي (RBF) بواسطة & # 13

& # 13 أين هو hyperparameter. تتوافق القيمة الكبيرة مع عرض النواة الكبير. تتحكم هذه المعلمة في مرونة المصنف الناتج (الشكل 5).


(أ)
(ب)
(أ)
(ب)

في مجال التصوير بالرنين المغناطيسي الوظيفي ، على الرغم من أن التحويلات غير الخطية توفر أحيانًا أداء تنبؤًا أعلى ، فإن استخدامها يحد من تفسير النتائج عندما يتم تحويل أوزان الميزة مرة أخرى إلى مساحة الإدخال [28].

2.2. مقارنة بين المصنفات واستراتيجيات ما قبل المعالجة

على الرغم من أن SVMs فعالة في التعامل مع مجموعات البيانات الكبيرة عالية الأبعاد ، إلا أنها ، مثل العديد من المصنفات الأخرى ، تتأثر بخطوات المعالجة المسبقة مثل التنعيم المكاني ، والانحراف الزمني ، وتصحيح الحركة. LaConte et al. [27] قارن SVMs مع تحليل التباين الكنسي (CVA) وفحص حساسيتهم النسبية فيما يتعلق بعشر مجموعات من خطوات ما قبل المعالجة. أظهرت الدراسة أنه بالنسبة لكل من SVM و CVA ، يمكن إجراء تصنيف لعينات الوقت الفردية لبيانات الدماغ بالكامل دون متوسط ​​عبر عمليات المسح. كو وآخرون. [29] قارنت أربع طرق للتعرف على الأنماط (SVM ، ومميز فيشر الخطي (FLD) ، وتحليل الارتباط (CA) ، و Gaussian naive bayes (GNB)) ووجدت أنه يمكن تحسين أداء المصنف من خلال الإزالة الخارجية. Misaki et al. [30] قارن ستة مصنفات تحاول فك رموز المحفزات من أنماط الاستجابة: ارتباط النمط ، أقرب جيران k (KNN) ، FLD ، GNB ، و SVM الخطي وغير الخطي. تشير النتائج إلى أن متوسط ​​التطبيع والانحراف المعياري لأنماط الاستجابة سواء عبر المنبهات أو عبر وحدات البكسل لم يكن لهما تأثير كبير.

من ناحية أخرى ، يمكن تحسين أداء المصنف عن طريق تقليل أبعاد البيانات أو عن طريق اختيار مجموعة من الميزات التمييزية. تم العثور على أداء فك التشفير يزداد عن طريق تطبيق تقليل الأبعاد باستخدام خوارزمية حذف الميزات العودية (RFE) [31] أو بعد اختيار وحدات فوكسل مستقلة ذات أعلى استجابة شاملة ، باستخدام معرفة مسبقة بمقاييس GLM [29]. ومع ذلك ، LaConte et al. [27] أظهر أن تصنيف بيانات الدماغ بالكامل يمكن إجراؤه بدون اختيار ميزة مسبقة ، بينما Mourão-Miranda et al. [32] وجد أن SVM كان أكثر دقة مقارنة بـ FLD عند تصنيف حالات الدماغ دون التحديد المسبق للسمات المكانية. شمه وآخرون. [33] مقارنة ، من حيث الأداء ، بمجموعة من طرق التصنيف (FLD التكيفي ، ومميز تربيعي التكيفي (QD) ، و GNB ، و SVM الخطي وغير الخطي ، والانحدار اللوجستي (LR) ، وآلات Boltzmann المقيدة (RBM) ، و KNN) المطبقة لأحجام الرنين المغناطيسي الوظيفي دون تقليل الأبعاد وأظهر أن الأداء النسبي يختلف اختلافًا كبيرًا عبر الموضوعات ومهام التصنيف.

حاولت دراسات أخرى مقارنة المصنفات من حيث أدائها أو وقت التنفيذ. درس كوكس وسافوي [14] التمايز الخطي (LD) و SVMs لتصنيف أنماط تنشيط الرنين المغناطيسي الوظيفي التي يثيرها العرض المرئي لفئات مختلفة من الكائنات. تم العثور على دقة المصنف لتكون مهمة لكل من SVMs الخطية ومتعددة الحدود مقارنة بمصنف LD. وجد Pereira و Botvinick [34] أن مصنف GNB هو خيار معقول لرسم الخرائط السريعة ، ومن المحتمل أن يكون LD هو الأفضل إذا تم منح المزيد من الوقت ، ويمكن أن يحقق SVM الخطي نفس مستوى الأداء إذا تم ضبط معلمات المصنف جيدًا باستخدام التحقق المتبادل (انظر القسم 4).

3. اختيار الميزة وتقليل الأبعاد

عند التعامل مع التحليل أحادي المتغير أحادي الموضوع ، يمكن إنشاء ميزات من الخرائط المقدرة باستخدام GLM. ستتكون السمة النموذجية من نمط القيم عبر وحدات البكسل. عادة ما يتم إجراء التحليل على بيانات مكانية غير متجانسة للحفاظ على المعلومات الدقيقة الخاصة بالموضوع [35]. في مثل هذه الحالة ، فإن الميزات هي ببساطة وحدات البكسل. يوصي مؤلفون آخرون بتطبيق التنعيم المكاني [36]. تمت مناقشة هذه الفكرة بشكل كبير في أدبيات الرنين المغناطيسي الوظيفي [30 ، 37] (انظر أيضًا القسم 2.2). في كلتا الحالتين ، لا يزال من الممكن اعتبار مساحة الميزة ذات أبعاد عالية عند استخدام جميع وحدات البكسل الدماغية (أو على الأقل مناطق الاهتمام الكبيرة جدًا). لذلك ، يجب تقليل أبعاد البيانات بشكل كبير ، ويجب اختيار الميزات الإعلامية (voxels) بحكمة من أجل جعل مهمة التصنيف ممكنة. عند استخدام مناطق صغيرة ذات أهمية ، لا توجد عادة حاجة لتقليل الأبعاد (انظر القسم التالي 3.1).

أظهرت العديد من الدراسات أهمية اختيار الميزة. بيرسون وكيندال

تم استخدام معامل ارتباط الرتبة لتقييم عناصر مصفوفة التوصيل الوظيفي بين كل زوج من مناطق الدماغ كميزات تصنيف [38] ، في حين تمت مقارنة موثوقية فوكسل ومقاييس المعلومات المتبادلة لتحديد مجموعات فرعية من وحدات البكسل في بيانات الرنين المغناطيسي الوظيفي التي تميز على النحو الأمثل هوية الكائن [39]. استكشف Åberg و Wessberg [40] فعالية الخوارزميات التطورية في تحديد عدد محدود من وحدات البكسل التي تميز بشكل مثالي بين الأحجام الفردية من الرنين المغناطيسي الوظيفي. تعتمد هذه الطريقة على مصنف بسيط متعدد الانحدار الخطي بالتزامن مع عدد قليل من وحدات فوكسل المحددة التي تتفوق على اختيار الميزة على أساس رسم الخرائط الإحصائية (SPM) [41].

في الآونة الأخيرة ، تم تطوير تقنيات جديدة للعثور على ميزات إعلامية مع تجاهل المصادر غير المفيدة للضوضاء ، مثل تحليل المكونات الرئيسية (PCA) وتحليل المكونات المستقلة (ICA) [42 ، 43]. تؤدي هذه الأساليب أداءً جيدًا عند التعامل مع التحليل أحادي الموضوع. في الآونة الأخيرة ، جرت محاولات لتوسيع هذه الأساليب لتشمل التحليل على مستوى المجموعة من خلال تطوير مناهج ICA للمجموعة لاستخراج المكونات المستقلة من تحليل بيانات مجموعة الموضوع [44 ​​، 45].

من الجدير بالذكر أنه يمكن تحسين اختيار الميزة باستخدام التحقق المتقاطع (انظر القسم 4). سيشمل المصنف الأفضل بشكل عام مجموعة فرعية فقط من الميزات التي تعتبر مفيدة حقًا. في الواقع ، يمكن أيضًا استخدام مصنفات SVM لإجراء اختيار الميزة. للقيام بذلك ، Martino et al. [31] طور خوارزمية حذف الميزة العودية (RFE) التي تزيل بشكل متكرر الميزات الأقل تمييزًا بناءً على المعلومات متعددة المتغيرات كما اكتشفها المصنف. لكل مستوى اختيار فوكسل ، يتكون RFE من خطوتين. أولاً ، يتم تدريب مصنف SVM على مجموعة فرعية من بيانات التدريب باستخدام المجموعة الحالية من وحدات البكسل. ثانيًا ، يتم التخلص من مجموعة من وحدات البكسل وفقًا لأوزانها التمييزية كما تم تقديرها أثناء التدريب. يتم تصنيف البيانات المستخدمة كاختبار ، ويتم تقييم أداء التعميم في كل تكرار. تم استخدام RFE مؤخرًا لتحليل بيانات الرنين المغناطيسي الوظيفي وثبت أنه يحسن أداء التعميم في تمييز المحفزات البصرية خلال مهمتين مختلفتين [31 ، 46].

3.1. مناطق الاهتمام (ROI): تحليل كشاف

تُستخدم طرق التصنيف متعددة المتغيرات لتحديد ما إذا كانت إشارات الرنين المغناطيسي الوظيفي من مجموعة معينة من وحدات البكسل تحتوي على نمط نشاط قابل للفصل وفقًا للمعالجة التجريبية. يتمثل أحد الخيارات في تحليل نمط النشاط عبر جميع وحدات البكسل الدماغية. في مثل هذه الحالة ، يتجاوز عدد وحدات البكسل عدد أنماط التدريب مما يجعل التصنيف مكلفًا حسابيًا.

تتمثل الطريقة النموذجية في وضع افتراضات حول المناطق التشريحية ذات الأهمية (ROI) المشتبه في ارتباطها بالمهمة [14 ، 47 ، 48]. في مثل هذه الحالات ، سيمثل العائد على الاستثمار مجموعات متجاورة مكانيًا من وحدات البكسل ، ولكن ليس بالضرورة متجاورة.

البديل هو اختيار عدد أقل من وحدات البكسل (على سبيل المثال ، تلك الموجودة داخل كرة تتمحور حول فوكسل) وتكرار التحليل في جميع وحدات البكسل في الدماغ. تم تقديم هذه الطريقة بواسطة Kriegeskorte et al. [49] ، وقد أطلق عليها اسم "كشاف". ينتج خريطة معلومات متعددة المتغيرات حيث يتم تعيين أداء المصنف لكل فوكسل. بعبارات أخرى ، تقوم طريقة الكشاف بتسجيل نقاط فوكسل من خلال مدى دقة المصنف في التنبؤ بحالة كل مثال في مجموعة التدريب ، بناءً على البيانات من فوكسل وجيرانه المجاورين مباشرة. يوضح الشكل 6 توضيحًا ثنائي الأبعاد لطريقة الكشاف المطبقة على 120 خريطة محاكاة بحجم 10 × 10 بكسل. وحدات البكسل للشروط عبارة عن أرقام عشوائية ، ويتم إنشاء وحدات البكسل للشرط من تلك الخاصة باستثناء بعض الأنماط حيث تتم إضافة قيمة 1. استخدمنا أربعة أشواط حيث يحتوي كل تشغيل على 30 مثالًا (15 للشرط و 15 للشرط).


بكسل. لكل بكسل في خريطة النشاط ، يتم استخراج 5 جيران (كشاف) لتشكيل متجه معالم. الكشافات المستخرجة من خرائط النشاط لكل حالة (

) شكل ثم أمثلة الإدخال. يتم تدريب المصنف باستخدام أمثلة التدريب (المقابلة لأول 3 أشواط) واختبارها باستخدام أمثلة الجولة الرابعة. يتم بعد ذلك تكرار الإجراء على طول خرائط النشاط لكل بكسل لإنتاج أخيرًا خريطة أداء توضح مدى جودة الإشارة في الأحياء المحلية التي تميز الظروف التجريبية

في الآونة الأخيرة ، Björnsdotter et al. [50] اقترح تقريب مونت كارلو من الكشاف المصمم لرسم خرائط سريعة للدماغ بالكامل. يتكون تكرار واحد للخوارزمية من تقسيم حجم الدماغ بشكل عشوائي إلى عدد من المجموعات (مجالات البحث) بحيث يتم تضمين كل فوكسل في مجموعة واحدة (واحدة فقط) ، ويتم حساب أداء المصنف لها. وبالتالي ، يتم تعيين أداء متوسط ​​عبر جميع الأبراج التي شارك فيها فوكسل إلى ذلك voxel (على عكس الكشاف حيث يتم تعيين القيمة الوحيدة المحسوبة لكل فوكسل عندما تمحور الكرة عليها) (الشكل 7).


رسم توضيحي لطريقة رسم خرائط الدماغ بالرنين المغناطيسي الوظيفي بطريقة مونت كارلو في فوكسل واحد (باللون الأسود). بدلاً من توسيط حجم البحث (دائرة الخط المتقطع) في فوكسل كما في طريقة الكشاف وحساب أداء واحد لها ، هنا يتم تضمين فوكسل في خمسة أبراج مختلفة مع فوكسل أخرى مجاورة (رمادي غامق). في كل كوكبة ، يتم حساب أداء التصنيف لها. في النهاية ، يتم تعيين متوسط ​​الأداء عبر جميع الأبراج إلى فوكسل الظلام.

4. تقدير الأداء والتحقق من الصحة

لضمان إجراء اختبار غير متحيز ، يجب تقسيم البيانات إلى مجموعتين: مجموعة تدريب واختبار.بالإضافة إلى ذلك: يوصى عمومًا باختيار مجموعة تدريب أكبر من أجل تعزيز تقارب المصنف. في الواقع ، يعتمد أداء المصنف الذي تم تعلمه على كيفية تقسيم البيانات الأصلية إلى مجموعة تدريب واختبار ، والأهم من ذلك ، على حجمها. بعبارة أخرى ، كلما زاد عدد الحالات التي نتركها للاختبار ، قل عدد العينات المتبقية للتدريب ، وبالتالي يصبح المصنف أقل دقة. من ناحية أخرى ، فإن المصنف الذي يشرح مجموعة واحدة من البيانات جيدًا لا يعمم بالضرورة على مجموعات أخرى من البيانات حتى لو كانت البيانات مأخوذة من نفس التوزيع. في الواقع ، يميل المصنف المفرط التعقيد إلى الإفراط (أي أنه سيفشل في التعميم على الأمثلة غير المرئية). قد يحدث هذا ، على سبيل المثال ، عندما يكون عدد الميزات كبيرًا جدًا بالنسبة إلى عدد الأمثلة (على سبيل المثال ،

). تُعرف هذه المشكلة باسم "لعنة الأبعاد" [51]. تتمثل إحدى طرق التغلب على هذه المشكلة في استخدام "التحقق المتبادل". يسمح هذا الإجراء بالتقييم الفعال لأداء المصنف [52-54]. الهدف هو تحديد أفضل المعلمات للمصنف (على سبيل المثال ، المعلمات ، و) التي يمكنها التنبؤ بدقة بالبيانات غير المعروفة (الشكل 8). من خلال التحقق المتقاطع ، يمكن استخدام نفس مجموعة البيانات لكل من تدريب واختبار المصنف ، وبالتالي زيادة عدد الأمثلة مع نفس العدد من الميزات.


(أ)
(ب)
(أ)
(ب) يعني الدقة بعد التحقق من صحة 4 أضعاف لتصنيف البيانات الموضحة في الشكل 3. المعلمات التي تظهر أفضل دقة هي

للنواة متعددة الحدود و

4.1 N- أضعاف عبر التحقق من الصحة

في التحقق المتبادل من الصحة ، يتم تقسيم البيانات الأصلية بشكل عشوائي إلى عينات فرعية. من بين العينات الفرعية ، يتم الاحتفاظ بعينة فرعية واحدة للتحقق من صحة النموذج ، ويتم استخدام العينات الفرعية المتبقية كبيانات تدريب. يتم بعد ذلك تكرار إجراء التحقق المتقاطع مرات ، حيث يتم استخدام كل عينة فرعية للاختبار. يمكن حساب متوسط ​​النتائج (أو جمعها بطريقة أخرى) لإنتاج تقدير أداء فردي. يتم استخدام مخططين للتحقق المتقاطع لـ MVPA لموضوع واحد (الشكل 9). الأول هو التحقق المتبادل لمرة واحدة (LORO-CV). في هذا الإجراء ، توفر بيانات تشغيل واحد عينات الاختبار ، وتوفر عمليات التشغيل المتبقية عينات التدريب. والثاني هو التحقق من صحة ترك عينة واحدة خارج (LOSO-CV) حيث يتم أخذ عينة واحدة من كل فصل كعينة اختبار ، ويتم استخدام جميع العينات المتبقية لتدريب المصنف. يتم اختيار العينات عشوائيًا بحيث تظهر كل عينة في مجموعة الاختبار مرة واحدة على الأقل. ينتج LOSO-CV أداءً أعلى من LORO-CV ولكنه أكثر تكلفة من الناحية الحسابية بسبب عدد أكبر من عمليات التدريب [30].


(LORO-CV) وترك عينة واحدة من التحقق المتبادل (LOSO-CV). يتم تدريب المصنف باستخدام مجموعة التدريب (باللون الأزرق) ثم يتم اختباره باستخدام مجموعة الاختبار (باللون الأحمر) للحصول على الأداء. يتم تكرار هذا الإجراء لكل تشغيل في LORO-CV ولكل عينة في LOSO-CV للحصول في النهاية على أداء متوسط.
4.2 أداء المصنف

تأتي خوارزميات التعلم الآلي مع العديد من المعلمات التي يمكنها تعديل سلوكها وأدائها. يتم إجراء تقييم النموذج الذي تم تعلمه بشكل تقليدي عن طريق تعظيم مقياس الدقة. النظر في مشكلة تصنيف أساسية من فئتين ، دعونا

كن تسميات الفصل الإيجابية والسلبية الحقيقية ، وليكن تسميات الفصل الإيجابية والسلبية المتوقعة. بعد ذلك ، يمكن صياغة تمثيل لأداء التصنيف بواسطة أ الالتباس مصفوفة (جدول الطوارئ) ، كما هو موضح في الشكل 10. بإعطاء المصنف ومثال ، هناك أربع نتائج محتملة. إذا كان المثال موجبًا وتم تصنيفه على أنه إيجابي ، فيُحسب على أنه إيجابي حقيقي (TP) إذا تم تصنيفه على أنه سلبي ، فيُحسب على أنه سلبي خاطئ (FN). إذا كان المثال سالبًا وتم تصنيفه على أنه سلبي ، فيُحسب على أنه سلبي حقيقي (TN) إذا تم تصنيفه على أنه إيجابي ، فيُحسب على أنه إيجابي كاذب (FP). باتباع هذا الاصطلاح ، يتم تعريف مقياس الدقة على أنه & # 13

& # 13 أين وعدد الأمثلة الإيجابية والسلبية ، على التوالي (

). ومع ذلك ، يمكن أن تكون الدقة خادعة في مواقف معينة وهي شديدة الحساسية للتغيرات في البيانات. بعبارة أخرى ، بحضور غير متوازن مجموعات البيانات (أي ، أين) ، يصبح من الصعب إجراء تحليل نسبي عندما يكون مقياس التقييم حساسًا لتوزيعات البيانات. في مهام الرنين المغناطيسي الوظيفي ، غالبًا ما تكون التصاميم التجريبية متوازن (نفس جزء الشروط لكل نوع في كل تشغيل) ، ولكن هناك حالات حيث تكون غير متوازن. علاوة على ذلك ، فإن أي استخدام لإجراء التحقق العشوائي المتقاطع لتقييم المصنف قد يؤدي إلى مجموعات البيانات عدم اتزان.


4.2.1. منحنى خاصية تشغيل جهاز الاستقبال (ROC)

يمكن أن تكون المقاييس المستخرجة من منحنى خاصية تشغيل المستقبل (ROC) بديلاً جيدًا لتقييم النموذج ، لأنها تسمح بفصل الأخطاء في الأمثلة الإيجابية أو السلبية. يتكون منحنى ROC من خلال رسم معدل إيجابي حقيقي (TPR) على معدل إيجابي كاذب (FPR) محدد من كلاهما الالتباس مصفوفة بواسطة & # 13

في مساحة ROC يتوافق مع أداء مصنف واحد على توزيع معين. تعد مساحة ROC مفيدة لأنها توفر تمثيلًا مرئيًا للمفاضلات النسبية بين الفوائد (التي تعكسها) والتكاليف (التي تعكسها) التصنيف فيما يتعلق بتوزيعات البيانات.

بشكل عام ، ناتج المصنف هو قيمة رقمية مستمرة. يتم تنفيذ قاعدة القرار عن طريق اختيار عتبة القرار التي تفصل بين الفئات الإيجابية والسلبية. في معظم الأحيان ، يتم تعيين هذه العتبة بغض النظر عن توزيع فئة البيانات. ومع ذلك ، نظرًا لأن العتبة المثلى لتوزيع الفئة قد تختلف عبر نطاق كبير من القيم ، يتم الحصول على زوج (FPR TPR) عند كل قيمة حدية. ومن ثم ، من خلال تغيير هذه القيمة الحدية ، يتم إنتاج منحنى ROC.

يوضح الشكل 11 مخطط ROC نموذجي مع النقاط A و B و C التي تمثل نقاط ROC ومنحنيات وتمثل منحنيات ROC. وفقًا لهيكل الرسم البياني ROC ، تمثل النقطة A (0،1) تصنيفًا مثاليًا. بشكل عام ، يكون أحد المصنفات أفضل من الآخر إذا كانت النقطة المقابلة له في مساحة ROC أقرب إلى الزاوية اليسرى العليا. أي مصنف توجد نقطة ROC المقابلة له على القطر ، مثل النقطة B ، يمثل المصنف الذي سيوفر تخمينًا عشوائيًا لتسميات الفئات (أي مصنف عشوائي). لذلك ، فإن أي مصنف يظهر في المثلث الأيمن السفلي لمساحة ROC يؤدي أداءً أسوأ من التخمين العشوائي ، مثل المصنف المرتبط بالنقطة C في المنطقة المظللة.


من أجل تقييم أداء المصنفات المختلفة ، يستخدم المرء عمومًا المنطقة الواقعة تحت منحنى ROC (AUC) كمعيار تقييم [55]. على سبيل المثال ، في الشكل 11 ، يوفر المنحنى مقياس AUC أكبر مقارنةً بذلك ، المصنف المقابل المرتبط بأداء أفضل مقارنة بالمصنف المرتبط بـ. تمتلك الجامعة الأمريكية بالقاهرة خاصية إحصائية مهمة: فهي تعادل احتمالية قيام المصنف بتقييم مثال إيجابي تم اختياره عشوائيًا أعلى من مثال سلبي تم اختياره عشوائيًا. أظهر Smith and Nichols [56] أن AUC هو مقياس أفضل لأداء المصنف من مقياس الدقة.

ستحتاج معالجة AUC إلى حساب تكامل في الحالة المستمرة ، ومع ذلك ، في الحالة المنفصلة ، يتم إعطاء المنطقة بواسطة [57] & # 13

& # 13 حيث هي وظيفة القرار للمصنف المنفصل ، وعلى التوالي ، تشير إلى الأمثلة الإيجابية والسلبية ، و

يتم تعريفه ليكون 1 إذا كان المسند معلقًا و 0 بخلاف ذلك. تنص هذه المعادلة على أنه إذا كان المصنف هكذا ، فإن AUC لهذا المصنف هو الحد الأقصى. أي مثال سلبي يحدث في مرتبة أعلى من الأمثلة الإيجابية يجعل AUC تنخفض.

4.2.2. مثال على منحنى ROC المطبق على مصنف SVM

يمكن استخدام SVMs كمصنفات تنتج قيمة رقمية مستمرة لرسم منحنى ROC. في الواقع ، في تطبيقات SVM القياسية ، يتم تغذية الإخراج المستمر لمثال اختبار (أي) بشكل عام في دالة تسجيل: إذا

، يعتبر المثال موجبًا وعكسًا إذا ، يعتبر سالبًا (كما لو تم تجميد عتبة عند وتكون موجبة إذا ، وسالبة إذا

). في هذه الحالة ، يتم الحصول على زوج واحد من FPR TPR. وبالتالي ، إذا كان بإمكان المرء تغيير العتبة في نطاق بين الحد الأقصى والأدنى لجميع مخرجات مجموعة الاختبار (min () max ()) ، فيمكن الحصول على منحنى ROC. وبالتالي ستتبع الخوارزمية الخطوات التالية. (أنا)

. احسب متجه الإخراج لجميع الأمثلة في مجموعة الاختبار. (2). لكل قيمة حد بين الحد الأدنى والحد الأقصى ، (أ) الخطوة 2.1. حساب وتخصيص أمثلة للفئات المقابلة (ب) الخطوة 2.2. ارسم النقطة المقابلة (FPR TPR).

قمنا بتنفيذ هذا الإجراء على البيانات المحاكاة المستخدمة لتحليل الكشاف. ومع ذلك ، كانت البيانات غير متوازنة لإظهار تأثير العتبة (استخدمنا أربعة أشواط تحتوي كل منها على 30 اختبارًا ، و 10 للحالة و 20 للحالة). يوضح الشكل 12 منحنيات ROC المقابلة لمختلف وحدات البكسل. يتم حساب المنطقة الواقعة أسفل منحنى ROC لجميع وحدات البكسل التي تؤدي إلى خريطة AUC في الشكل 12.


(أ)
(ب)
(أ)
(ب) تحليل ROC لـ غير متوازن بيانات محاكاة. كانت البيانات في الشكل 6 غير متوازن لإظهار تأثير العتبة. (أ) منحنيات ROC المقابلة لبعض الإحداثيات (وحدات البكسل) الموضحة في الدوائر الملونة في خريطة AUC في (ب).

النقطة الأخيرة الجديرة بالذكر هي أن أداء المصنف يقيس قدرته على التعميم على البيانات غير المرئية على افتراض أن أمثلة التدريب والاختبار مستمدة من نفس التوزيع. ومع ذلك ، يمكن انتهاك هذا الافتراض عند استخدام التحقق المتبادل [34]. يمكن أن يكون البديل هو استخدام استراتيجيات بايز لاختيار النموذج بالنظر إلى كفاءتها من حيث التعقيد الحسابي ومن حيث درجات الحرية المتاحة [58].

4.2.3. تحليل اختبار التقليب اللامعلمي

تم تقديم تحليل اختبار التقليب اللامعلمي في دراسات التصوير العصبي الوظيفي لتوفير منهجية مرنة وبديهية للتحقق من صحة نتائج التصنيف [59 ، 60]. يمكن تقييم أهمية الإحصاء الذي يعبر عن التأثير التجريبي من خلال المقارنة مع توزيع القيم التي تم الحصول عليها عندما يتم تبديل الملصقات [61].

بشكل ملموس ، للتحقق من الفرضية التي بموجبها لا يوجد فرق بين الشروط وعندما يتم تبديل تسميات الفصل بشكل عشوائي ، يمكن للمرء اتباع الخطوات التالية: تبديل التسميات الموجودة في العينة ، احسب الحد الأقصى ر-تكرار الإحصاء عبر العديد من التباديل للحصول على توزيع قيم لـ ر-إحصائية تجد العتبة المقابلة لقيمة معينة تحدد درجة رفض الفرضية [62 ، 63].

في ظروف تجريبية خاصة عندما تظهر بيانات الرنين المغناطيسي الوظيفي ارتباطًا ذاتيًا زمنيًا [64] ، لا يمكن الدفاع عن افتراض "قابلية التبادل" لعمليات المسح (أي إعادة ترتيب التسميات في عمليات المسح دون التأثير على التوزيع الأساسي للنتائج المحتملة) داخل الموضوعات. في هذه الحالة ، لتحليل مجموعة من الموضوعات للاستدلال السكاني ، يفترض المرء حصريًا إمكانية تبادل الموضوعات. قدم نيكولز وهولمز [60] أمثلة عملية من التصوير العصبي الوظيفي في كل من التجارب الفردية والموضوعية المتعددة ، وجولاند وفيشل. [62] توصيات عملية مقترحة بشأن إجراء اختبارات التقليب للتصنيف.

5. الخلاصة

في هذه الورقة ، راجعنا كيف يمكن تطبيق تحليل مصنف التعلم الآلي على تحليل بيانات التصوير العصبي الوظيفي. لقد أبلغنا عن قيود التحليل القائم على النموذج أحادي المتغير وقدمنا ​​التحليل الخالي من النماذج متعدد المتغيرات كحل. من خلال مراجعة الأدبيات التي قارنت بين المصنفات المختلفة ، ركزنا على آلة متجه الدعم (SVM) كمصنف خاضع للإشراف يمكن اعتباره أداة فعالة لإجراء تحليل الأنماط متعدد المتغيرات (MVPA). لقد أبلغنا عن أهمية اختيار الميزة وتقليل الأبعاد لنجاح المصنف المختار من حيث الأداء ، وأهمية مخطط التحقق المتبادل في اختيار أفضل المعلمات للمصنف وحساب الأداء. يبدو أن استخدام منحنيات ROC أكثر دقة لتقييم أداء المصنف ، بينما توفر اختبارات التقليب اللامعلمية منهجية مرنة وبديهية للتحقق من صحة نتائج التصنيف.

شكر وتقدير

تم دعم هذا العمل من قبل مشروع Neuromed ، ومشروع GDRI ، ومشروع PEPS "GoHaL" الممول من CNRS ، فرنسا.

مراجع

  1. S. Ogawa ، T. M. Lee ، A. R. Kay ، and D.W Tank ، "تصوير الرنين المغناطيسي للدماغ مع التباين الذي يعتمد على أكسجة الدم ،" وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية، المجلد. 87 ، لا. 24 ، ص 9868-9872 ، 1990. عرض على: موقع الناشر | منحة جوجل
  2. K.Kwong ، J.W. Belliveau ، D. A. Chesler et al. ، "التصوير بالرنين المغناطيسي الديناميكي لنشاط الدماغ البشري أثناء التحفيز الحسي الأولي ،" وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية، المجلد. 89 ، لا. 12 ، ص 5675-5679 ، 1992. عرض على: موقع الناشر | منحة جوجل
  3. لوغوثيتيس ، جيه بولس ، إم أوجاث ، تي تريناث ، إيه. أويلترمان ، "التحقيق الفيزيولوجي العصبي لأساس إشارة الرنين المغناطيسي الوظيفي ،" طبيعة سجية، المجلد. 412 ، لا. 6843، pp.150–157، 2001. عرض على: موقع الناشر | منحة جوجل
  4. جيزارد ، إم بي ماثيوز ، إم إس سميث ، "التصوير بالرنين المغناطيسي الوظيفي: مقدمة للطرق ،" مجلة التصوير بالرنين المغناطيسي، المجلد. 17 ، لا. 3 ، ص 383-383 ، 2003. عرض على: الباحث العلمي من Google
  5. K. J. Friston و C.D Frith و P.F Liddle و R. S. J. Frackowiak ، "مقارنة الصور الوظيفية (PET): تقييم التغيير الكبير ،" مجلة تدفق الدم الدماغي والتمثيل الغذائي، المجلد. 11 ، لا. 4، pp.690–699، 1991. View at: Google Scholar
  6. A.R McIntosh ، و C.L Grady ، و J.V Haxby ، و J.M Maisog ، و B. Horwitz ، و C.M Clark ، "التحولات داخل الموضوع لبيانات تدفق الدم الدماغي الإقليمي PET: ANCOVA ، والنسبة ، وتعديلات z-Score على البيانات التجريبية ،" رسم خرائط الدماغ البشري، المجلد. 4 ، لا. 2، pp. 93-102، 1996. View at: Google Scholar
  7. K. J. Friston و A.P. Holmes و C.J. Price و C. B & # xfcchel و K. J. Worsley ، "دراسات الرنين المغناطيسي الوظيفي المتعددة وتحليل الاقتران" NeuroImage، المجلد. 10 ، لا. 4، pp.385–396، 1999. عرض على: موقع الناشر | منحة جوجل
  8. M. J. McKeown، S. Makeig، G.G Brown et al. ، "تحليل بيانات الرنين المغناطيسي الوظيفي عن طريق الفصل الأعمى إلى مكونات مكانية مستقلة ،" رسم خرائط الدماغ البشري، المجلد. 6 ، لا. 3، pp.160–188، 1998. View at: Google Scholar
  9. U. Kjems ، L.K Hansen ، J. Anderson et al. ، "التقييم الكمي لتجارب التصوير العصبي الوظيفية: منحنيات تعلم المعلومات المتبادلة ،" NeuroImage، المجلد. 15 ، لا. 4، pp.772–786، 2002. عرض على: موقع الناشر | منحة جوجل
  10. R. S. J. Frackowiak ، K. J. Friston ، C. Frith et al. ، وظيفة الدماغ البشري، المطبعة الأكاديمية ، الطبعة الثانية ، 2003.
  11. بريت ، دبليو بيني ، وس. كيبل ، مقدمة في نظرية المجال العشوائي، مطبعة إلسفير ، 2004.
  12. دي آر كوكس و إتش دي ميللر ، نظرية العمليات العشوائية، تشابمان وهال ، 1965.
  13. ك.أ. نورمان ، إس إم بولين ، ج.ج.ديتر ، وجي في.هاكسبي ، "ما وراء قراءة الأفكار: تحليل نمط متعدد فوكسل لبيانات الرنين المغناطيسي الوظيفي ،" الاتجاهات في العلوم المعرفية، المجلد. 10 ، لا. 9 ، ص 424-430 ، 2006. عرض على: موقع الناشر | منحة جوجل
  14. D.Cox and R. L. Savoy ، "التصوير بالرنين المغناطيسي الوظيفي (fMRI) وقراءة الدماغ # x201c & # x201d: اكتشاف وتصنيف الأنماط الموزعة لنشاط الرنين المغناطيسي الوظيفي في القشرة البصرية للإنسان ،" NeuroImage، المجلد. 19 ، لا. 2، pp.261–270، 2003. عرض على: موقع الناشر | منحة جوجل
  15. J.V Haxby، M.I Gobbini، M. L. Furey، A. Ishai، J.L Schouten، and P. Pietrini ، "التمثيلات الموزعة والمتداخلة للوجوه والأشياء في القشرة الصدغية البطنية ،" علم، المجلد. 293 ، لا. 5539 ، ص 2425-2430 ، 2001. عرض على: موقع الناشر | منحة جوجل
  16. بي إي داونينج ، إيه جي ويغيت ، وإم في بيلين ، "تحقيق التصوير بالرنين المغناطيسي الوظيفي لعمليات التنشيط القذالية الصدغية الجانبية المتداخلة باستخدام تحليل نمط متعدد الفوكسل ،" مجلة علم الأعصاب، المجلد. 27 ، لا. 1، pp.226–233، 2007. عرض على: موقع الناشر | منحة جوجل
  17. C. Davatzikos ، K. Ruparel ، Y. Fan et al. ، "تصنيف الأنماط المكانية لنشاط الدماغ باستخدام طرق التعلم الآلي: التطبيق لاكتشاف الكذب ،" NeuroImage، المجلد. 28 ، لا. 3 ، ص 663-668 ، 2005. عرض على: موقع الناشر | منحة جوجل
  18. C. Cortes و V. Vapnik ، "Support-vector networks" التعلم الالي، المجلد. 20 ، لا. 3، pp.273–297، 1995. عرض على: موقع الناشر | منحة جوجل
  19. في. ن. فابنيك ، طبيعة نظرية التعليم الإحصائى، المجلد. 8 ، سبرينغر ، 1995.
  20. تيموثي ، دي ألوك ، في.سفياتوسلاف وآخرون ، "دعم تصنيف آلة المتجهات وتوصيف إعادة التنظيم المرتبطة بالعمر لشبكات الدماغ الوظيفية ،" NeuroImage، المجلد. 60 ، لا. 1، pp 601–613، 2012. View at: Google Scholar
  21. E. Formisano ، و F. De Martino ، و G. Valente ، "التحليل متعدد المتغيرات للسلاسل الزمنية للرنين المغناطيسي الوظيفي: تصنيف وانحدار استجابات الدماغ باستخدام التعلم الآلي ،" التصوير بالرنين المغناطيسي، المجلد. 26 ، لا. 7، pp.921–934، 2008. عرض على: موقع الناشر | منحة جوجل
  22. S.J.Hanson and Y.O. Halchenko ، "قراءة الدماغ باستخدام آلات متجه دعم الدماغ الكامل للتعرف على الأشياء: لا توجد منطقة تعريف & # x201cface & # x201d ،" الحساب العصبي، المجلد. 20 ، لا. 2 ، ص 486-503 ، 2008. عرض على: موقع الناشر | منحة جوجل
  23. ت. يواكيمس ، تعلم تصنيف النص باستخدام آلات المتجهات الداعمة، كلوير ، 2002.
  24. C.C. Chang و C.J.Lin ، "LIBSVM: a library for Support Vector Machines ،" معاملات ACM على الأنظمة الذكية والتكنولوجيا، المجلد. 2 ، لا. 3 ، المقالة 27 ، 2011. عرض على: موقع الناشر | منحة جوجل
  25. M. Hanke ، و Y. O. Halchenko ، و P. B. Sederberg ، و S.J. المعلوماتية العصبية، المجلد. 7 ، لا. 1، pp.37–53، 2009. عرض على: موقع الناشر | منحة جوجل
  26. S. Boyd and L. Vandenberghe ، تحسين محدب، مطبعة جامعة كامبريدج ، نيويورك ، نيويورك ، الولايات المتحدة الأمريكية ، 2004.
  27. S. LaConte و S. Strother و V. Cherkassky و J. Anderson و X. Hu ، "Support Vector Machines للتصنيف الزمني لبيانات التصوير بالرنين المغناطيسي الوظيفي لتصميم الكتلة ،" NeuroImage، المجلد. 26 ، لا. 2 ، ص 317-329 ، 2005. عرض على: موقع الناشر | منحة جوجل
  28. K. H. Brodersen ، T. M. Schofield ، A. P. Leff et al. ، "التضمين التوليدي للتصنيف المستند إلى النموذج لبيانات FMRI" ، PLoS علم الأحياء الحسابي، المجلد. 7 ، لا. 6 ، معرف المقالة e1002079 ، 2011. عرض على: موقع الناشر | منحة جوجل
  29. S. P. Ku و A. Gretton و J. Macke و N.K Logothetis ، "مقارنة بين طرق التعرف على الأنماط في تصنيف إشارات BOLD عالية الدقة التي تم الحصول عليها في المجال المغناطيسي العالي في القرود ،" التصوير بالرنين المغناطيسي، المجلد. 26 ، لا. 7، pp. 1007–1014، 2008. عرض على: موقع الناشر | منحة جوجل
  30. ميساكي ، واي.كيم ، بي إيه بانديتيني ، إن كريجيسكورتي ، "مقارنة بين المصنفات متعددة المتغيرات وتطبيع الاستجابة لمعلومات الأنماط بالرنين المغناطيسي الوظيفي ،" NeuroImage، المجلد. 53 ، لا. 1، pp.103–118، 2010. عرض على: موقع الناشر | منحة جوجل
  31. F. De Martino ، G. Valente ، N. Staeren ، J. Ashburner ، R. Goebel ، and E. Formisano ، "الجمع بين اختيار فوكسل متعدد المتغيرات وآلات المتجهات الداعمة لرسم خرائط وتصنيف الأنماط المكانية للرنين المغناطيسي الوظيفي ،" NeuroImage، المجلد. 43 ، لا. 1 ، ص 44-58 ، 2008. عرض على: موقع الناشر | منحة جوجل
  32. J. Mour & # xe3o-Miranda، A.LW Bokde، C. Born، H. Hampel، and M. Stetter ، "تصنيف حالات الدماغ وتحديد أنماط التنشيط التمييزية: دعم آلة المتجه على بيانات التصوير بالرنين المغناطيسي الوظيفية ،" NeuroImage، المجلد. 28 ، لا. 4، pp.980–995، 2005. عرض على: موقع الناشر | منحة جوجل
  33. T. Schmah ، و G. Yourganov ، و R. S. Zemel ، و G.E Hinton ، و S.L Small ، و S.C Strother ، "مقارنة طرق التصنيف لدراسات الرنين المغناطيسي الوظيفي الطولية ،" الحساب العصبي، المجلد. 22 ، لا. 11 ، ص 2729-2762 ، 2010. عرض على: موقع الناشر | منحة جوجل
  34. بيريرا وإم بوتفينيك ، "رسم خرائط المعلومات باستخدام مصنّفات الأنماط: دراسة مقارنة ،" NeuroImage، المجلد. 56 ، لا. 2، pp.476–496، 2011. عرض على: موقع الناشر | منحة جوجل
  35. Y. Kamitani و Y. Sawahata ، "التنعيم المكاني يضر بالتوطين ولكن ليس المعلومات: عوائق لمصممي خرائط الدماغ ،" NeuroImage، المجلد. 49 ، لا. 3، pp. 1949–1952، 2010. عرض على: موقع الناشر | منحة جوجل
  36. H. P. Op de Beeck ، "ضد فرط الحدة في قراءة الدماغ: التنعيم المكاني لا يضر بتحليلات الرنين المغناطيسي الوظيفي متعددة المتغيرات؟" NeuroImage، المجلد. 49 ، لا. 3، pp. 1943–1948، 2010. عرض على: موقع الناشر | منحة جوجل
  37. جيه دي سويشر ، جيه سي جاتنبي ، جيه سي جور وآخرون ، "تحليل نمط متعدد النطاقات للنشاط الانتقائي للتوجيه في القشرة البصرية الأولية ،" مجلة علم الأعصاب، المجلد. 30 ، لا. 1، pp.325–330، 2010. عرض على: موقع الناشر | منحة جوجل
  38. H. Shen و L. Wang و Y. Liu و D. Hu ، "التحليل التمييزي لأنماط الاتصال الوظيفي في حالة الراحة لمرض انفصام الشخصية باستخدام التضمين المنخفض الأبعاد للرنين المغناطيسي الوظيفي ،" NeuroImage، المجلد. 49 ، لا. 4، pp. 3110–3121، 2010. عرض على: موقع الناشر | منحة جوجل
  39. R. Sayres ، و D. Ress ، و K.G Spector ، "تحديد تمثيلات الكائنات الموزعة في القشرة البصرية البشرية خارج النطاق ،" في إجراءات أنظمة معالجة المعلومات العصبية (NIPS '05)، 2005. عرض على: الباحث العلمي من Google
  40. M.B & # xc5berg and J. Wessberg ، "نهج تطوري لتحديد مجموعات فوكسل بالمعلومات لتمييز حالة الدماغ ،" مجلة IEEE على موضوعات مختارة في معالجة الإشارات، المجلد. 2 ، لا. 6 ، ص 919-928 ، 2008. عرض على: موقع الناشر | منحة جوجل
  41. S. J. Kiebel and K. J. Friston ، "رسم الخرائط الإحصائي البارامتري للإمكانيات المرتبطة بالحدث: 1. الاعتبارات العامة ،" NeuroImage، المجلد. 22 ، لا. 2 ، ص 492-502 ، 2004. عرض على: موقع الناشر | منحة جوجل
  42. A. Hyv & # xe4rinen و E. Oja ، "تحليل المكونات المستقلة: الخوارزميات والتطبيقات ،" الشبكات العصبية، المجلد. 13 ، لا. 4-5 ، ص 411-430 ، 2000. عرض على: موقع الناشر | منحة جوجل
  43. D. B. Rowe و R.G Hoffmann ، "التحليل الإحصائي متعدد المتغيرات في الرنين المغناطيسي الوظيفي ،" مجلة IEEE Engineering in Medicine and Biology، المجلد. 25 ، لا. 2 ، ص 60-64 ، 2006. عرض على: موقع الناشر | منحة جوجل
  44. V. Sch & # xf6pf ، C. Windischberger ، S. Robinson et al. ، "تحليل مجموعة الرنين المغناطيسي الوظيفي الخالي من النماذج باستخدام FENICA ،" NeuroImage، المجلد. 55 ، لا. 1، pp. 185–193، 2011. عرض على: موقع الناشر | منحة جوجل
  45. S. A. R. B. Rombouts ، J. S. Damoiseaux ، R. Goekoop et al. ، "يُظهر تحليل المجموعة الخالية من النماذج شبكات BOLD FMRI المتغيرة في الخرف ،" رسم خرائط الدماغ البشري، المجلد. 30 ، لا. 1 ، ص 256-266 ، 2009. عرض على: موقع الناشر | منحة جوجل
  46. سي تشو ، أ. هسو ، ك. Chou و P. Bandettini و C. Lin ، "هل يؤدي اختيار الميزة إلى تحسين دقة التصنيف؟ تأثير حجم العينة واختيار الميزة على التصنيف باستخدام صور الرنين المغناطيسي التشريحية " NeuroImage، المجلد. 60 ، لا. 1، pp.59–70، 2011. View at: Google Scholar
  47. جيه دي هاينز وجي ريس ، "توقع اتجاه المنبهات غير المرئية من النشاط في القشرة البصرية الأولية للإنسان ،" علم الأعصاب الطبيعي، المجلد. 8 ، لا. 5، pp.686–691، 2005. عرض على: موقع الناشر | منحة جوجل
  48. Y. Kamitani و F. Tong ، "فك تشفير المحتويات المرئية والذاتية للدماغ البشري ،" علم الأعصاب الطبيعي، المجلد. 8 ، لا. 5، pp.679–685، 2005. عرض على: موقع الناشر | منحة جوجل
  49. ن. كريجيسكورتي ، ر. جوبل ، وبي. بانديتيني ، "رسم خرائط وظيفي للدماغ قائم على المعلومات" وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية، المجلد. 103 ، لا. 10، pp. 3863–3868، 2006. عرض على: موقع الناشر | منحة جوجل
  50. M. Bj & # xf6rnsdotter و K. Rylander و J. Wessberg ، "طريقة مونت كارلو لرسم خرائط الدماغ متعدد المتغيرات محليًا" NeuroImage، المجلد. 56 ، لا. 2 ، ص 508-516 ، 2011. عرض على: موقع الناشر | منحة جوجل
  51. آر إي بيلمان ، عمليات التحكم التكيفية & # x2014A جولة إرشادية، مطبعة جامعة برينستون ، برينستون ، نيوجيرسي ، الولايات المتحدة الأمريكية ، 1961.
  52. ر. كوخافي ". دراسة التحقق المتبادل والتمهيد لتقدير الدقة واختيار النموذج ، "في وقائع المؤتمر الدولي المشترك حول الذكاء الاصطناعي، المجلد. 14، pp. 1137–1143، Citeseer، 1995. View at: Google Scholar
  53. S. Lemm و B. Blankertz و T. Dickhaus و K.R M & # xfcller ، "مقدمة في التعلم الآلي لتصوير الدماغ" NeuroImage، المجلد. 56 ، لا. 2 ، ص 387-399 ، 2011. عرض على: موقع الناشر | منحة جوجل
  54. ت. هاستي ، ر. تيبشيراني ، وج. فريدمان ، عناصر التعلم الإحصائي: التنقيب في البيانات والاستدلال والتنبؤ، المجلد. 27 ، سبرينغر ، 2009.
  55. T. Fawcett ، "مقدمة لتحليل ROC ،" رسائل التعرف على الأنماط، المجلد. 27 ، لا. 8 ، ص 861-874 ، 2006. عرض على: موقع الناشر | منحة جوجل
  56. S.M Smith و T. E. Nichols ، "تحسين المجموعة بدون عتبة: معالجة مشاكل التنعيم والاعتماد على العتبة والتوطين في الاستدلال العنقودي ،" NeuroImage، المجلد. 44 ، لا. 1، pp.83–98، 2009. عرض على: موقع الناشر | منحة جوجل
  57. L. Yan و R. Dodier و M. C. Mozer و R. Wolniewicz ، "تحسين أداء المصنف عبر تقريب لإحصاء Wilcoxon-Mann-Whitney ،" في وقائع المؤتمر الدولي العشرين للتعلم الآلي (ICML '03)، المجلد. 20 ، ص. 848 ، مطبعة AAAI ، أغسطس 2003. عرض على: الباحث العلمي من Google
  58. J. Ashburner and S. Kl & # xf6ppel ، "نماذج متعددة المتغيرات للتنوع التشريحي بين الموضوعات ،" NeuroImage، المجلد. 56 ، لا. 2، pp.422–439، 2011. عرض على: موقع الناشر | منحة جوجل
  59. A.P. Holmes ، و R.C.Blair ، و J.DG Watson ، و I. Ford ، "التحليل اللامعلمي للصور الإحصائية من تجارب رسم الخرائط الوظيفية ،" مجلة تدفق الدم الدماغي والتمثيل الغذائي، المجلد. 16 ، لا. 1، pp.7–22، 1996. View at: Google Scholar
  60. T. E. Nichols و A.P. Holmes ، "اختبارات التقليب اللامعلمية للتصوير العصبي الوظيفي: كتاب تمهيدي مع أمثلة ،" رسم خرائط الدماغ البشري، المجلد. 15 ، لا. 1، pp.1-25، 2002. عرض على: موقع الناشر | منحة جوجل
  61. إيكلوند ، إم أندرسون ، وه. كنوتسون ، "تتيح اختبارات التقليب العشوائي السريعة التقييم الموضوعي لطرق تحليل التصوير بالرنين المغناطيسي الوظيفي الفردي ،" المجلة الدولية للتصوير الطبي الحيوي، المجلد. 2011 ، معرف المقالة 627947 ، 15 صفحة ، 2011. عرض على: الباحث العلمي من Google
  62. P. Golland و B. Fischl ، "اختبارات التقليب للتصنيف: نحو الأهمية الإحصائية في الدراسات القائمة على الصور ،" في وقائع مؤتمر معالجة المعلومات في التصوير الطبي، الصفحات من 330 إلى 341 ، أغسطس 2003. عرض على: الباحث العلمي من Google
  63. P. Golland و F. Liang و S. Mukherjee و D. Panchenko ، "اختبارات التقليب للتصنيف" في وقائع المؤتمر السنوي الثامن عشر حول نظرية التعلم (COLT '05)، الصفحات 501-515 ، أغسطس 2005. عرض على: الباحث العلمي من Google
  64. A.M Smith ، و B. K. Lewis ، و U. E. Ruttimann et al. ، "التحقيق في انحراف التردد المنخفض في إشارة الرنين المغناطيسي الوظيفي ،" NeuroImage، المجلد. 9 ، لا. 5 ، ص 526-533 ، 1999. عرض على: موقع الناشر | منحة جوجل

حقوق النشر

حقوق النشر & # xa9 2012 عبد الحق محمدي وآخرون. هذا مقال مفتوح الوصول يتم توزيعه بموجب ترخيص Creative Commons Attribution License ، والذي يسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط ، بشرط الاستشهاد بالعمل الأصلي بشكل صحيح.


مثال على التطبيق

نظرًا لأنه يمكن استخدام طريقة DLS في العديد من المجالات نحو توزيع الحجم مثل البوليمرات أو البروتينات أو الجسيمات النانوية المعدنية أو المواد النانوية الكربونية ، نقدم هنا مثالاً على تطبيق DLS في تخليق جزيئات الذهب النانوية أحادية الانتشار التي يتحكم فيها الحجم.

يتم التحكم في توزيع حجم وحجم جزيئات الذهب من خلال التباين الدقيق في بنية البوليمر ، والذي يستخدم لتثبيت جزيئات الذهب النانوية أثناء التفاعل. تشمل هذه الاختلافات نوع المونومر ، والوزن الجزيئي للبوليمر ، والكراهية للماء للمجموعة النهائية ، ولسان المجموعة النهائية ، وتركيز البوليمر ، وقد تم إجراء عدد إجمالي قدره 88 تجربة مختلفة بناءً على هذه الاختلافات. باستخدام طريقة DLS ، يستطيع المؤلفون تحديد توزيع حجم جزيئات الذهب لجميع هذه التجارب بسهولة إلى حد ما ، ويمكن أيضًا رسم العلاقة بين بنية البوليمر وحجم الجسيمات دون معالجة البيانات. على الرغم من أن تقنيات التحجيم الأخرى مثل التحليل الطيفي للأشعة فوق البنفسجية UV-V و TEM تُستخدم أيضًا في هذا البحث ، إلا أن قياس DLS هو الذي يوفر طريقة أسهل بكثير وموثوق بها لتحليل توزيع الحجم.

مقارنة مع TEM و AFM

نظرًا لأن DLS ليست الطريقة الوحيدة المتاحة لتحديد توزيع حجم الجسيمات ، فمن الضروري أيضًا مقارنة DLS مع تقنيات التحجيم العامة الأخرى الشائعة الاستخدام ، خاصة TEM و AFM.

بادئ ذي بدء ، يجب توضيح أن كلا من TEM و AFM يقيسان الجسيمات المترسبة على الركيزة (شبكة النحاس لـ TEM ، والميكا لـ AFM) ، بينما يقيس DLS الجسيمات المشتتة في محلول. وبهذه الطريقة ، ستقوم DLS بقياس خصائص المرحلة السائبة وإعطاء معلومات أكثر شمولاً حول توزيع حجم العينة. وبالنسبة لـ AFM أو TEM ، من الشائع جدًا أن يتم تحليل منطقة أخذ عينات صغيرة نسبيًا ، وقد لا يكون توزيع الحجم على منطقة أخذ العينات هو نفسه توزيع الحجم للعينة الأصلية اعتمادًا على كيفية ترسيب الجسيمات.

من ناحية أخرى ، بالنسبة لـ DLS ، تعتمد عملية الحساب بشكل كبير على الافتراضات والنماذج الرياضية والفيزيائية ، والتي تتمثل في التوزيع أحادي النسق (الطريقة التراكمية) والشكل الكروي للجسيمات ، وقد تكون النتائج غير دقيقة عند تحليل غير أحادي الوسائط. التوزيعات أو الجسيمات غير الكروية. ومع ذلك ، نظرًا لأن عملية تحديد الحجم لـ AFM أو TEM ليست أكثر من قياس الحجم من الصورة ثم استخدام الإحصاء ، يمكن أن توفر هاتان الطريقتان بيانات أكثر موثوقية عند التعامل مع عينات & ldquoir Regular & rdquo.

هناك مسألة أخرى مهمة يجب مراعاتها وهي تكلفة الوقت وتعقيد قياس الحجم. بشكل عام ، يجب أن يكون قياس DLS تقنية أسهل بكثير ، والتي تتطلب وقت تشغيل أقل ومعدات أرخص أيضًا. وقد يكون من الصعب حقًا تحليل بيانات توزيع الحجم الصادرة من صور TEM أو AFM بدون برامج مبرمجة بشكل خاص.

بالإضافة إلى ذلك ، هناك بعض القضايا الخاصة التي يجب مراعاتها عند اختيار تقنيات تحليل الحجم. على سبيل المثال ، إذا كانت العينة الأصلية موجودة بالفعل على ركيزة (تم توليفها بطريقة CVD) ، أو لا يمكن تشتيت الجسيمات بشكل ثابت داخل المحلول ، فمن الواضح أن طريقة DLS غير مناسبة. أيضًا ، عندما تميل الجسيمات إلى أن يكون لها تباين تصوير مماثل مع الركيزة (المواد النانوية الكربونية على شبكة TEM) ، أو تميل إلى التجميع الذاتي والتجمع على سطح الركيزة ، فقد يكون نهج DLS خيارًا أفضل.

ومع ذلك ، في العمل البحثي العام ، فإن أفضل طريقة للقيام بتحليل توزيع الحجم هي الجمع بين طرق التحليل هذه ، والحصول على معلومات مجانية من جوانب مختلفة. هناك شيء واحد يجب مراعاته ، نظرًا لأن DLS يقيس فعليًا نصف القطر الهيدروديناميكي للجسيمات ، فإن الحجم من قياس DLS يكون دائمًا أكبر من الحجم من قياس AFM أو TEM. في الختام ، تظهر المقارنة بين DLS و AFM / TEM في Table ( PageIndex <1> ).

جدول ( PageIndex <1> ) مقارنة بين DLS و AFM و TEM.
DLS AFM / TEM
إعداد عينة حل المادة المتفاعلة
قياس سهل صعب
أخذ العينات حجم منطقة صغيرة
شكل الجسيمات جسم كروى بدون شروط
التشتت المتعدد قليل بدون شروط
نطاق الحجم نانومتر لأم نانومتر لأم
معلومات الحجم. نصف القطر الهيدروديناميكي قياس فيزيائي


شاهد الفيديو: تعلم قراءة تحليل صوره الدم الكامله واعرف بنفسك نتيجة التحليل AnemiaComplete blood count CBC (أغسطس 2022).