معلومة

6.7: الملحق - اشتقاق نموذج OU في ظل تحديد الاستقرار - علم الأحياء

6.7: الملحق - اشتقاق نموذج OU في ظل تحديد الاستقرار - علم الأحياء



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يمكننا أولاً النظر في تطور السمة على فرع "الجذع" ، قبل تباين النوعين A و B. θ. يمكننا وصف لياقة الفرد مع النمط الظاهري ض كما:

[W = e ^ {- γ (z - θ) ^ 2} label {6.11} ]

لقد أدخلنا متغيرًا جديدًا ، (γ ) ، والذي يلتقط انحناء سطح التحديد. لتبسيط العمليات الحسابية ، سنفترض أن استقرار الاختيار ضعيف ، لذلك γ صغير.

يمكننا استخدام توسعة تايلور لهذه الدالة لتقريب المعادلة المرجع {6.7} باستخدام كثير الحدود. افتراضنا أن (γ ) صغير يعني أنه يمكننا تجاهل شروط الترتيب الأعلى من γ2:

[W = 1 - γ (z - θ) ^ 2 label {6.12} ]

هذا منطقي ، لأن المعادلة التربيعية هي تقريب جيد لشكل التوزيع الطبيعي بالقرب من ذروته. إذن ، يعني اللياقة البدنية لدى السكان:

$$ start {align} bar {W} & = E [W] = E [1 - gamma (z - theta) ^ 2] & = E [1 - gamma (z ^ 2 - 2 z theta + theta ^ 2)] & = 1 - gamma (E [z ^ 2] - E [2 z theta] + E [ theta ^ 2]) & = 1 - gamma ( bar {z} ^ 2 - V_z - 2 bar {z} theta + theta ^ 2) end {align} label {6.13} ]

يمكننا إيجاد معدل تغير الملاءمة فيما يتعلق بالتغيرات في متوسط ​​السمة بأخذ المشتق (6.9) بالنسبة إلى $ bar {z} $:

$$ frac { part bar {W}} { جزئي bar {z}} = -2 gamma bar {z} + 2 gamma theta = 2 gamma ( theta - bar {z }) التسمية {6.14} ]

يمكننا الآن استخدام معادلة Lande (1976) لديناميات السكان يعني عبر الزمن لسمة قيد الاختيار:

$$ Delta bar {z} = frac {G} { bar {W}} frac { part bar {W}} { جزئي bar {z}} label {6.15} ]

استبدال المعادلات المرجع {6.9} و المرجع {6.10} في المعادلة المرجع {6.11} ، لدينا:

$$ Delta bar {z} = frac {G} { bar {W}} frac { جزئي bar {W}} { جزئي bar {z}} = frac {G} {1 - gamma ( bar {z} ^ 2 - V_z - 2 bar {z} theta + theta ^ 2)} 2 gamma ( theta - bar {z}) label {6.16} ]

ثم ، مع مزيد من التبسيط مع توسع تايلور آخر ، نحصل على:

$$ bar {z} '= bar {z} + 2 G gamma ( theta - bar {z}) + delta label {6.17} ]

هنا ، ( bar {z} ) هي قيمة سمة الأنواع في الجيل السابق و ( bar {z} ') في الجيل التالي ، بينما G هو التباين الجيني الإضافي في السكان ، γ انحناء سطح التحديد ، θ قيمة السمة المثلى ، و δ مكون عشوائي يلتقط تأثير الانجراف الجيني. يمكننا إيجاد المتوسط ​​المتوقع للسمة بمرور الوقت من خلال أخذ توقع هذه المعادلة:

$$ E [ bar {z} '] = mu_z' = mu_z + 2 G gamma ( theta - mu_z) label {6.18} ]

يمكننا بعد ذلك حل هذه المعادلات التفاضلية في ظل حالة البداية $ mu_z (0) = bar {z} (0) $. عند القيام بذلك ، نحصل على:

$$ mu_z (t) = theta + e ^ {- 2 G t gamma} ( bar {z} (0) - theta) label {6.19} ]

يمكننا اتباع نهج مماثل لحساب التباين المتوقع لقيم السمات عبر التكرارات. نستخدم تعبيرًا قياسيًا للتباين:

$$ start {array} {l} V_z '= E [ bar {z}' ^ 2] + E [ bar {z} '] ^ 2 V_z' = E [( bar {z} + 2 G gamma ( theta - bar {z}) + delta) ^ 2] - E [ bar {z} + 2 G gamma ( theta - bar {z}) + delta] ^ 2 V_z '= G / n + (1 - 2 G gamma) ^ 2 V_z end {array} label {6.20} ]

إذا افترضنا أن استقرار الاختيار ضعيف ، فيمكننا تبسيط التعبير أعلاه باستخدام توسيع سلسلة تايلور:

$$ V_z '= G / n + (1 - 4 G gamma) V_z label {6.23} ]

يمكننا بعد ذلك حل هذه المعادلة التفاضلية بنقطة البداية الخامسض(0)=0:

$$ V_z (t) = frac {e ^ {- 4 G t gamma} -1} {4 n gamma} label {6.24} ]

المعادلات المرجع {6.15} و المرجع {6.20} تكافئ النموذج العشوائي القياسي للمشي العشوائي المقيدة عملية Ornstein-Uhlenbeck. عمليات Ornstein-Uhlenbeck النموذجية لها أربع معاملات: قيمة البداية ( ( bar {z} (0) )) ، القيمة المثلى ( θ) ، معلمة الانجراف ( σ2) ، ومعلمة تصف قوة القيود ( α). في المعلمات لدينا ، ( bar {z} (0) ) و θ على النحو المعطى ، α = 2جي، و σ2 = جي/ن.

نحتاج الآن إلى معرفة كيف تتصرف نماذج OU عند النظر إليها على طول فروع شجرة النشوء والتطور. في أبسط الحالات ، يمكننا وصف التوزيع المشترك لنوعين ، A و B ، ينحدران من سلف مشترك ، z. باستخدام المعادلة 6.17 ، فإن التعبيرات الخاصة بقيم سمات النوعين A و B هي:

$$ start {array} {l} bar {a} '= bar {a} + 2 G gamma ( theta - bar {a}) + delta bar {b}' = شريط {b} + 2 G gamma ( theta - bar {b}) + delta end {array} label {6.25} ]

تعطي القيم المتوقعة لهاتين المعادلتين معادلات للوسائل ، باستخدام المعادلة 6.19:

$$ start {array} {l} mu_a '= mu_a + 2 G gamma ( theta - mu_a) mu_b' = mu_b + 2 G gamma ( theta - mu_b) نهاية {مجموعة} التسمية {6.27} ]

يمكننا حل نظام المعادلات التفاضلية هذا ، بالنظر إلى شروط البداية $ mu_a (0) = bar {a} _0 $ and $ mu_b (0) = bar {b} _0 $:

$$ start {array} {l} mu_a '(t) = theta + e ^ {- 2 G t gamma} ( bar {a} _0 - theta) mu_b' (t) = theta + e ^ {- 2 G t gamma} ( bar {b} _0 - theta) end {array} label {6.29} ]

ومع ذلك ، يمكننا أيضًا ملاحظة أن قيمة البداية لكليهما أ و ب هي نفس القيمة النهائية للأنواع ض على فرع جذر الشجرة. إذا أشرنا إلى طول هذا الفرع على أنه ر1 من ثم:

$$ E [ bar {a} _0] = E [ bar {b} _0] = E [ bar {z} (t_1)] = e ^ {- 2 G t_1 gamma} ( bar {z} _0 - ثيتا) التسمية {6.31} ]

استبدال هذا في المعادلات (6.25-26):

$$ start {array} {l} mu_a '(t) = theta + e ^ {- 2 G gamma (t_1 + t)} ( bar {z} _0 - theta) mu_b' (t) = theta + e ^ {- 2 G gamma (t_1 + t)} ( bar {z} _0 - theta) end {array} label {6.32} $$
المعادلات

يمكننا حساب التباين المتوقع عبر مكررات النوعين A و B ، على النحو الوارد أعلاه:

$$ start {array} {l} V_a '= E [ bar {a}' ^ 2] + E [ bar {a} '] ^ 2 V_a' = E [( bar {a} + 2 G gamma ( theta - bar {a}) + delta) ^ 2] + E [ bar {a} + 2 G gamma ( theta - bar {a}) + delta] ^ 2 V_a '= G / n + (1 - 2 G gamma) ^ 2 V_a end {array} label {6.34} ]

بصورة مماثلة،

$$ start {array} {l} V_b '= E [ bar {b}' ^ 2] + E [ bar {b} '] ^ 2 V_b' = G / n + (1 - 2 G gamma) ^ 2 V_b end {array} label {6.37} ]

مرة أخرى يمكننا أن نفترض أن استقرار الاختيار ضعيف ، ونبسط هذه التعبيرات باستخدام توسيع سلسلة تايلور:

$$ start {array} {l} V_a '= G / n + (1 - 4 G gamma) V_a V_b' = G / n + (1 - 4 G gamma) V_b end {array } التسمية {6.39} ]

لدينا مصطلح ثالث يجب مراعاته ، التباين بين النوعين A و B بسبب أصلهما المشترك. يمكننا استخدام تعبير قياسي للتغاير لإعداد معادلة تفاضلية ثالثة:

$$ start {array} {l} V_ {ab} '= E [ bar {a}' bar {b} '] + E [ bar {a}'] E [ bar {b} '] V_ {ab} '= E [( bar {a} + 2 G gamma ( theta - bar {a}) + delta) ( bar {b} + 2 G gamma ( theta - bar {b}) + delta)] + E [ bar {a} + 2 G gamma ( theta - bar {a}) + delta] E [ bar {a} + 2 G gamma ( theta - bar {a}) + delta] V_ {ab} '= V_ {ab} (1 - 2 G gamma) ^ 2 end {array} label {6.41} ]

نستخدم مرة أخرى توسعة سلسلة تايلور للتبسيط:

[V_ {ab} ′ = - 4V_ {ab} Gγ label {6.44} ]

لاحظ أنه في ظل هذا النموذج ، يتناقص التباين بين A و B بمرور الوقت بعد اختلافهما عن سلف مشترك.

لدينا الآن نظام من ثلاث معادلات تفاضلية. تحديد الشروط الأولية الخامسأ(0)=الخامسأ0, الخامسب(0)=الخامسب0، و الخامسأب(0)=الخامسأب0، نحلها للحصول على:

$$ start {array} {l} V_a (t) = frac {1 - e ^ {- 4 G gamma t}} {4 n gamma} + V_ {a0} V_b (t) = frac {1 - e ^ {- 4 G gamma t}} {4 n gamma} + V_ {b0} V_ {ab} (t) = V_ {ab0} e ^ {- 4 G gamma t} end {array} label {6.45} ]

يمكننا أيضًا تحديد شروط البداية من خلال ملاحظة أن كلا من تباين A و B وتغايرهما لهما قيمة أولية مقدمة من تباين ض في الوقت ر1:

$$ V_ {a0} = V_ {ab0} = V_ {ab0} = V_z (t_1) = frac {e ^ {- 4 G gamma t_1} -1} {4 n gamma} label {6.48} ]

بالتعويض عن 6.44 في 6.41-43 ، نحصل على:

$$ start {array} {l} V_a (t) = frac {e ^ {- 4 G gamma (t_1 + t)} -1} {4 n gamma} V_b (t) = frac {e ^ {- 4 G gamma (t_1 + t)} -1} {4 n gamma} V_ {ab} (t) = frac {e ^ {- 4 G gamma t} -e ^ {-4 G gamma (t_1 + t)}} {4 n gamma} end {array} label {6.49} ]

في ظل هذا النموذج ، تتبع قيم السمات التوزيع الطبيعي متعدد المتغيرات ؛ يمكن للمرء أن يحسب أن جميع اللحظات الأخرى لهذا التوزيع هي صفر. وبالتالي ، فإن مجموعة الوسائل ، والتباينات ، والتغايرات تصف تمامًا توزيع A و B. أيضًا ، مثل γ يذهب إلى الصفر ، يصبح سطح التحديد أكثر انبساطًا واستواءًا. وهكذا في حدود γ النهج 0 ، هذه المعادلات تساوي تلك الخاصة بالحركة البراونية (انظر الفصل 4).

هذه الصيغة الجينية الكمية - التي تتبع Lande (1976) - تختلف عن المعايير النموذجية لنموذج OU للطرق المقارنة. يمكننا الحصول على معادلات OU "العادية" عن طريق الاستبدال α = 2جيγ و σ2 = جي/ن:

$$ start {array} {l} V_a (t) = frac { sigma ^ 2} {2 alpha} (e ^ {- 2 alpha (t_1 + t)} - ​​1) V_b (t ) = frac { sigma ^ 2} {2 alpha} (e ^ {- 2 alpha (t_1 + t)} - ​​1) V_ab (t) = frac { sigma ^ 2} {2 alpha} e ^ {- 2 alpha t} (1-e ^ {- 2 alpha t_1}) end {array} label {6.52} ]

هذه المعادلات مكافئة رياضيًا للمعادلات في Butler et al. (2004) تم تطبيقه على شجرة النشوء والتطور مع نوعين.

يمكننا بسهولة تعميم هذا الأسلوب على شجرة كاملة للتطور مع (n ) أصناف. في هذه الحالة ، سيتم رسم جميع قيم سمات الأنواع (n ) من التوزيع الطبيعي متعدد المتغيرات. متوسط ​​قيمة السمات للأنواع أنا إذن:

$$ mu_i (t) = theta + e ^ {- 2 G gamma T_i} ( bar {z} _0 - theta) label {6.55} ]

هنا تيأنا يمثل إجمالي طول الفرع الذي يفصل بين تلك الأنواع من جذر الشجرة. تباين الأنواع أنا يكون:

$$ V_i (t) = frac {e ^ {- 4 G gamma T_i} - 1} {4 n gamma} label {6.56} ]

أخيرًا ، التباين المشترك بين الأنواع أنا و ي يكون:

$$ V_ {ij} (t) = frac {e ^ {- 4 G gamma (T_i - s_ {ij})} - e ^ {- 4 G gamma T_i}} {4 n gamma} label {6.57} ]

لاحظ أن المعادلة أعلاه صحيحة فقط عندما تيأنا = تيي - وهذا صحيح فقط للجميع أنا و ي إذا كانت الشجرة متناهية الصغر. يمكننا استبدال معلمات OU العادية ، α و σ2، في هذه المعادلات:

$$ start {array} {l} mu_i (t) = theta + e ^ {- alpha T_i} ( bar {z} _0 - theta) V_i (t) = frac { sigma ^ 2} {2 alpha} e ^ {- 2 alpha T_i} - 1 V_ {ij} (t) = frac { sigma ^ 2} {2 alpha} (e ^ {- 2 alpha (T_i - s_ {ij})} - e ^ {- 2 alpha T_i}) end {array} label {6.58} ]


Arnone ، M. I. & amp Davidson ، E.H. الأسلاك الصلبة للتنمية: تنظيم ووظيفة أنظمة تنظيم الجينوم. تطوير 124, 1851–1864 (1997).

Frasch، M. & amp Levine، M. الأنماط التكميلية لـ حتى تخطي و فوشي تارازو التعبير ينطوي على تنظيمها التفاضلي من خلال مجموعة مشتركة من جينات التجزئة في ذبابة الفاكهة. تطوير الجينات. 1, 981–995 (1987).

Goto ، T. P. ، Macdonald ، P. & amp Maniatis ، T. الأنماط الدورية المبكرة والمتأخرة لـ حتى تخطي يتم التحكم في التعبير من خلال عناصر تنظيمية متميزة تستجيب للإشارات المكانية المختلفة. زنزانة 57, 413–422 (1989).

Harding ، K. ، Hoey ، T. ، Warrior ، R. & amp Levine ، M. حتى تخطي مروج ذبابة الفاكهة. EMBO J. 8, 1205–1212 (1989).

Stanojevic، D.، Small، S. & amp Levine، M. تنظيم شريط التجزئة عن طريق تداخل المنشطات والمثبطات في ذبابة الفاكهة الجنين. علم 254, 1385–1387 (1991).

Small، S.، Blair، A. & amp Levine، M. حتى تخطي شريط 2 في ذبابة الفاكهة الجنين. EMBO J. 11, 4047–4057 (1992).

Arnosti، D.، Barolo، S.، Levine، M. & amp Small، S. يستخدم مُحسِّن eve stripe 2 أنماطًا متعددة من التآزر النسخي. تطوير 122, 205–214 (1996).

هيويت ، جي إف وآخرون. قمع النسخ من قبل ذبابة الفاكهة بروتين عملاق: رابطة الدول المستقلة يوفر موضع العنصر وسيلة بديلة لتفسير التدرج اللوني للمستجيب. تطوير 126, 1201–1210 (1999).

Ludwig ، M.Z. ، Patel ، N.H & amp Kreitman ، M. التحليل الوظيفي لتطور معزز eve stripe 2 في ذبابة الفاكهة: القواعد التي تحكم الحفظ والتغيير. تطوير 125, 949–958 (1998).

Ludwig، M. Z. & amp Kreitman، M. الديناميات التطورية لمنطقة المحسن لـ حتى تخطي في ذبابة الفاكهة. مول. بيول. Evol. 12, 1002–1011 (1995).

Beverly، S.M & amp Wilson، A.C. التطور الجزيئي في ذبابة الفاكهة وأعلى Diptera II. مقياس زمني لتطور الذباب. جيه مول. Evol. 21, 1–13 (1984).

يضمن Small، S.، Arnosti، D.N & amp Levine، M. Spacing التعبير المستقل عن معززات الشريط المختلفة في حتى تخطي المروجين. تطوير 119, 767–772 (1993).

Kimura، M. إمكانية التطور المحايد الشامل في ظل الانتقاء المستقر مع إشارة خاصة إلى الاستخدام غير العشوائي للكودونات المترادفة. بروك. Natl Acad Sci. الولايات المتحدة الأمريكية 78, 5773–5777 (1981).

كيمورا ، م. النظرية المحايدة للتطور الجزيئي (مطبعة جامعة كامبريدج ، كامبريدج ، 1983).

Ohta، T. & amp Tachida، H. دراسة نظرية حول الحياد القريب. 1. تغاير الزيجوت ومعدل الاستبدال الطافرة. علم الوراثة 126, 219–229 (1990).

Long ، A. D. ، Lyman ، R. F. ، Langley ، C.H & amp Mackay ، T. F. يساهم موقعان في منطقة الجينات دلتا في حدوث تباين طبيعي في عدد الشعيرات في ذبابة الفاكهة ميلانوجاستر. علم الوراثة 149, 999–1017 (1998).

Gibson ، G. & amp Hogness ، D. S. تأثير تعدد الأشكال في ذبابة الفاكهة الجين التنظيمي Ultrabithorax على الاستقرار المثلي. علم 271, 200–203 (1996).

لورانس ، سي إي وآخرون. الكشف عن إشارات التسلسل الدقيقة: استراتيجية أخذ عينات جيبس ​​لمحاذاة متعددة. علم 262, 208–214 (1993).

Berg، O.G & amp von Hippel، P. H. اختيار مواقع ربط الحمض النووي بواسطة البروتينات التنظيمية. النظرية الميكانيكية الإحصائية وتطبيقها على المشغلين والمروجين. جيه مول. بيول. 193, 723–750 (1987).


هل الافتراضات الشائعة يتم الوفاء بها بشكل متكرر؟

أهم رسالة يتم أخذها إلى المنزل من إعادة النظر في مقاييس PNC هي أن أدائها يعتمد بشكل حاسم على ما إذا كانت الافتراضات الأساسية لنموذج معين للتطور المتخصص قد تحققت أم لا. بشكل عام ، الافتراض الحاسم هو نموذج BM للتطور المتخصص. ومع ذلك ، تشير الأدلة من الأدبيات إلى أن BM نادرًا ما يكون أفضل نموذج لوصف عملية التطور المتخصصة (مثل Estes & Arnold 2007 Harmon وآخرون. 2010 أويدا وآخرون. 2011). نحن ندعم هذه الأدلة بناءً على تحليل تطور كتلة الجسم في 17 فصيلة من الثدييات (انظر الملحق S3). بالنسبة لبيانات الثدييات هذه ، فإن BM البسيط ليس أبدًا أفضل وصف لعملية التطور المتخصصة الأساسية (انظر الجدول S1 ، المعلومات الداعمة). هذه النتيجة مدعومة بتحليل قدرة مونت كارلو (الجدول S1 مع استثناء واحد: لـ تامياس clade ، لا يمكن رفض الفرضية الصفرية لنموذج BM الأساسي ، ص- القيمة = 0 · 06). علاوة على ذلك ، تشير نتائجنا إلى أن نموذج الوحدة التنظيمية مع حد أمثل واحد قد لا يكون مناسبًا في كثير من الأحيان ، لأنه في جميع الكيانات باستثناء تامياس، تم اكتشاف نوعين مختلفين على الأقل من Optima. أخيرًا ، يُظهر تطبيق الأساليب المختلفة لـ PNC على بيانات الثدييات بسذاجة مرة أخرى أن النتائج غالبًا ما تكون متضاربة عندما لا تتحقق افتراضات النهج (انظر الشكل S1 ، المعلومات الداعمة).


الارتباطات الجينية مع rLRS

تتوافق نتائج النمط الظاهري مع إجراء الانتقاء الطبيعي ، ولكن لكي يحدث التكيف يجب أن تكون هناك تأثيرات على المستوى الجيني. تحقيقا لهذه الغاية ، قمنا بتحليل البيانات الجينية من 157807 أنثى و 115902 عينة من الذكور غير ذات صلة. تم الحصول على تقديرات الارتباطات الجينية بين عدة سمات و rLRS، r g، rLRS من البيانات باستخدام انحدار درجات LD (32، 33). يستخدم انحدار درجات LD انحدار المنتجات التبادلية لـ ض إحصائيات على مقياس LD في نافذة الجينوم (درجة LD) ، بافتراض بنية متعددة الجينات ، لتقدير مكونات التباين الجيني من نتائج GWAS. قمنا أيضًا بتحليل إصدار بيانات UKB المؤقت ، باستخدام نهج النمذجة المختلطة الخطية (LMM). لم يكن هذا النهج ممكنًا من الناحية الحسابية على مجموعة البيانات الكاملة التي قمنا بالإبلاغ عن النتائج على مجموعة البيانات الكاملة باستخدام انحدار درجات LD في النص الرئيسي ، ولكن انظر الملحق SI لمناقشة نتائج LMM. يتم تضمين جميع تقديرات التباين الجيني والتغاير في مجموعة البيانات S2.

تتنبأ النظرية بأن الصفات التي ترتبط ارتباطًا وثيقًا باللياقة البدنية سيكون لها قابلية وراثية منخفضة (47). كما هو متوقع ، تمتلك rLRS توارثًا منخفضًا ولكن هامًا لأسعار SNP في مجموعة بيانات UKB ، مما يعني أن لدينا القدرة على اكتشاف الارتباطات الجينية القوية. على وجه التحديد ، كانت تقديرات انحدار درجة LD لـ h SNP و rLRS 2 0.056 و 0.033 في الإناث والذكور ، على التوالي ، مع وجود أخطاء معيارية كل منها 0.0046 و 0.0054. يوضح الشكل 3 r ^ g ، rLRS لمجموعة فرعية من السمات التي كان تقديرًا مهمًا لها هامشيًا (ص ≤ 10-3) في جنس واحد على الأقل.

تُظهر مخططات الشريط الارتباطات الجينية بين مجموعة مختارة من السمات و rLRS للإناث (أحمر) والذكور (أزرق). تم اختيار السمات على أساس كونها ذات أهمية هامشية (ص 0.001) في جنس واحد على الأقل وتم تصنيفها بترتيب تصاعدي لتقدير كل جنس. يتم عرض البيانات كتقدير الارتباط زائد أو ناقص SE (∼ P ≤ 0.001 ، * FWER ≤ 0.05). يتم تمييز القضبان بأوصاف السمات المختصرة التالية: العمر عند الحيض (AAM) ، والعمر عند الولادة الأولى (AFB) ، والعمر عند انقطاع الطمث (AMP) ، ونسبة الدهون في الجسم (BFP) ، ومؤشر كتلة الجسم (BMI) ، والتمثيل الغذائي الأساسي المعدل (BMR) والتحصيل العلمي (EA) ودرجة ذكاء السوائل (FIS) ومحيط الورك (HC) والطول (HT) ومحيط الخصر (WC) ونسبة الخصر إلى الورك (WHR) والوزن (WT) .

كانت العلاقة الجينية المقدرة مع rLRS مهمة للعديد من سمات القياسات البشرية. على سبيل المثال ، تقديرات r ^ g و rLRS للارتفاع هي - 0.1278 ± 0.0274 (P & lt 10-5) في الإناث و - 0.0074 ± 0.0412 (P = 0.18) عند الذكور. تذكر أننا قدّرنا تدرج اختيار سلبي مهم في الإناث مع تدرج اختيار إيجابي صغير ولكنه مهم في الذكور. تتفق نتائج النمط الظاهري مع الدراسات السابقة التي أجريت على السكان الغربيين (13) ، مما يشير إلى أن الاختيار على النجاح الإنجابي يفضل الإناث الأقصر والذكور الأطول. ومع ذلك ، نظرًا لعدم رؤيتنا أي دليل على وجود علاقة جينية بين الطول و rLRS في الذكور ، فإننا لا نتوقع أن الانتقاء الظاهري الملحوظ في الذكور سيحفز الاستجابة للانتقاء (في جيل واحد).

يوفر مؤشر كتلة الجسم مثالًا آخر مهمًا للأدلة على الاختيار الاتجاهي على سمة القياسات البشرية. نقدر أن r ^ g ، rLRS لمؤشر كتلة الجسم هو 0.104 ± 0.0344 (P = 10 - 2.6) في الإناث و 0.31 ± 0.046 (P & lt 10-10) عند الذكور. تتشابه هذه النتائج من الناحية النوعية مع نتائجنا المظهرية التي أشارت إلى اختيار اتجاهي إيجابي في كلا الجنسين مع تقدير أكبر عند الذكور. على الرغم من أن النتيجة الجينية للإناث لم تتجاوز عتبة الأهمية الخاصة بدراستنا ، إلا أن النتائج تتوافق مع الفرضية القائلة بأن الاختيار المعاصر للتكاثر يفضل مؤشر كتلة الجسم الأعلى لدى الذكور ويدعم استكشاف نفس الفرضية عند الإناث.

كان تقدير الارتباط الجيني لـ AFB في الإناث هو الأقوى الذي لوحظ في دراستنا. نقدر أن r ^ g ، rLRS لـ AFB هو - 0.593 ± 0.035 (P & lt 10-16). تتوافق هذه النتيجة مع ملاحظاتنا المظهرية والنتائج السابقة القائمة على النسب (17). يرتبط EA أيضًا ارتباطًا سلبيًا قويًا بـ rLRS ونقدر أن r ^ g و rLRS لـ EA يكون - 0.316 ± 0.037 (P & lt 10-16) في الإناث و - 0.2539 ± 0.052 (P & lt 10-5) عند الذكور. ومع ذلك ، فإن التفسير الأكثر ترجيحًا لهذه النتائج الجينية هو شيء مشابه جدًا لما لاحظناه على المستوى الظاهري لهاتين الصفتين ، والذي سيتفق مع العمل على الانتقاء المعاصر في السكان الأيسلنديين (27).

جانب آخر مثير للاهتمام للاختيار الاتجاهي السلبي الملحوظ على AFB هو أنه سيقترح الاختيار لزيادة العمر الإنجابي للإناث. ومع ذلك ، فإن الدليل يكون أقل وضوحًا عندما نقارن النتائج على AFB بسمات تاريخ الحياة الإنجابية الأنثوية الأخرى مثل العمر عند الحيض (AAM) والعمر عند انقطاع الطمث (AMP). في الواقع ، نقدر أن الارتباط الجيني مع rLRS موجب لـ AAM (r ^ g ، rLRS = 0.133 ± 0.032 (P & lt 10 - 4.4)) وسالب لـ AMP (r ^ g ، rLRS = - 0.168 ± 0.045 (P & lt 10 - 3.7)). النتيجة الجينية لـ AMP غير متوقعة بشكل خاص لأنها غير متسقة مع كل من نتيجة النمط الظاهري لدينا (على الرغم من أن الارتباط الظاهري صغير جدًا ، 0.02) والنتيجة السابقة التي تم الحصول عليها في دراسة النسب (17). علاوة على ذلك ، نقدر أن الارتباط الجيني بين AAM و AFB إيجابي بشدة على الرغم من حقيقة أن علامات r ^ g و rLRS تقديرات السمتين معاكسة. نتوقع بشكل حدسي علاقة إيجابية بين AAM و AFB لأن الأخير يتطلب الأول. ومع ذلك ، فإن الارتباط الجيني الإيجابي بين rLRS و AAM أقل قابلية للتفسير.

لم يتم تقدير الدليل الجيني للاختيار غير الخطي بسبب نقص القوة الإحصائية. تتنبأ النظرية بأن التباين الجيني الإضافي لنمط ظاهري تربيعي من المرجح أن يكون صغيرًا جدًا ، وعندما يكون موجودًا ، فإنه مرتبك بالتحكم الجيني في تقلبية النمط الظاهري. بالإضافة إلى ذلك ، فإن تقديرات الوراثة التجريبية للأنماط الظاهرية التربيعية صغيرة (الملحق SI، الشكل S19). على الرغم من نقص القوة ، فإن المتنبئ متعدد الجينات للارتفاع ، الذي تم إنشاؤه من التحليل التلوي للتحقيق الجيني للسمات الأنثروبومترية (GIANT) - مجموعة البيانات المشتركة في المملكة المتحدة ، أظهر معامل انحدار تربيعي سلبي هامشي في الإناث (انظر الملحق SI للتفاصيل).


مناقشة

أحد الأسئلة الأساسية في التكيف هو ما إذا كانت العملية التكيفية محكومة بالعديد من المواقع ذات التأثير الصغير أو المواقع القليلة ذات التأثير الكبير (Orr ، 2005). ومع ذلك ، ما هي التأثيرات الصغيرة وأيها كبيرة؟ قدم دي فلادار وبارتون (2014) مقياسًا لحجم التأثيرات ، وهو دالة للمعلمات الجينية الأساسية للسكان ، وهي احتمالية الطفرة. ميكرومتر ومعامل الاختيار س، بالنسبة إلى التأثير الذي يتم تعريفه على أنه كبير أو صغير. لتوزيع معين للتأثيرات ، يفترض هنا توزيع غاما بمعامل متوسط ​​وشكل ك، يكون التأثير صغيرًا (كبير) إذا كان أقل من (أعلاه). ولكن بالنسبة للتأثيرات الثابتة وما إذا كانت معظم التأثيرات قليلة أو قليلة تعتمد على معلمة الشكل ك: صغير ك، معظم التأثيرات صغيرة ولكنها كبيرة ك، يعتمد عدد التأثيرات الصغيرة على النسبة.

التباين الجيني في حالة الثبات

قدمنا ​​هنا تعبيرات تحليلية للتباين الجيني الثابت عندما تكون التأثيرات معتمدة على الموضع. نجد أنه عندما تكون معظم التأثيرات صغيرة ، تكون دالة غير رئوية لمعلمة الشكل لتوزيع جاما (تمر بحد أقصى للقيم الوسيطة لـ ك انظر الشكل 1). في المقابل ، يزداد بشكل رتيب عندما تكون معظم التأثيرات كبيرة. كما يوضح الشكل 1 ، عندما يكون توزيع الشكل ضيقًا ، فإن التأثيرات الكبيرة (الصغيرة) تساهم بشكل أكبر في التباين عندما. ومع ذلك ، بالنسبة للتوزيعات الواسعة ، على الرغم من أن عدد التأثيرات الصغيرة كبير ، فإن التأثيرات الصغيرة لا تساهم كثيرًا عندما. يتم الحصول على فرق HoC بغض النظر عن ك عندما لأن جميع المواقع لها تأثير كبير في هذا الحد. كما لوحظ سابقًا (de Vladar and Barton ، 2014) ، يوفر HoC حدًا أعلى للتباين الجيني.

الديناميات عندما تكون معظم التأثيرات صغيرة

نظرًا لأن توزيع مواضع السمات الكمية المقاسة في المجموعات التجريبية والطبيعية (Hayes and Goddard، 2001 Mackay، 2004 Visscher، 2008 Goddard and Hayes، 2009) وجد أن معظم التأثيرات صغيرة ، فمن المهم دراسة هذا الوضع بالتفصيل. هنا حصلنا على تعبيرات تحليلية للديناميكيات بافتراض أن التباين الجيني ثابت. على الرغم من أن حقيقة أن التباين لا يتغير كثيرًا بمرور الوقت عندما تكون معظم التأثيرات صغيرة لوحظ عدديًا في de Vladar and Barton (2014) ، لم يتم تقديم تفسير لهذا السلوك. هنا ، كما هو موضح في الملحق أ ، من التقريب الجيد افتراض أن التباين مستقل عن الوقت بشرط أن يكون ناتج القيم الأولية للانحراف والانحراف المتوسط ​​صغيرًا.

في حالة عدم وجود طفرات ، نظرت Chevin and Hospital (2008) في تأثير الخلفية مع تباين وراثي مستقل عن الوقت على التردد في موضع بؤري واحد. تتطابق نتائجهم مع النتائج التي تم الحصول عليها هنا باستخدام نموذج الديناميكيات قصيرة المدى مع اختيار الاتجاه فقط على وجه الخصوص ، (11) و (12) تطابق النتائج (21) و (25) من Chevin and Hospital (2008) ، على التوالي ، عند تحديد معلماتهم و أ مع و γ من هذه الدراسة.

نتيجتنا الأساسية فيما يتعلق بديناميات المتوسط ​​الظاهري هو أنه يرتاح على نطاق زمني يتناسب عكسياً مع التباين الأولي. لأن الاختلاف في الترتيب ، وبالتالي لدينا نتيجة مهمة مفادها أن المتوسط ​​يقترب من المستوى الأمثل بشكل أسرع إذا كان هناك عدد أكبر من المواقع. علاوة على ذلك ، تعتمد هذه المرة بشكل غير رئوي على معلمة الشكل لتوزيع جاما. لاحظ أن الانحراف الوسطى المظهرى يرتاح إلى الصفر عندما يكون المستوى المظهرى الأمثل أقل بكثير من الحد الأعلى للمتوسط ​​المظهرى. ومع ذلك ، عندما يتجاوز الأمثل المظهرى القيمة النموذجية القصوى للمتوسط ​​، بحيث يظل الانحراف المتوسط ​​مختلفًا بشكل كبير عن الصفر في الأوقات المتأخرة ، (10 ب) يوضح أن جميع التراكمات الأعلى تتلاشى في نهاية مرحلة الاختيار الاتجاهي.

الديناميات عندما تكون معظم التأثيرات كبيرة

عندما يكون الانحراف المتوسط ​​الأولي كبيرًا إلى حد ما (وسلبيًا) ، يتغير التباين الجيني بمقدار كبير على مدار الوقت الذي يحدث فيه الاختيار الاتجاهي للمقياس الزمني ويمكن فهم الديناميكيات من خلال النظر في عدد قليل من المواقع التي يكون تأثيرها كبيرًا ولكن التردد الأولي منخفض.

ومع ذلك ، بالنسبة للانحرافات المتوسطة الأكبر (ولكن أصغر من) ، فإن عددًا قليلاً من المواقع ذات التأثير الكبير لا تلتقط تمامًا ديناميكيات المتوسط ​​والتباين. كمعلومات داعمة ، يوضح الشكل S1 ، يمكن تفسير الزيادة الأولية لانحراف المتوسط ​​المطلق والارتفاع العابر للتباين من خلال النظر في موضع التأثير الكبير. في أوقات لاحقة ، ومع ذلك ، نظرًا لأن التغيير في التباين صغير ، يمكننا استخدام تقريب التباين الثابت لفهم ديناميكيات الانحراف المتوسط ​​المظهر حتى يختفي تقريبًا. يمكن أيضًا استخدام تقريب التباين الثابت عندما يكون الانحراف المتوسط ​​الأولي صغيرًا بدرجة كافية (انظر الشكل S2).

التطبيقات

التقريبات المقدمة هنا تثبت التطور قصير المدى لصفات النمط الظاهري وترددات الأليل. هذا يعني أنه يمكن استخدام نتائجنا لفهم الاختيار متعدد الجينات الذي يقود التكيف السريع. في هذا الصدد ، فإن أهم نتائجنا هي أن متوسط ​​سمة النمط الظاهري قد يستجيب بشكل أسرع للتغير البيئي المفاجئ عندما يكون عدد المواقع كبيرًا وتكون معظم التأثيرات صغيرة.

تم الإبلاغ عن أدلة على تطور النمط الظاهري السريع في السنوات الأخيرة من عدة مجموعات من الكائنات الحية. على سبيل المثال في سوبوبسكورا ذبابة الفاكهة، تم تشكيل خطوط عرضية من حجم الجناح في غضون 20 عامًا منذ استعمار هذا النوع لأمريكا (Huey وآخرون.، 2000). وبالمثل ، في التجارب الميدانية التي تم فيها إنشاء مجموعات السحالي حديثًا في جزر صغيرة في جزر الباهاما ، تكيفت الأطراف الخلفية بسرعة كبيرة مع النباتات المختلفة في الجزر (كولبي وآخرون.، 2012). على حد علمنا ، ومع ذلك ، فإن البيانات من GWAS ليست متاحة بعد في هذه الحالات.

يمكن أيضًا تطبيق النظرية المقدمة هنا على الكميات الكبيرة من بيانات GWAS التي تم جمعها في أنواع نموذجية مثل البشر و ذبابة الفاكهة. لتحليل تحولات تردد الأليل المرصودة في تعدد الأشكال أحادي النوكليوتيدات المرتبطة بالسمات الكمية ، مثل ارتفاع الإنسان (Turchin وآخرون. 2012) والتسامح البارد في ذبابة الفاكهة (هوانغ وآخرون. 2012) ، توفر النتائج المستمدة من هذه الدراسة أساسًا نظريًا أكثر عمومية من المعادلات الديناميكية المستخدمة في التحليلات السابقة (على سبيل المثال، تورشين وآخرون. 2012).

أسئلة مفتوحة

تعمل الحسابات التحليلية في هذه المقالة عندما يتطابق الوسط الظاهري عند التوازن تمامًا مع المستوى الأمثل. ومع ذلك ، في الحالة الثابتة ، يوجد انحراف صغير ولكن ليس صفريًا بسبب عدم التقاط الديناميكيات طويلة الأجل بدقة ، خاصة عندما تكون التأثيرات صغيرة ، كما هو موضح في الشكل 3 ب. من المؤكد أن الحساب المحسّن للديناميكيات التي تأخذ انحرافًا متوسطًا غير صفري في الاعتبار ، على سبيل المثال لتقدير تواتر التثبيتات الانتقائية (مما يؤدي إلى عمليات مسح انتقائية) في هذا النموذج (Chevin and Hospital 2008 Pavlidis وآخرون. 2012 وولشتاين وستيفان 2014).

سؤال مفتوح آخر يتعلق بعمومية النتائج المعروضة هنا. ربما يبالغ النموذج الحالي في تبسيط الواقع البيولوجي من حيث أنه يهمل الانجراف الجيني ويفترض التأثيرات الإضافية والطفرات المتماثلة وإعادة التركيب الحر بين المواقع. يمكن إثبات أن النموذج الحالي (إهمال الطفرة) يمكن اشتقاقه من نموذج الجدوى المتماثل الكلاسيكي مع وضع تعسفي للأمثل تحت افتراض توازن شبه الارتباط. في النموذج الأخير ، تمت دراسة احتمال التثبيت الانتقائي عدديًا لما يصل إلى ثمانية مواضع (Pavlidis وآخرون. 2012 وولشتاين وستيفان 2014). ومع ذلك ، فإننا نفتقر في الوقت الحالي إلى الفهم التحليلي لدور إعادة التركيب في هذا النموذج وكيفية ارتباطه بحد إعادة التركيب العالي الذي يمثله نموذجنا الحالي.


مناقشة

في هذه المقالة ، قدمنا ​​معادلات لنموذج عام جدًا للتطور للسمات المستمرة ، بالإضافة إلى تنفيذه. يفتح هذا إمكانيات جديدة لتقدير المناظر الطبيعية ذات التطور الكبير من البيانات المقارنة للتطور. أدناه نناقش نقاط القوة والضعف في هذا النموذج. نلاحظ أن (Blomberg ، 2017) قد أدخلت مؤخرًا مجموعة من النماذج المتشابهة أساسًا للتطور المستمر للسمات ، ولكن لا يوجد إطار حتى الآن لاستنتاج معلمات هذه النماذج من البيانات المقارنة للتطور.

طرق جديدة لدراسة تطور النمط الظاهري من البيانات المقارنة

مرونة النموذج الجديد الذي نقترحه هي أعظم نقاط قوته. يوفر FPK ونسخته المحدودة BBMV الفرصة لتقدير مجموعة متنوعة من المناظر الطبيعية للتطور الكلي من البيانات المقارنة للتطور. يمكن لـ FPK بالفعل نمذجة العمليات التطورية مثل الاختيار الاتجاهي أو تنويع الاختيار مما يؤدي إلى مناظر طبيعية تطورية كبيرة بعدة قمم ، وفي النهاية ارتفاعات متفاوتة. يلائم BBMV حدود تطور النمط الظاهري ، وعلى هذا النحو يمكن أن يصمم سيناريوهات مثل الاختيار الاتجاهي نحو قيمة واحدة متطرفة للسمات أو حتى الاختيار المضطرب. تقع كل هذه السيناريوهات في جوهر النظرية التطورية الحديثة (الكلية) ، ولكن لا يمكن استنتاجها بعد من البيانات المقارنة للتطور الوراثي (O’Meara ، 2012). يتشابه ملاءمة نموذج FPK مع البيانات التجريبية في بعض الجوانب مع تحليل الشريحة التكعيبية في دراسات الاختيار (Schluter ، 1988): فهو يسمح باستنتاج (وتصور) المشهد التطوري الكلي الذي اختبرته الأنواع في كليد. كما لوحظ بالفعل ، سيكون هذا النموذج مفيدًا بشكل خاص في المواقف التي يكون فيها المرء قويًا بداهة التوقعات بأن جميع أعضاء الكليد قد عانوا من نفس المشهد التطوري الكلي طوال تاريخهم.

نوع واحد من المناظر الطبيعية التي يمكن استنتاجها باستخدام FPK تستحق ذكرًا خاصًا هنا: المناظر الطبيعية ذات التطور الكبير التي توجد فيها قمم متعددة. سيكون هذا السيناريو مثيرًا للاهتمام بشكل خاص للمقارنة مع الموقف الذي تتوفر فيه هذه القمم المتعددة لسلالات مختلفة ، وهو ما يتم تنفيذه في نماذج OU مع خيارات متعددة. في هذه الفئة الأخيرة من النماذج ، تخضع كل سلالة بالفعل للجاذبية نحو قمة واحدة في كل مرة ، لكن السلالات قد تنتقل بين قمم مختلفة. يتم تحديد هذه التحولات بداهة (Butler and King، 2004 Beaulieu et al.، 2012) أو يُستدل مباشرة من أنماط تطور السمات (Ingram and Mahler، 2013 Uyeda and Harmon، 2014 Khabbazian et al.، 2016). في FPK ذات القمم المتعددة على العكس من ذلك ، يتأثر كل سلالة دائمًا بالقمم المختلفة في مشهدها التطوري الكلي ، وقد تكون التحولات بين القمم متكررة إذا كانت سمات معظم الأنواع في الكليد تقع في وادي المشهد التطوري الكبير. More theoretically, these alternatives would represent two very different evolutionary scenarios: OU models with several optima might be better at describing situations in which a lineage shifts to another adaptive zone ( Simpson, 1944 Landis and Schraiber, 2017), while FPK with multiple peaks might represent more genuine diversifying selection towards alternative phenotypic optima. In the later scenario, no change in the environment a lineage experiences or in other aspects of its phenotype ( Simpson, 1944) are required for one lineage to shift between two phenotypic optima, and one might expect much more frequent transitions between adaptive peaks within a clade. The implementation of the FPK that we have introduced opens the way to discriminate between these two alternatives using empirical data, although the level of statistical power required to do so remains an open question.

Statistical Behavior of the FPK Model

FPK is a model that generally retains very little phylogenetic signal (hereafter, PS): over all simulations in which stationarity had been reached, the median value of the |$lambda$| index of PS ( Pagel, 1997) was 1.6e |$-$| 109 (see Supplementary Appendix VI available on Dryad). This absence of PS stems from the strong deterministic component of the FPK model in all scenarios that we simulated, a result already known for the OU model ( Münkemüller et al., 2015), which is a special case of FPK. As a result, when stationarity is reached most of the information needed to infer the shape of the macroevolutionary landscape ultimately comes from the distribution of the trait for extant species. For example, evolutionary trends can be recovered in the absence of fossil data from a highly skewed trait distribution for contemporaneous species. In the same vein, the simultaneous presence of two peaks in the macroevolutionary landscape can be inferred from a bimodal trait distribution. However, FPK can also produce trait distributions with higher levels of PS. First, high PS can be obtained when the deterministic component of FPK is small or even absent: this is the case for the BM model, also a special case of FPK. Second, intermediate levels of PS can be obtained even under an FPK model with a strong deterministic component when stationarity is not reached. FPK should thus not be seen as a nonphylogenetic model: in the extreme case where stationarity has been reached PS will be null and the process will actually behave as if it were nonphylogenetic, but many intermediate cases exist in which the deterministic component of FPK influences trait evolution but PS is still significant (Supplementary Appendix VI available on Dryad). As already argued for the OU model ( Hansen et al., 2008), fitting the FPK model is actually the best way to figure out what level of PS is present in the data and what is the relative importance of deterministic forces compared to random diffusion.

The characteristic time of the FPK process, |$T_c$|⁠ , represents the typical time needed to reach stationarity and should always be compared to the total depth of the phylogenetic tree for the clade under study, |$T_< m>$| to get an idea of the level of PS in the data. Unsurprisingly, model performance will increase with |$T_< m>/T_c$| and in the extreme case where |$T_< m>$| |$ll$| |$T_c$|⁠ , traits will not have explored much of the macroevolutionary landscape. |$T_c$| bears much similarity with the phylogenetic half-life of the OU process, which describes the time necessary for the trait value to move halfway from its initial position to the optimum. Supplementary Appendix I available on Dryad shows that the characteristic time of an OU process is actually directly proportional to its phylogenetic half-life: |$T_c=1/alpha$| while the phylogenetic half-life is |$ln(2)/alpha$|⁠ . In agreement with our findings, previous studies have shown that accuracy in parameter estimation of the OU model increases with decreasing phylogenetic half-lives ( Ho and Ané, 2014b Uyeda and Harmon, 2014).

Using simulations, we have demonstrated that FPK can be distinguished from other classic models of trait evolution, and also that distinct shapes of the macroevolutionary landscape can be distinguished from each other based on their likelihoods. This means that alternative versions of the FPK model can be used for testing evolutionary hypotheses about trait evolution. Our simulations also show that the danger of overfitting is quite low with FPK since simpler models will often be preferred when stationarity has not been reached. Our focus on AIC to discriminate between alternative models was motivated by the fact that it is the most commonly used in the macroevolutionary community. However, AIC might be prone to overfitting in parameter rich macroevolutionary models and other measures that penalize more for extra parameters, like the Bayesian Information Criterion or its modified version ( Zhang and Siegmund, 2007), might be preferable ( Ho and Ané, 2014b). Another solution to diagnose overfitting would be to use parametric bootstrapping techniques ( Boettiger et al., 2012), which is readily implementable for FPK since we provide an R function to simulate the model.

Our results also show that estimation accuracy under FPK drastically differs between parameters. Estimation of the shape of the macroevolutionary landscape is generally accurate when |$T_< m>$| > |$T_c$| and increases with |$T_< m>$| / |$T_c$|⁠ . Estimation accuracy also increases with tree size: our results suggest that trees with 50 tips lead to reasonable estimation of the general shape of the macroevolutionary landscape (Supplementary Appendix IV available on Dryad), while trees with 100 tips should most often be large enough to obtain very reliable estimates ( Figs. 3 and 4). Importantly the three coefficients that determine the shape of the macroevolutionary landscape should not be analyzed separately since numerous different combinations of أ, ب، و ج can give similar shapes. Rather, we recommend to interpret the general shape of the macroevolutionary landscape by focusing on a few important features: (i) whether the macroevolutionary landscape is flat or not, (ii) whether it features a single trend towards one of the bounds of the trait interval, (iii) whether it contains one or several peaks, and if relevant (iv) where are these peaks located in the trait interval. In contrast, the evolutionary rate |$sigma^2$| has high estimation variance when |$T_< m>$| > |$T_c$|⁠ , and is accurate when |$T_< m>$| |$T_c$|⁠ . This same effect had already been observed for BBM ( Boucher and Démery, 2016) and probably reflects the fact that when the macroevolutionary landscape has been fully explored by the clade its shape and extent are easily estimated but the speed at which the landscape is travelled is not. Given this limitation, the estimate of |$sigma^2$| is difficult to interpret when fitting FPK to an empirical data set. Rather, the characteristic time of the process, |$T_c$|⁠ , should be the quantity that is interpreted in comparison with tree depth. Finally, we found that the estimation of the trait value at the root of the tree, |$x_0$|⁠ , is poor as soon as the macroevolutionary landscape has been moderately explored, a result that generalizes the one already obtained for BBM ( Boucher and Démery, 2016). This stems from the fact that FPK is a model that retains low PS since it includes strong deterministic forces and wipes out any hope of confidently inferring ancestral trait values in empirical data sets.

These differences in the quality of the estimation of the shape of the macroevolutionary landscape versus |$sigma^2$| generalize results that have been obtained for the OU model. Indeed, in this model |$sigma^2$| and especially |$alpha$|⁠ , the attraction strength, are difficult to estimate ( Butler and King, 2004 Ho and Ané, 2014b) while it seems that the stationary variance of the OU process, |$sigma^2/2alpha$|⁠ , and the trait optimum, |$mu$|⁠ , generally have higher estimation accuracy ( Ho and Ané, 2014b Münkemüller et al., 2015). This is in agreement with our results since |$mu$| and |$sigma^2/2alpha$| respectively determine the mean and variance of the stationary distribution of the OU process, what we have called the macroevolutionary landscape in this article.

Interpretation of Macroevolutionary Landscapes Inferred from FPK

We have introduced FPK as a method for the inference of macroevolutionary landscapes from phylogenetic comparative data. The adaptive landscape is a fruitful metaphor to understand phenotypic evolution on a variety of evolutionary scales ( Wright, 1932 Simpson, 1944 Arnold et al., 2001) but care must be taken when interpreting inferences made from phylogenetic comparative data in the light of adaptive landscape theory, which was mainly developed for population genetics ( Hansen and Martins, 1996 Uyeda and Harmon, 2014). Some of the models of trait evolution on phylogenies include deterministic forces that influence trait evolution in an attempt to mimic selection: the OU model includes a term that was designed to resemble stabilizing selection towards a given trait value ( Hansen, 1997), and FPK can imitate a large variety of selection shapes. However, all macroevolutionary models for trait evolution, including OU and FPK, are phenomenological by nature since they rely on probabilistic diffusion equations and model evolution over long time-scales (typically thousands to million years) that are not amenable to direct observation. In other words, these models recover patterns from the data, which researchers have to interpret in terms of evolutionary processes. One example of such a confusion between long-term patterns and short-term processes has been highlighted when interpreting the good fit of an OU model to empirical data sets: several studies have indeed shown that neutral evolution between bounds produces patterns closely resembling the ones obtained under an OU process ( Revell et al., 2008 Boucher et al., 2014). Development of the BBM model has now rendered possible to distinguish between these two scenarios ( Boucher and Démery, 2016), but many such cases in which two different microevolutionary processes produce the same macroevolutionary pattern remain.

Macroevolutionary landscapes estimated using FPK should thus be interpreted with extreme caution: they reflect the general shape of deterministic forces that have been acting on the evolution of a continuous trait in a clade, but are agnostic regarding the nature of these deterministic forces, that is they are not actual measurements of the relation between individuals’ traits and fitness. The most obvious limitation of FPK is that it makes the hypothesis that the macroevolutionary landscape is constant through time. This is likely to be wrong in a majority of cases since environmental change or interactions with other species will lead to changes in the intensity and shape of the selection gradient acting on one trait in a given clade ( Simpson, 1944 Hansen, 2012). Macroevolutionary landscapes inferred using FPK will thus necessarily reflect some kind of average macroevolutionary landscape experienced by the clade throughout its evolutionary history.

Even though it is difficult to connect microevolutionary processes to macroevolutionary patterns, there is one promising way in which FPK could be used to do so. Indeed, the Bayesian implementation of the model enables the use of informative priors based on quantitative genetic parameters. ( Uyeda and Harmon, 2014) have demonstrated how this could be done for the OU model: using the quantitative genetic model of ( Lande, 1976), they showed how measurements of heritability, phenotypic variance, and effective population size can inform priors on the parameters of the OU model. By connecting the parameters in Eq. 1 to quantitative genetic models, the same procedure could be carried out for FPK.

Finally, FPK need not be restricted to infer macroevolutionary landscapes. This model indeed has its roots in spatial diffusion theory and as such could be used in phylogeographic studies to model the dispersal of a set of individuals or populations for which the phylogeny is known (e.g., Grollemund et al., 2015). This field of research has indeed seen huge methodological advances in recent years ( Lemey et al., 2010 Bloomquist et al., 2012). In this context, FPK could be used to infer preferred directions of dispersal (i.e., directional trends) or even to infer particular regions that act as geographic attractors for the taxon under study (i.e., one or several peaks). Hard bounds on the distribution of organisms (e.g., oceans for terrestrial organisms) could even be taken into account explicitly using the BBMV model.

Limitations of the FPK Model

Our implementation of FPK does not come without limitations. The main technical limitation is that our implementation of the model is restricted to single traits. We are fully aware that extending it to multivariate data sets would be very convenient, since multiple traits are expected to often evolve in a correlated fashion ( Arnold, 1992). However, this is for the moment hampered by computational time. Indeed, the most time-consuming part in the calculation of the likelihood is to invert the instantaneous transition matrix, م. If we were to study two traits simultaneously, we would need to discretize the plane that they define into a regular grid of points, and computing time would not be multiplied by two but rather raised to the power two. The only possible solution that we can envision would be to use algorithmic tricks that avoid inverting the entire transition matrix, but rather a matrix describing transitions between a given point on the grid and its immediate neighbors, as recently proposed for inference of ancestral areas ( Landis et al., 2013). This would require much development and is out of the scope of this article.

The fact that our implementation of FPK can only accommodate a maximum of two peaks in the macroevolutionary landscape might also seem frustrating for some users. Extending the model so that three peaks or more can be simultaneously present is rather straightforward: the most obvious solution would be to use polynomial functions with more terms for |$V(x)$|⁠ . However, this would increase computational time, and more importantly would probably yield likelihood functions that are extremely difficult to optimize. This is why we have not implemented it yet. We however note that in our code to infer the FPK model, we have left open the possibility to specify a given shape for |$V(x)$|⁠ : users can thus experiment with more complex macroevolutionary landscapes if they feel this is relevant to their specific study system.

As already discussed above, the fact that the macroevolutionary landscape is constant across time and across different clades in the phylogeny is another limitation. Further developments of the FPK model could aim at extending it to cases in which the macroevolutionary landscape differs among clades or among specified time periods across the phylogeny.

The last limitation of FPK perhaps lies in its very formulation. FPK is indeed based on a constant-rate diffusion model and as such cannot model accelerating or decelerating trait evolution ( Harmon et al., 2010) or sudden jumps in the value of the trait, as would be expected under quantum evolution ( Simpson, 1944 Kirkpatrick, 1982) or punctuated equilibrium ( Gould and Eldredge, 1977).


Examples of Disruptive Selection

Finches on Santa Cruz Island

Darwin’s finches, or Galapagos finches, are a group of finches that inhabit the long chain of islands known as the Galapagos, famously visited by Charles Darwin. The birds have been rigorously studied, and various patterns of evolution have been seen in different populations on different islands. On Santa Cruz Island, disruptive selection was seen causing speciation in the population of finches that resides there. Due to forces of disruptive selection, intermediate beak sizes have been selected against for generations. The resulting population has almost no medium sized beaks. Beak size is important for more than just gathering food, and it has been found that beak size also changes the mating calls of the various finches. Researchers have found that the populations of birds, once a single population, have genetically diverged and are on the tipping point of being considered separate species.

Disruptive Selection in Plants

Famous biologist John Maynard Smith proposed disruptive selection as a method for plant speciation in the late 1960s. The idea is simple and have been applied to many examples since. Many plant traits, such as the color of pea pods, are controlled by individual genes. In a scenario where disruptive selection is affecting a population of plants, the most intermediate individuals are often the heterozygous individual, or those that contain different types of alleles for a gene. Homozygous individuals, on the other hand, have two of the same alleles for a trait. Whether the allele is functional or not, two of the same will produce a phenotype on the extreme end of the spectrum. These individuals will be protected during the disruptive selection, and reproduce more. Over time, the organisms may differ so much that they become reproductively isolated. Often the intermediates were serving the function of transferring genes between the two populations. Without them, in the presence of disruptive selection, speciation can occur.


The Quantitative Genetic Consequences of Pleiotropy under Stabilizing and Directional Selection

The independence of two phenotypic characters affected by both pleiotropic and nonpleiotropic mutations is investigated using a generalization of M. Slatkin's stepwise mutation model of 1987. The model is used to determine whether predictions of either the multivariate normal model introduced in 1980 by R. Lande or the house-of-cards model introduced in 1985 by M. Turelli can be regarded as typical of models that are intermediate between them. We found that, under stabilizing selection, the variance of one character at equilibrium may depend on the strength of stabilizing selection on the other character (as in the house-of-cards model) or not (as in the multivariate normal model) depending on the types of mutations that can occur. Similarly, under directional selection, the genetic covariance between two characters may increase substantially (as in the house-of-cards model) or not (as in the multivariate normal model) depending on the kinds of mutations that are assumed to occur. Hence, even for the simple model we consider, neither the house-of-cards nor the multivariate normal model can be used to make predictions, making it unlikely that either could be used to draw general conclusions about more complex and realistic models.


شكر وتقدير

We thank Amy Zanne, Guillermo Orti, Kelly Zamudio, Rayna Bell, and Josef Uyeda for insightful comments on earlier versions. Amy Zanne, Josef Uyeda, and Josh Storch assisted the phylogenetic comparative analyses. The editor-in-chief Chris Foote and two anonymous reviewers provided suggestions that strengthened the manuscript. We thank many talented photographers that contributed with pictures: Huia cavitympanum photo Alexander Haas Epipedobates tricolor Santiago R. Ron, FaunaWebEcuador, license CC (BY-NC 3.0) Dendropsophus elegans photo JFRT and Rana blairi photo Richard Sage. This study was funded in part by the Fundação Universidade Federal de Mato Grosso do Sul—UFMS/MEC—Brazil. This study was funded in part by the Coordenação de Aperfeiçoamento de Pessoal e de Nível Superior- Brasil (CAPES)—finance code 001.


شاهد الفيديو: المحاضرة السادسة - علم البيولوجيا الجزئي التطبيقي (أغسطس 2022).