從無序狀態到清晰，數據預處理和統計選擇影響著定量環境DNA（eDNA）分析

發布時期	發布來源	下載次數	文件類型	文件大小
2025-12-02	http://www.xcwlxx.com	155次	.pdf	3.7 MB
點擊下載

環境DNA（eDNA）分析具有極大潛力，可以提高物種檢測靈敏度并估算物種豐度。快速增長的用戶基礎、持續的方法開發和優化催生了多樣的eDNA捕捉和分析方法。盡管在標準化現場和實驗室方案方面已做出重大努力，但在理解數據預處理和統計選擇對最終結果的影響方面，尤其是在定量電子DNA分析方面，仍存在明顯空白。這些見解對于制定協調分析工作流程的最佳實踐指南至關重要。
為彌補這一空白，我們進行了廣泛的文獻綜述，重點關注定量物種特異性eDNA研究。我們評估了數據的多樣性，通過預處理和統計選擇來評估eDNA濃度與物種豐度或生物量之間的相關性，并在可用時收集了原始數據集。隨后，我們應用常用的數據分析策略，制定了提高定量eDNA分析可靠性和可重復性的通用建議。
我們的結果表明，現有文獻中統計方法并不總是被清晰描述，原始數據很少公開。此外，用于評估定量相關性的數據預處理策略和統計檢驗的選擇，會顯著影響檢測到正相關的可能性和效應量。
總體建議如下：（i）提高方法描述和數據可用性的透明度;（ii）使用能夠考慮數據特征的混合效應模型評估相關性;（iii）避免預處理定量eDNA數據，尤其是在與次優統計檢驗結合時。實施這些指南應提升定量eDNA數據的可訪問性和透明度，最終提升管理者和政策制定者的使用價值。
1 簡介
分析環境樣本中的DNA，通常稱為環境DNA或eDNA，已成為一種強大、經濟且非侵入性的物種檢測工具（Ficetola等，2008;Pilliod等，2013;Takahara等，2012）和社區監測（Bista等，2017;Creer等，2016;H?nfling 等，2016）。近年來，用戶數量的爆炸性增長、持續的方法開發以及eDNA分析的廣泛采用，催生了多樣化的eDNA捕捉和分析方法（Hakimzadeh 等，2023;Tsuji 等，2019）。這種快速擴展促使了制定明確指南和標準化協議的需求（Goldberg 等，2016;Loeza-Quintana 等，2020;Mathon 等，2021）。盡管對現場和實驗室方法給予了大量關注，但對數據預處理及可能的統計選擇對最終結論的影響并未給予同等程度的重視。

準確建模eDNA數據需要仔細考慮數據的固有特征。首先，環境DNA調查數據通常具有層級結構，通常從多個地點采集多個樣本，每個樣本有多次PCR重復（Buxton等，2021;Picetola等，2015;Furlan等，2016）。分析需要適應這種層級數據結構，因為來自同一地點的樣本和相同樣本的PCR復制不會彼此獨立。其次，調查以計數形式生成數據（即復制L）?1（C/L）或讀數）理論上只能取正整數值（例如，一升采樣水不能含有半份DNA副本）。分析此類數據的常見方法是假設計數為泊松分布。然而，計數數據的方差通常顯著大于平均值，導致過度離散（Bliss & Fisher，1953），分析中需要加以考慮。第三，零值很常見，可能代表假（例如與采樣或實驗室協議錯誤相關的）或真正的零（即某物種因不存在于采樣點而未被檢測到）。零計數頻率高于預期，會導致零通脹（Blasco-Moreno 等，2019;Heilbron， 1994），分析中也需要考慮這一點。因此，考慮數據結構、超離散和零通脹對于得出合理統計結論至關重要，但仍是一項具有挑戰性的任務（Arnqvist， 2020;Blasco-Moreno 等，2019;艾夫斯，2015;O'Hara 和 Kotze，2010;St-Pierre 等，2018;Warton 等，2016）。

環境DNA調查廣泛用于物種檢測，但也可用于估計物種豐度或生物量，因為在理想條件下，通過定量物種特異性eDNA調查（即使用定量實時PCR（qPCR）或數字PCR（dPCR））獲得的DNA拷貝數估計，將與物種豐度（A）或生物量（B）呈正相關。被廣泛采用了多種數據預處理策略和統計方法來估計這些關系，這也引發了不同方法是否可能導致不同結果和結論的問題。在某些情況下，數據的層級結構（例如采樣多個站點、中宇宙或實驗罐;每個站點采集多個樣本;執行多次PCR重復）會被納入統計模型規范中（Eichmiller等，2016;Hinlo等，2018;Lacoursière-Roussel 等，2016）。在其他情況下，層級結構被忽略，或通過樣本和/或PCR重復的平均來簡化數據（Doi 等，2017;Kutti 等，2020;Skinner等，2020年;Thalinger 等，2019）。許多研究通過對數轉化eDNA濃度數據處理了過度分散計數的問題，這通常能穩定方差（Doi等，2015;Dougherty等，2016;Thomsen 等，2012）。然而，數據轉換對統計分析的影響仍存在爭議（Ives， 2015;O'Hara 和 Kotze，2010）。為了解決eDNA數據中零膨脹的問題，一種方法是建立eDNA定量的下限。這可能包括過濾掉檢測極限（LOD）或量化極限以下的零值或值（LOQ;Dunn 等，2017;Takahara 等，2012;Takahashi 等，2020），盡管該方法忽略了真正的零點（Blasco-Moreno 等，2019;Klymus 等，2020）。另一種常見的減少零通脹方法是在分析前對復制次數進行平均值（即取每個樣本或站點的平均值）（Dougherty等，2016;Spear 等，2021）。然而，平均法消除了數據生成過程固有的變異性。此外，還應用了多種統計檢驗來評估電子DNA濃度與豐度或生物量（A/B）之間的相關性，包括Pearson或Spearman相關（Jo，2023;Plough 等，2018），線性或廣義線性模型（Eichmiller 等，2016;Pilliod等，2013）和貝葉斯模型（Erickson等，2016）。這些不同的統計選擇可能強烈影響最終結論（Arnqvist，2020; Gould 等，2025）。

據我們所知，有兩項研究評估了不同數據預處理策略（Jo， 2023）或統計檢驗（Chambert 等， 2018）對定量物種特異性eDNA數據的影響。然而，對最常見的數據預處理策略與統計檢測的綜合影響的全面評估尚不足。為彌合這一空白，我們系統地檢索了定量物種特異性eDNA研究，這些研究評估了eDNA濃度與物種A/B之間的相關性。我們評估了現有文獻中多樣化的數據預處理策略和統計選擇，并檢查了原始數據的可用性（即所有復制層次均可獲得測量數據）。隨后，我們確定了常見的預處理策略和統計檢驗，并應用它們重新分析現有的實證數據集。具體來說，我們評估了（i）定量eDNA數據分析過程中常見的分析選擇及其方法的變異程度，（ii）這些分析選擇如何影響檢測eDNA豐度相關性及其效應量的能力。最后，我們利用結果確定了關鍵考慮因素和最佳實踐指南，以提升定量eDNA分析的可靠性和可重復性。

上一篇：Loligo論文：急性低溫脅迫對克氏原螯蝦呼吸代謝、抗氧化劑和代謝組學的影響
下一篇：樣本間的變異性影響eDNA定量，并對估計生物多樣性有重要意義

久久香蕉一区I国产亚洲精品久久久久久网站I色开心I国产va在线观看免费I美女视频黄网站I久久久首页I男女激情片在线观看I成人久久精品视频

下載分類

聯系我們

從無序狀態到清晰，數據預處理和統計選擇影響著定量環境DNA（eDNA）分析

從無序狀態到清晰，數據預處理和統計選擇影響著定量環境DNA（eDNA）分析

關于我們

新聞中心

產品中心

下載中心