False Discovery Rate (FDR) in Proteomics Explained

Proteomics 데이터 분석에서는 항상 false identification 가능성이 존재합니다.
즉 일부 peptide match는 우연히 MS/MS spectrum과 일치할 수 있습니다.
이를 평가하기 위해 False Discovery Rate (FDR) 개념이 사용됩니다.

Target-Decoy Strategy

Proteomics에서는 보통 target-decoy approach를 사용합니다.

두 개의 database를 사용합니다.


target database
decoy database

decoy database는 보통 단백질 서열을

reverse
shuffle

하여 생성합니다.

FDR 계산

FDR은 다음과 같이 계산됩니다.


FDR = Decoy hits / Total hits

예를 들어


target hits = 990
decoy hits = 10

이면


FDR = 1%

Proteomics 표준 기준

Proteomics에서는 보통 다음 기준을 사용합니다.


Peptide FDR < 1%
Protein FDR < 1%

이 기준을 통해 peptide identification의 신뢰도를 유지합니다.

저발현 조각 이온의 시각화를 위해 로그 스케일로 변환된 MS/MS 스펙트럼 매칭 결과 화면

이 글은 LC-MS/MS 기반 질량분석 및 proteomics 분석 전체 흐름 가이드의 일부입니다.
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기

False Discovery Rate (FDR) in Proteomics Explained