False Discovery Rate (FDR) in Proteomics Explained

False Discovery Rate (FDR) in Proteomics Explained

Proteomics 데이터 분석에서는 항상 false identification 가능성이 존재합니다.
즉 일부 peptide match는 우연히 MS/MS spectrum과 일치할 수 있습니다.
이를 평가하기 위해 False Discovery Rate (FDR) 개념이 사용됩니다.

Target-Decoy Strategy

Proteomics에서는 보통 target-decoy approach를 사용합니다.

두 개의 database를 사용합니다.

target database
decoy database

decoy database는 보통 단백질 서열을

  • reverse

  • shuffle

하여 생성합니다.

FDR 계산

FDR은 다음과 같이 계산됩니다.

FDR = Decoy hits / Total hits

예를 들어

target hits = 990
decoy hits = 10

이면

FDR = 1%

Proteomics 표준 기준

Proteomics에서는 보통 다음 기준을 사용합니다.

Peptide FDR < 1%
Protein FDR < 1%

이 기준을 통해 peptide identification의 신뢰도를 유지합니다.

저발현 조각 이온의 시각화를 위해 로그 스케일로 변환된 MS/MS 스펙트럼 매칭 결과 화면
저발현 조각 이온의 시각화를 위해 로그 스케일로 변환된 MS/MS 스펙트럼 매칭 결과 화면


관련들

다음 이전