What Makes a Good MS/MS Spectrum for Peptide Identification

좋은 MS/MS 스펙트럼이란? Peptide Identification 성공의 핵심 조건

Proteomics에서 LC-MS/MS 분석을 수행하면 수천에서 수만 개의 MS/MS 스펙트럼이 생성됩니다. 그러나 이 중 모든 스펙트럼이 펩타이드 동정에 유용한 것은 아닙니다. 실제 분석에서는 총 20,000개의 MS/MS 스펙트럼 중 약 5,000~10,000개 정도만이 펩타이드로 동정되는 경우가 많으며, 이는 약 20–50% 수준의 동정률에 해당합니다.

좋은 MS/MS spectrum의 품질은 peptide identification 성공률을 결정하는 가장 중요한 요소입니다. 따라서 데이터 해석의 정확도와 효율을 높이기 위해서는 “좋은 스펙트럼의 조건”을 명확히 이해하는 것이 필수적입니다.


b-ion과 y-ion fragment ladder 및 signal-to-noise ratio가 표시된 MS/MS 스펙트럼 예시
Good MS/MS spectrum example with clear fragment ion ladder and high signal-to-noise ratio



1. 명확한 Fragment Ion Ladder (연속적인 파편 이온 시리즈)

펩타이드 MS/MS 스펙트럼에서 가장 중요한 특징은 연속적인 fragment ion ladder입니다. CID 또는 HCD fragmentation에서 펩타이드 백본이 절단되면 b-ion과 y-ion series가 형성됩니다.

예를 들어, y-ion series가 y1부터 y5까지 연속적으로 관찰된다면 해당 펩타이드 서열을 높은 신뢰도로 재구성할 수 있으며, database search 알고리즘에서도 높은 score를 얻을 수 있습니다.


2. 높은 Signal-to-Noise Ratio (신호 대 잡음비)

좋은 스펙트럼은 fragment ion 신호가 배경 잡음보다 훨씬 강해야 합니다.

  • 좋은 스펙트럼: fragment peaks >> noise
  • 나쁜 스펙트럼: fragment peaks ≈ noise

잡음이 많으면 fragment ion을 정확히 구별하기 어려워지고, 결과적으로 identification score가 크게 감소합니다.


3. 충분한 Fragment Ion 수

펩타이드 동정을 위해서는 충분한 수의 fragment ion이 필요합니다. 일반적으로 6~10개 이상의 informative fragment ion이 존재해야 안정적인 서열 해석이 가능합니다.

특히 b-ion과 y-ion series가 함께 관찰되는 것이 중요하며, fragment ion 수가 부족하면 peptide sequence reconstruction이 어려워집니다.


4. 올바른 Charge State (전하 상태)

전구체 이온의 charge state는 MS/MS 해석에서 매우 중요한 요소입니다.

예:

  • [M+2H]²⁺
  • [M+3H]³⁺

특히 proteomics에서는 2+ 또는 3+ precursor ion이 가장 효율적인 fragmentation을 보입니다.

MGF 파일에서 charge 정보가 없을 경우 fragment ion을 단일 전하(1+)로 해석하게 되며, 이는 잘못된 질량 계산과 database search 실패로 이어질 수 있습니다.


5. Fragment Mass Accuracy (질량 정확도)

고분해능 질량분석기(Orbitrap, Q-TOF 등)를 사용하는 경우 fragment ion의 질량 정확도는 매우 중요합니다.

일반적으로:

  • 5–10 ppm 이하의 mass error를 유지해야 정확한 peptide matching이 가능합니다.

질량 오차가 커질 경우:

  • matching 정확도 감소
  • false identification 증가

와 같은 문제가 발생합니다.


6. Precursor Intensity (전구체 이온 세기)

좋은 MS/MS 스펙트럼은 충분히 강한 precursor ion에서 생성됩니다.

전구체 이온의 세기가 약할 경우:

  • fragmentation 효율 감소
  • fragment ion intensity 감소
  • 스펙트럼 품질 저하

결과적으로 peptide identification score가 낮아지게 됩니다.


7. Contamination이 없는 Spectrum (오염 없는 스펙트럼)

LC-MS/MS 분석에서는 다양한 오염 물질이 스펙트럼 품질에 영향을 미칠 수 있습니다.

대표적인 예:

  • PEG contamination → 44 Da 반복 패턴
  • Plasticizers (phthalates)
  • solvent clusters

이러한 contamination이 포함된 스펙트럼은 peptide identification을 방해하며, 반드시 QC 과정에서 제거해야 합니다.


좋은 MS/MS Spectrum 예시

  • 명확한 y-ion ladder
  • 높은 signal intensity
  • 낮은 noise
  • 연속적인 fragment pattern
Intensity
|
|          y6
|        y5
|      y4
|    y3
|  b2
| y2
| b1
|
+------------------------
        m/z

나쁜 MS/MS Spectrum 예시

  • fragment ladder 없음
  • 높은 noise
  • fragment ion 부족
Intensity
|
|   random peaks
|      noise
| random peaks
|
+------------------------
      m/z

Spectrum Quality 평가의 중요성

Proteomics 데이터에서 모든 MS/MS 스펙트럼이 유용한 것은 아니므로, database search 이전에 반드시 다음 요소를 평가해야 합니다.

  • precursor ion quality
  • fragment ion pattern
  • signal-to-noise ratio
  • charge state consistency
  • contamination 여부

이러한 QC 과정을 통해 고품질 스펙트럼만 선별하면 peptide identification rate와 데이터 해석 효율을 크게 향상시킬 수 있습니다.


요약

좋은 MS/MS 스펙트럼의 조건은 다음과 같습니다:

  • 명확한 fragment ion ladder
  • 높은 signal-to-noise ratio
  • 충분한 fragment ion 수
  • 정확한 mass accuracy
  • 올바른 charge state
  • contamination 없는 clean spectrum

이 원칙을 이해하고 적용하는 것이 proteomics 데이터 해석의 핵심입니다.

관련 글 더 보기

LCMS Application , 질량분석 & Proteomics 가이드 (전체 목차)



다음 이전