Charge Deconvolution in Mass Spectrometry

LC-MS에서 다중 전하 스펙트럼을 실제 분자량으로 변환하는 방법 (차지 디콘볼루션)

LC-MS 분석, 특히 ESI(Electrospray Ionization) 기반 proteomics 데이터에서는 동일한 분자가 여러 개의 charge state(전하 상태)를 가진 피크로 관찰됩니다.

예를 들어 하나의 단백질 또는 펩타이드가 아래와 같은 스펙트럼을 만들 수 있습니다.

m/z
800
900
1000
1100
1200

이 피크들은 서로 다른 분자가 아니라 동일한 분자가 서로 다른 charge state로 검출된 결과입니다.

이러한 multiply charged spectrum을 실제 neutral molecular mass로 변환하는 과정을:

Charge Deconvolution

이라고 합니다.


Charge Deconvolution이란 무엇인가?

Charge Deconvolution은 LC-MS에서 관측된 여러 charge state 피크를 하나의 실제 분자량(neutral mass)으로 변환하는 과정입니다.

특히 ESI 기반 분석에서는 하나의 분자가 여러 개의 proton(H⁺)을 획득할 수 있기 때문에 동일한 분자가 서로 다른 m/z 값으로 반복적으로 관찰됩니다.

따라서 실제 분자량을 얻기 위해서는 charge state를 계산한 뒤 neutral mass로 역산해야 합니다.


Multiple Charge State가 발생하는 이유

ESI(Electrospray Ionization)에서는 분자가 용액 상태에서 기체상 이온으로 전이되면서 여러 개의 proton을 획득할 수 있습니다.

예를 들어 하나의 펩타이드가 다음과 같이 이온화될 수 있습니다.

  • [M+H]⁺
  • [M+2H]²⁺
  • [M+3H]³⁺
  • [M+4H]⁴⁺

이때 질량분석기가 측정하는 값은 실제 질량이 아니라:

m/z (mass-to-charge ratio)

입니다.

즉 측정값은 다음 공식으로 표현됩니다.

m/z=M+zHzm/z = \frac{M + zH}{z}

여기서:

  • M = 실제 분자량
  • z = charge state
  • H = proton mass (1.007276 Da)

입니다.


ESI(Electrospray Ionization)에서 다중 전하가 생성되는 원리

MALDI와 달리 ESI는 용액 상태에서 이온화가 발생합니다.

이 과정에서 단백질 또는 펩타이드 표면의 여러 protonation site가 동시에 proton을 받을 수 있습니다.

특히 다음과 같은 분자에서 multiple charge가 잘 나타납니다.

  • peptide
  • protein
  • antibody
  • polymer
  • protein complex

일반적으로:

  • 분자가 클수록 charge 증가
  • unfolded protein일수록 높은 charge
  • native protein은 낮은 charge

를 보이는 경우가 많습니다.


Multiply Charged Spectrum 예제

예를 들어 실제 질량이:

M=2000 DaM = 2000\ \mathrm{Da}

인 펩타이드가 있다고 가정해 보겠습니다.

이 분자는 다음과 같이 관찰될 수 있습니다.

Chargem/z
1+2001
2+1001
3+667
4+501

즉 하나의 분자가 여러 개의 m/z peak로 나타나는 것입니다.

LC-MS 다중 전하 스펙트럼은 다중 전하 m/z 피크에서 단일 중성 분자량 피크로의 전하 분해를 보여줍니다.
LC-MS에서 전하 분해는 동위원소 간격 및 전하 상태 정보를 사용하여 여러 개의 하전 이온 스펙트럼을 단일 중성 분자 질량 스펙트럼으로 변환합니다.



Charge State와 m/z의 관계

중요한 특징은:

charge가 증가할수록 m/z는 감소

한다는 점입니다.

즉:

  • 낮은 m/z → 높은 charge
  • 높은 m/z → 낮은 charge

를 의미합니다.

따라서 protein ESI spectrum에서는:

왼쪽(low m/z)이 highly charged species

인 경우가 많습니다.


Charge State(z)를 결정하는 방법

Charge deconvolution의 첫 단계는:

charge assignment

입니다.

고해상도 질량분석기에서는 isotope spacing을 이용해 charge를 계산할 수 있습니다.


Isotope Spacing으로 Charge를 계산하는 방법

동위원소 간격은 다음 공식을 따릅니다.

Δ(m/z)=1z\Delta(m/z) = \frac{1}{z}

예:

ChargeIsotope spacing
1+1.000
2+0.500
3+0.333
4+0.250
5+0.200

즉 isotope peak 간격을 측정하면 charge를 계산할 수 있습니다.


Charge State 계산 예제

예를 들어 isotope spacing이:

0.25 m/z0.25\ m/z

라면:

z=10.25=4z = \frac{1}{0.25} = 4

즉 해당 peak는:

4+ charge state

입니다.


Neutral Mass(실제 분자량)를 계산하는 방법

charge가 결정되면 실제 분자량을 계산할 수 있습니다.

공식:

M=z(m/z)zHM = z(m/z) - zH

여기서:

  • H = 1.007276 Da

입니다.


Neutral Mass 계산 예제

예:

  • m/z = 1001
  • z = 2

계산:

M=2×10012×1.007276M = 2 \times 1001 - 2 \times 1.007276

결과:

M1999.985 DaM \approx 1999.985\ \mathrm{Da}

즉 실제 neutral mass는 약 2000 Da입니다.


Charge Envelope란 무엇인가?

ESI spectrum에서는 여러 charge state가 envelope 형태로 나타납니다.

예:

m/z
1200
1100
1000
900
800

이러한 패턴을:

Charge State Envelope

라고 합니다.


Charge Envelope의 특징

일반적인 특징:

  • 중간 charge state intensity가 가장 큼
  • 낮은 m/z → 높은 charge
  • 높은 m/z → 낮은 charge
  • protein folding 상태에 따라 envelope shape 변화

특히 native MS에서는:

  • 좁은 envelope
  • 낮은 charge state

가 나타나는 경우가 많습니다.

반면 denatured protein은:

  • 넓은 envelope
  • 높은 charge state

를 보이는 경우가 많습니다.


Deconvolution Algorithm이란 무엇인가?

실제 LC-MS software에서는 자동 deconvolution algorithm을 사용합니다.

대표적인 알고리즘:

  • Maximum Entropy (MaxEnt)
  • THRASH
  • Xtract
  • ReSpect
  • UniDec

이 알고리즘들은 일반적으로 다음 workflow를 수행합니다.

charge detection

isotope pattern analysis

neutral mass reconstruction

deconvoluted spectrum generation

MaxEnt, Xtract, THRASH 알고리즘 비교

MaxEnt (Maximum Entropy)

MaxEnt는 가장 널리 사용되는 deconvolution 방식 중 하나입니다.

특징:

  • noisy spectrum에 강함
  • smooth spectrum 생성
  • intact protein 분석에 자주 사용

입니다.


Xtract / THRASH

Thermo Orbitrap 계열에서는:

  • Xtract
  • THRASH

알고리즘이 많이 사용됩니다.

특징:

  • high-resolution isotope fitting
  • monoisotopic mass determination
  • proteomics workflow 최적화

입니다.


Deconvolution 결과 예제

원래 스펙트럼:

m/z
800
900
1000
1100
1200

Deconvolution 후:

Mass
2000

즉 여러 charge peak가 하나의 neutral mass peak로 통합됩니다.


Monoisotopic Mass와 Average Mass의 차이

Deconvolution 시 중요한 개념 중 하나는:

  • Monoisotopic mass
  • Average mass

의 차이입니다.


Monoisotopic Mass란?

가장 가벼운 isotope 조합 기준 질량입니다.

주로:

  • peptide
  • small protein
  • proteomics database search

에서 사용됩니다.


Average Mass란?

자연 isotope abundance 평균값 기반 질량입니다.

주로:

  • intact protein
  • polymer
  • low-resolution spectrum

에서 사용됩니다.


Proteomics에서 Charge Deconvolution이 중요한 이유

Proteomics에서는 deconvolution이 매우 중요합니다.

이유:

  • peptide
  • intact protein
  • protein complex

모두 multiple charge state로 관찰되기 때문입니다.

특히 다음 분석에서 핵심적으로 사용됩니다.

  • top-down proteomics
  • native MS
  • intact protein analysis
  • antibody characterization

DIA Proteomics에서 Charge Deconvolution이 중요한 이유

최근 DIA(Data Independent Acquisition) 기반 high-resolution proteomics에서도 charge deconvolution은 중요합니다.

특히:

  • precursor assignment
  • isotope grouping
  • fragment interpretation

과정에서 정확한 charge determination이 매우 중요합니다.


Small Molecule LC-MS에서 Charge Deconvolution이 적은 이유

소분자 LC-MS에서는 대부분:

z=1z = 1

입니다.

따라서 일반적인 metabolomics에서는 deconvolution이 크게 필요하지 않습니다.

하지만 다음 경우에는 중요할 수 있습니다.

  • oligomers
  • polymers
  • lipid aggregates
  • metal adduct clusters
  • large metabolites

Adduct와 Charge State의 차이

실제 데이터 해석에서 자주 혼동되는 부분이:

Adduct와 Charge State의 차이

입니다.

예:

  • [M+H]⁺
  • [M+Na]⁺
  • [M+K]⁺

는 서로 다른 adduct입니다.

반면:

  • [M+H]⁺
  • [M+2H]²⁺
  • [M+3H]³⁺

는 동일 분자의 charge state입니다.


Charge Deconvolution에서 자주 발생하는 문제점

Charge deconvolution 과정에서는 여러 문제가 발생할 수 있습니다.


Incorrect Charge Assignment 문제

charge를 잘못 계산하면:

neutral mass가 완전히 틀어짐

니다.


Overlapping Isotope Cluster 문제

서로 다른 분자의 isotope cluster가 겹치면:

  • charge assignment 오류
  • false deconvolution

이 발생할 수 있습니다.


Low Resolution Data 문제

resolution이 낮으면:

  • isotope spacing 측정 불가
  • charge 계산 실패

가 발생할 수 있습니다.

따라서:

high-resolution MS가 deconvolution 정확도에 매우 중요

합니다.


실무 LC-MS 데이터 해석 Workflow

실제 LC-MS 데이터 해석에서는 다음 workflow가 유용합니다.

1 isotope spacing 확인
2 charge state 계산
3 neutral mass 계산
4 charge envelope 확인
5 adduct 여부 확인
6 MS/MS 데이터 검증

이 workflow는:

  • proteomics
  • metabolomics
  • intact protein analysis

모두에서 중요합니다.


Charge Deconvolution이 중요한 이유

Charge deconvolution은 단순 계산이 아니라:

실제 molecular identity reconstruction 과정

입니다.

즉:

  • observed spectrum
  • true molecular mass

로 변환하는 핵심 단계입니다.


정리 : Charge Deconvolution은 왜 중요한가?

Charge deconvolution은 LC-MS 데이터를 실제 분자량으로 변환하는 핵심 과정입니다.

특히 ESI 기반 분석에서는 하나의 분자가 여러 charge state로 관찰되기 때문에 deconvolution이 필수적입니다.

핵심 공식:

m/z=M+zHzm/z = \frac{M + zH}{z}

M=z(m/z)zHM = z(m/z) - zH

이 원리를 이해하면:

  • peptide spectrum
  • intact protein data
  • top-down proteomics
  • native MS

데이터를 훨씬 정확하게 해석할 수 있습니다.


관련글 :


다음 이전