LC-MS에서 다중 전하 스펙트럼을 실제 분자량으로 변환하는 방법 (차지 디콘볼루션)
LC-MS 분석, 특히 ESI(Electrospray Ionization) 기반 proteomics 데이터에서는 동일한 분자가 여러 개의 charge state(전하 상태)를 가진 피크로 관찰됩니다.
예를 들어 하나의 단백질 또는 펩타이드가 아래와 같은 스펙트럼을 만들 수 있습니다.
| m/z |
|---|
| 800 |
| 900 |
| 1000 |
| 1100 |
| 1200 |
이 피크들은 서로 다른 분자가 아니라 동일한 분자가 서로 다른 charge state로 검출된 결과입니다.
이러한 multiply charged spectrum을 실제 neutral molecular mass로 변환하는 과정을:
Charge Deconvolution
이라고 합니다.
Charge Deconvolution이란 무엇인가?
Charge Deconvolution은 LC-MS에서 관측된 여러 charge state 피크를 하나의 실제 분자량(neutral mass)으로 변환하는 과정입니다.
특히 ESI 기반 분석에서는 하나의 분자가 여러 개의 proton(H⁺)을 획득할 수 있기 때문에 동일한 분자가 서로 다른 m/z 값으로 반복적으로 관찰됩니다.
따라서 실제 분자량을 얻기 위해서는 charge state를 계산한 뒤 neutral mass로 역산해야 합니다.
Multiple Charge State가 발생하는 이유
ESI(Electrospray Ionization)에서는 분자가 용액 상태에서 기체상 이온으로 전이되면서 여러 개의 proton을 획득할 수 있습니다.
예를 들어 하나의 펩타이드가 다음과 같이 이온화될 수 있습니다.
- [M+H]⁺
- [M+2H]²⁺
- [M+3H]³⁺
- [M+4H]⁴⁺
이때 질량분석기가 측정하는 값은 실제 질량이 아니라:
m/z (mass-to-charge ratio)
입니다.
즉 측정값은 다음 공식으로 표현됩니다.
여기서:
- M = 실제 분자량
- z = charge state
- H = proton mass (1.007276 Da)
입니다.
ESI(Electrospray Ionization)에서 다중 전하가 생성되는 원리
MALDI와 달리 ESI는 용액 상태에서 이온화가 발생합니다.
이 과정에서 단백질 또는 펩타이드 표면의 여러 protonation site가 동시에 proton을 받을 수 있습니다.
특히 다음과 같은 분자에서 multiple charge가 잘 나타납니다.
- peptide
- protein
- antibody
- polymer
- protein complex
일반적으로:
- 분자가 클수록 charge 증가
- unfolded protein일수록 높은 charge
- native protein은 낮은 charge
를 보이는 경우가 많습니다.
Multiply Charged Spectrum 예제
예를 들어 실제 질량이:
인 펩타이드가 있다고 가정해 보겠습니다.
이 분자는 다음과 같이 관찰될 수 있습니다.
| Charge | m/z |
|---|---|
| 1+ | 2001 |
| 2+ | 1001 |
| 3+ | 667 |
| 4+ | 501 |
즉 하나의 분자가 여러 개의 m/z peak로 나타나는 것입니다.
![]() |
| LC-MS에서 전하 분해는 동위원소 간격 및 전하 상태 정보를 사용하여 여러 개의 하전 이온 스펙트럼을 단일 중성 분자 질량 스펙트럼으로 변환합니다. |
Charge State와 m/z의 관계
중요한 특징은:
charge가 증가할수록 m/z는 감소
한다는 점입니다.
즉:
- 낮은 m/z → 높은 charge
- 높은 m/z → 낮은 charge
를 의미합니다.
따라서 protein ESI spectrum에서는:
왼쪽(low m/z)이 highly charged species
인 경우가 많습니다.
Charge State(z)를 결정하는 방법
Charge deconvolution의 첫 단계는:
charge assignment
입니다.
고해상도 질량분석기에서는 isotope spacing을 이용해 charge를 계산할 수 있습니다.
Isotope Spacing으로 Charge를 계산하는 방법
동위원소 간격은 다음 공식을 따릅니다.
예:
| Charge | Isotope spacing |
|---|---|
| 1+ | 1.000 |
| 2+ | 0.500 |
| 3+ | 0.333 |
| 4+ | 0.250 |
| 5+ | 0.200 |
즉 isotope peak 간격을 측정하면 charge를 계산할 수 있습니다.
Charge State 계산 예제
예를 들어 isotope spacing이:
라면:
즉 해당 peak는:
4+ charge state
입니다.
Neutral Mass(실제 분자량)를 계산하는 방법
charge가 결정되면 실제 분자량을 계산할 수 있습니다.
공식:
여기서:
- H = 1.007276 Da
입니다.
Neutral Mass 계산 예제
예:
- m/z = 1001
- z = 2
계산:
결과:
즉 실제 neutral mass는 약 2000 Da입니다.
Charge Envelope란 무엇인가?
ESI spectrum에서는 여러 charge state가 envelope 형태로 나타납니다.
예:
| m/z |
|---|
| 1200 |
| 1100 |
| 1000 |
| 900 |
| 800 |
이러한 패턴을:
Charge State Envelope
라고 합니다.
Charge Envelope의 특징
일반적인 특징:
- 중간 charge state intensity가 가장 큼
- 낮은 m/z → 높은 charge
- 높은 m/z → 낮은 charge
- protein folding 상태에 따라 envelope shape 변화
특히 native MS에서는:
- 좁은 envelope
- 낮은 charge state
가 나타나는 경우가 많습니다.
반면 denatured protein은:
- 넓은 envelope
- 높은 charge state
를 보이는 경우가 많습니다.
Deconvolution Algorithm이란 무엇인가?
실제 LC-MS software에서는 자동 deconvolution algorithm을 사용합니다.
대표적인 알고리즘:
- Maximum Entropy (MaxEnt)
- THRASH
- Xtract
- ReSpect
- UniDec
이 알고리즘들은 일반적으로 다음 workflow를 수행합니다.
charge detection
↓
isotope pattern analysis
↓
neutral mass reconstruction
↓
deconvoluted spectrum generation
MaxEnt, Xtract, THRASH 알고리즘 비교
MaxEnt (Maximum Entropy)
MaxEnt는 가장 널리 사용되는 deconvolution 방식 중 하나입니다.
특징:
- noisy spectrum에 강함
- smooth spectrum 생성
- intact protein 분석에 자주 사용
입니다.
Xtract / THRASH
Thermo Orbitrap 계열에서는:
- Xtract
- THRASH
알고리즘이 많이 사용됩니다.
특징:
- high-resolution isotope fitting
- monoisotopic mass determination
- proteomics workflow 최적화
입니다.
Deconvolution 결과 예제
원래 스펙트럼:
| m/z |
|---|
| 800 |
| 900 |
| 1000 |
| 1100 |
| 1200 |
Deconvolution 후:
| Mass |
|---|
| 2000 |
즉 여러 charge peak가 하나의 neutral mass peak로 통합됩니다.
Monoisotopic Mass와 Average Mass의 차이
Deconvolution 시 중요한 개념 중 하나는:
- Monoisotopic mass
- Average mass
의 차이입니다.
Monoisotopic Mass란?
가장 가벼운 isotope 조합 기준 질량입니다.
주로:
- peptide
- small protein
- proteomics database search
에서 사용됩니다.
Average Mass란?
자연 isotope abundance 평균값 기반 질량입니다.
주로:
- intact protein
- polymer
- low-resolution spectrum
에서 사용됩니다.
Proteomics에서 Charge Deconvolution이 중요한 이유
Proteomics에서는 deconvolution이 매우 중요합니다.
이유:
- peptide
- intact protein
- protein complex
모두 multiple charge state로 관찰되기 때문입니다.
특히 다음 분석에서 핵심적으로 사용됩니다.
- top-down proteomics
- native MS
- intact protein analysis
- antibody characterization
DIA Proteomics에서 Charge Deconvolution이 중요한 이유
최근 DIA(Data Independent Acquisition) 기반 high-resolution proteomics에서도 charge deconvolution은 중요합니다.
특히:
- precursor assignment
- isotope grouping
- fragment interpretation
과정에서 정확한 charge determination이 매우 중요합니다.
Small Molecule LC-MS에서 Charge Deconvolution이 적은 이유
소분자 LC-MS에서는 대부분:
입니다.
따라서 일반적인 metabolomics에서는 deconvolution이 크게 필요하지 않습니다.
하지만 다음 경우에는 중요할 수 있습니다.
- oligomers
- polymers
- lipid aggregates
- metal adduct clusters
- large metabolites
Adduct와 Charge State의 차이
실제 데이터 해석에서 자주 혼동되는 부분이:
Adduct와 Charge State의 차이
입니다.
예:
- [M+H]⁺
- [M+Na]⁺
- [M+K]⁺
는 서로 다른 adduct입니다.
반면:
- [M+H]⁺
- [M+2H]²⁺
- [M+3H]³⁺
는 동일 분자의 charge state입니다.
Charge Deconvolution에서 자주 발생하는 문제점
Charge deconvolution 과정에서는 여러 문제가 발생할 수 있습니다.
Incorrect Charge Assignment 문제
charge를 잘못 계산하면:
neutral mass가 완전히 틀어짐
니다.
Overlapping Isotope Cluster 문제
서로 다른 분자의 isotope cluster가 겹치면:
- charge assignment 오류
- false deconvolution
이 발생할 수 있습니다.
Low Resolution Data 문제
resolution이 낮으면:
- isotope spacing 측정 불가
- charge 계산 실패
가 발생할 수 있습니다.
따라서:
high-resolution MS가 deconvolution 정확도에 매우 중요
합니다.
실무 LC-MS 데이터 해석 Workflow
실제 LC-MS 데이터 해석에서는 다음 workflow가 유용합니다.
1 isotope spacing 확인
2 charge state 계산
3 neutral mass 계산
4 charge envelope 확인
5 adduct 여부 확인
6 MS/MS 데이터 검증
이 workflow는:
- proteomics
- metabolomics
- intact protein analysis
모두에서 중요합니다.
Charge Deconvolution이 중요한 이유
Charge deconvolution은 단순 계산이 아니라:
실제 molecular identity reconstruction 과정
입니다.
즉:
- observed spectrum
→ - true molecular mass
로 변환하는 핵심 단계입니다.
정리 : Charge Deconvolution은 왜 중요한가?
Charge deconvolution은 LC-MS 데이터를 실제 분자량으로 변환하는 핵심 과정입니다.
특히 ESI 기반 분석에서는 하나의 분자가 여러 charge state로 관찰되기 때문에 deconvolution이 필수적입니다.
핵심 공식:
이 원리를 이해하면:
- peptide spectrum
- intact protein data
- top-down proteomics
- native MS
데이터를 훨씬 정확하게 해석할 수 있습니다.
관련글 :
LC-MS/MS 데이터 해석
LC-MS/MS Fragmentation 비교: CID vs HCD vs ETD 가이드
What Makes a Good MS/MS Spectrum for Peptide Identification
