SMILES 기반 In-silico Fragmentation과 실측 MS/MS 매칭 (실전 예시)
아래 결과는 SMILES 구조를 기반으로 생성된 이론적 fragment와, 실제 LC-MS/MS에서 측정된 스펙트럼을 비교한 예시입니다.
본 분석은 단순한 mass matching이 아니라, 다음의 통합 과정을 통해 수행되었습니다.
1. 구조 기반 Fragmentation 예측
입력: SMILES (펩타이드 구조 포함) : 펩타이드는 펩타이드 서열로 SMILES 표현을 생성할 수 있습니다.
처리:
결합 유형 분석 (single, double, amide bond 등)
α-cleavage 가능 위치 탐색
기능기 기반 neutral loss 예측
H₂O loss (-18 Da)
NH₃ loss (-17 Da)
CO₂ loss (-44 Da)
출력:
fragment 구조 (SMILES 유지)
분자식
이론 질량
2. Fragment Stability 평가
각 fragment는 단순 생성이 아니라 구조 기반 안정성 평가를 거칩니다.
amide bond 인접 cleavage
resonance stabilization 여부
charge localization 가능성
→ 이를 통해 실제로 관측될 가능성이 높은 fragment만 선별됩니다.
3. In-silico Spectrum 생성
생성된 fragment를 기반으로:
m/z 계산 (charge state 고려)
isotope pattern 계산
theoretical spectrum 생성
4. 실측 MS/MS와 매칭
아래 그래프에서:
검은색 peak → 실측 데이터
색상 peak → 이론 fragment
비교 결과:
주요 peak 대부분이 구조 기반 fragment로 설명 가능
neutral loss fragment도 정확히 일치
isotope pattern 또한 일관성 유지
5. 핵심 해석
이 결과는 다음을 의미합니다:
단순히 “mass가 맞는 후보”가 아니라
→ 구조적으로 타당한 후보만 선택됨
fragmentation이 설명되지 않는 후보는 자동으로 배제됨
6. 기존 접근과의 차이
기존 DB search:
precursor mass 기반 후보 생성
fragment match는 통계 기반
본 접근:
SMILES 기반 구조 분석
fragmentation을 직접 예측
구조 ↔ MS/MS 양방향 검증
7. 결론
SMILES 기반 fragmentation 분석은
단순 identification을 넘어:
구조 검증 (structure validation)
false positive 제거
unknown peak 해석
까지 확장 가능한 접근입니다.
핵심 요약
SMILES → 구조 → fragmentation → MS/MS 매칭
이 흐름이 일관되게 성립할 때
비로소 “신뢰 가능한 identification”이 가능합니다.
- SMILES란 무엇인가: 질량분석에서 구조와 MS/MS Fragmentation을 이해하는 방법
- MS/MS 드노보 시퀀싱(De novo Sequencing) 원리: b/y Ion 기반 펩타이드 서열 복원
- LC-MS/MS에서 SMILES의 역할: 펩타이드 구조와 질량분석 데이터의 연결
- MS/MS 및 LC-MS/MS De novo Sequencing 원리 (Database Search 차이)
- 실제 MS/MS spectrum 해석 방법
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기
※ 본 글은 LC-MS/MS 기반 proteomics 분석 경험을 바탕으로 실무 관점에서 SMILES의 역할을 설명한 내용입니다.

