SMILES 기반 In-silico Fragmentation과 실측 MS/MS 매칭 (실전 예시)

 

SMILES 기반 In-silico Fragmentation과 실측 MS/MS 매칭 (실전 예시)

아래 결과는 SMILES 구조를 기반으로 생성된 이론적 fragment와, 실제 LC-MS/MS에서 측정된 스펙트럼을 비교한 예시입니다. 

본 분석은 단순한 mass matching이 아니라, 다음의 통합 과정을 통해 수행되었습니다.

1. 구조 기반 Fragmentation 예측

  • 입력: SMILES (펩타이드 구조 포함) : 펩타이드는 펩타이드 서열로 SMILES 표현을 생성할 수 있습니다.

  • 처리:

    • 결합 유형 분석 (single, double, amide bond 등)

    • α-cleavage 가능 위치 탐색

    • 기능기 기반 neutral loss 예측

      • H₂O loss (-18 Da)

      • NH₃ loss (-17 Da)

      • CO₂ loss (-44 Da)

  • 출력:

    • fragment 구조 (SMILES 유지) 

    • 분자식

    • 이론 질량





2. Fragment Stability 평가

각 fragment는 단순 생성이 아니라 구조 기반 안정성 평가를 거칩니다.

  • amide bond 인접 cleavage

  • resonance stabilization 여부

  • charge localization 가능성

→ 이를 통해 실제로 관측될 가능성이 높은 fragment만 선별됩니다.


3. In-silico Spectrum 생성

생성된 fragment를 기반으로:

  • m/z 계산 (charge state 고려)

  • isotope pattern 계산

  • theoretical spectrum 생성


4. 실측 MS/MS와 매칭

아래 그래프에서:

  • 검은색 peak → 실측 데이터

  • 색상 peak → 이론 fragment

비교 결과:

  • 주요 peak 대부분이 구조 기반 fragment로 설명 가능

  • neutral loss fragment도 정확히 일치

  • isotope pattern 또한 일관성 유지



5. 핵심 해석

이 결과는 다음을 의미합니다:

  • 단순히 “mass가 맞는 후보”가 아니라
    구조적으로 타당한 후보만 선택됨


  • fragmentation이 설명되지 않는 후보는 자동으로 배제됨


6. 기존 접근과의 차이

기존 DB search:

  • precursor mass 기반 후보 생성

  • fragment match는 통계 기반

본 접근:

  • SMILES 기반 구조 분석

  • fragmentation을 직접 예측

  • 구조 ↔ MS/MS 양방향 검증


7. 결론

SMILES 기반 fragmentation 분석은
단순 identification을 넘어:

  • 구조 검증 (structure validation)

  • false positive 제거

  • unknown peak 해석

까지 확장 가능한 접근입니다.


핵심 요약

SMILES → 구조 → fragmentation → MS/MS 매칭

이 흐름이 일관되게 성립할 때
비로소 “신뢰 가능한 identification”이 가능합니다.


관련글 :

※ 본 글은 LC-MS/MS 기반 proteomics 분석 경험을 바탕으로 실무 관점에서 SMILES의 역할을 설명한 내용입니다.


다음 이전