SMILES란 무엇인가: 질량분석에서 구조와 MS/MS Fragmentation을 이해하는 방법
1. SMILES의 정의와 질량분석에서의 의미
SMILES(Simplified Molecular Input Line Entry System)는
복잡한 화학 구조를 한 줄의 텍스트 문자열로 표현하는 표준 규약입니다.
단순히 이름을 대신하는 것이 아니라,
원자의 종류, 연결 순서, 결합 정보가 모두 포함된 구조 데이터입니다.
복잡한 화학 구조를 한 줄의 텍스트 문자열로 표현하는 표준 규약입니다.
단순히 이름을 대신하는 것이 아니라,
원자의 종류, 연결 순서, 결합 정보가 모두 포함된 구조 데이터입니다.
예:
Ethanol →
CCO
Benzene → c1ccccc1
질량분석에서의 의미
SMILES는 LC-MS/MS 데이터 해석에서 매우 중요한 역할을 합니다.
- 후보 물질 식별: PubChem 등 DB에서 얻는 후보들은 모두 SMILES로 정의됩니다
- Fragmentation의 근거: MS/MS에서 fragment가 생성되는 위치는 결합의 특성에 따라 결정되며, 이 정보가 SMILES에 포함됩니다
SMILES는 단순한 표기가 아니라 구조 기반 질량분석 해석의 핵심 입력 정보입니다
2. SMILES의 핵심 규칙: 문자 속에 숨은 지형도
SMILES는 문자 하나하나가 구조적 의미를 갖습니다.
2.1 원자와 결합
- 원소 기호: C, N, O 등
- 단일 결합: 생략
- 이중 결합:
= - 삼중 결합:
#
2.2 분기 (Branch)
곁가지 구조는 괄호 ( )로 표현합니다.
CC(O)C
→ Isopropanol 구조
2.3 고리 구조 (Ring)
고리 연결은 숫자로 표시합니다.
C1CCCCC1
→ Cyclohexane
2.4 방향족 (Aromaticity)
벤젠과 같은 방향족 구조는 소문자로 표현합니다.
c1ccccc1
2.5 특수 표현 (중요)
● 분리된 구조 (Adduct / Salt)
[Na+].[Cl-]
→ 물리적으로 분리된 구조 표현
→ LC-MS에서 매우 중요
● 대괄호 [ ]
- 동위원소 표현
[13C], [2H]
→ HRMS 해석에서 핵심 요소
3. 왜 분자식보다 SMILES가 중요한가 (Isomer)
분자식만으로는 구조를 알 수 없습니다.
예: C₂H₆O
![]() |
| 동일한 분자식(C₂H₆O)을 가진 이성질체라도 SMILES 구조(CCO vs COC)에 따라 탈수 반응(-18 Da) 등 MS/MS Fragmentation 패턴이 완전히 달라짐을 보여주는 비교 모식도 |
- Ethanol →
CCO - Dimethyl ether →
COC
구조 차이에 따른 MS 차이
- Ethanol → -OH 존재 → 탈수 반응 (-18 Da) 발생
- Ether → 탈수 반응 거의 없음
SMILES를 모르면
MS/MS에서 특정 peak의 존재/부재를 설명할 수 없습니다
4. 펩타이드 분석에서의 실전 활용
펩타이드 역시 화학 구조이며 SMILES로 표현 가능합니다.
활용
- 아미노산 연결 구조 표현
- PTM 위치의 화학 환경 분석
실전 의미
- 인산화, 산화 위치 분석
- b/y ion 외 특이적인 neutral loss 예측
5. 실전 가이드: SMILES → Fragmentation 연결 원리
질량분석 해석의 핵심은:
“어디가 잘릴 것인가”
5.1 약한 결합 찾기
SMILES 구조에서:
결합 에너지가 낮은 위치
α-cleavage 위치
→ 쉽게 fragmentation 발생
5.2 기능기 기반 예측
SMILES에서 특정 구조가 보이면:
C(=O)O→ CO₂ loss (-44 Da)O(OH) → H₂O loss (-18 Da)
5.3 상호 검증 과정
SMILES → 구조 예측 → MS/MS 매칭 → 후보 선택
정답 구조는
MS/MS 데이터를 가장 잘 설명하는 SMILES
6. 실제 예시: Acetic Acid
![]() |
| SMILES 구조 정보를 바탕으로 아세트산(Acetic acid)의 주요 Fragmentation 경로(α-cleavage, Decarboxylation, Dehydration)와 생성 이온을 예측하는 실전 해석 프로세스 |
구조 정보
SMILES:
CC(=O)O분자식: C₂H₄O₂
C–C(=O)–OH
예측 가능한 fragmentation
1. CO₂ loss (-44 Da)
Carboxyl group 존재
가장 우선적으로 고려
2. H₂O 관련 반응 (-18 Da)
Hydroxyl group 존재
3. α-cleavage
Carbonyl 인접 결합
핵심 연결
SMILES → 구조 → 결합 특성 → fragmentation → MS/MS peak
역방향 해석
Fragment → 구조 추론 → SMILES 후보 선택
7. SMILES 얻는 방법
대표 DB:
PubChem
ChemSpider
검색 방법
물질 이름
CAS 번호
분자식
8. 후보 SMILES 선택 전략
실무에서는 후보가 매우 많습니다.
필터링 단계
정확 질량 (ppm 기준)
동위원소 패턴
fragmentation 매칭
가장 중요한 단계는
구조 기반 fragmentation 검증
9. SMILES의 한계
3D 구조 정보 부족
stereochemistry 제한
canonical 필요
10. 핵심 정리
SMILES란
구조를 텍스트로 표현한 표준 방식
가장 중요한 이유
구조 기반 해석 가능
실무 핵심 흐름
분자식 → 후보 생성
SMILES → 구조 확인
MS/MS → 정답 선택
핵심 연결
SMILES → 구조 → fragmentation → MS/MS 해석
관련글 :
- SMILES 기반 In-silico Fragmentation과 실측 MS/MS 매칭 (실전 예시)
- MS/MS 드노보 시퀀싱(De novo Sequencing) 원리: b/y Ion 기반 펩타이드 서열 복원
- LC-MS/MS에서 SMILES의 역할: 펩타이드 구조와 질량분석 데이터의 연결
- MS/MS 및 LC-MS/MS De novo Sequencing 원리 (Database Search 차이)
- 실제 MS/MS spectrum 해석 방법
이 글은 LC-MS/MS 기반 질량분석 및 proteomics 분석 전체 흐름 가이드의 일부입니다.
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기
※ 본 글은 LC-MS/MS 기반 proteomics 분석 경험을 바탕으로 실무 관점에서 SMILES의 역할을 설명한 내용입니다.

