SMILES란 무엇인가: 질량분석에서 구조와 MS/MS Fragmentation을 이해하는 방법
1. SMILES의 정의와 질량분석에서의 의미
SMILES(Simplified Molecular Input Line Entry System)는
복잡한 화학 구조를 한 줄의 텍스트 문자열로 표현하는 표준 규약입니다.
단순히 이름을 대신하는 것이 아니라,
원자의 종류, 연결 순서, 결합 정보가 모두 포함된 구조 데이터입니다.
복잡한 화학 구조를 한 줄의 텍스트 문자열로 표현하는 표준 규약입니다.
단순히 이름을 대신하는 것이 아니라,
원자의 종류, 연결 순서, 결합 정보가 모두 포함된 구조 데이터입니다.
예:
Ethanol →
CCO
Benzene → c1ccccc1
질량분석에서의 의미
SMILES는 LC-MS/MS 데이터 해석에서 매우 중요한 역할을 합니다.
- 후보 물질 식별: PubChem 등 DB에서 얻는 후보들은 모두 SMILES로 정의됩니다
- Fragmentation의 근거: MS/MS에서 fragment가 생성되는 위치는 결합의 특성에 따라 결정되며, 이 정보가 SMILES에 포함됩니다
SMILES는 단순한 표기가 아니라 구조 기반 질량분석 해석의 핵심 입력 정보입니다
2. SMILES의 핵심 규칙: 문자 속에 숨은 지형도
SMILES는 문자 하나하나가 구조적 의미를 갖습니다.
2.1 원자와 결합
- 원소 기호: C, N, O 등
- 단일 결합: 생략
- 이중 결합:
= - 삼중 결합:
#
2.2 분기 (Branch)
곁가지 구조는 괄호 ( )로 표현합니다.
CC(O)C
→ Isopropanol 구조
2.3 고리 구조 (Ring)
고리 연결은 숫자로 표시합니다.
C1CCCCC1
→ Cyclohexane
2.4 방향족 (Aromaticity)
벤젠과 같은 방향족 구조는 소문자로 표현합니다.
c1ccccc1
2.5 특수 표현 (중요)
● 분리된 구조 (Adduct / Salt)
[Na+].[Cl-]
→ 물리적으로 분리된 구조 표현
→ LC-MS에서 매우 중요
● 대괄호 [ ]
- 동위원소 표현
[13C], [2H]
→ HRMS 해석에서 핵심 요소
3. 왜 분자식보다 SMILES가 중요한가 (Isomer)
예: C₂H₆O
분자식만으로는 구조를 알 수 없습니다.
동일한 분자식(C₂H₆O)을 가진 이성질체라도 SMILES 구조(CCO vs COC)에 따라 탈수 반응(-18 Da) 등 MS/MS Fragmentation 패턴이 완전히 달라집니다.
![]() |
- Ethanol →
CCO - Dimethyl ether →
COC
구조 차이에 따른 MS 차이
- Ethanol → -OH 존재 → 탈수 반응 (-18 Da) 발생
- Ether → 탈수 반응 거의 없음
SMILES를 모르면
MS/MS에서 특정 peak의 존재/부재를 설명할 수 없습니다
4. 펩타이드 분석에서의 실전 활용
펩타이드 역시 화학 구조이며 SMILES로 표현 가능합니다.
활용
- 아미노산 연결 구조 표현
- PTM 위치의 화학 환경 분석
실전 의미
- 인산화, 산화 위치 분석
- b/y ion 외 특이적인 neutral loss 예측
5. 실전 가이드: SMILES → Fragmentation 연결 원리
질량분석 해석의 핵심은:
“어디가 잘릴 것인가”
5.1 약한 결합 찾기
SMILES 구조에서:
- 결합 에너지가 낮은 위치
- α-cleavage 위치
→ 쉽게 fragmentation 발생
5.2 기능기 기반 예측
SMILES에서 특정 구조가 보이면:
C(=O)O→ CO₂ loss (-44 Da)O(OH) → H₂O loss (-18 Da)
5.3 상호 검증 과정
SMILES → 구조 예측 → MS/MS 매칭 → 후보 선택정답 구조는
MS/MS 데이터를 가장 잘 설명하는 SMILES
6. 실제 예시: Acetic Acid
![]() |
| SMILES 구조 정보를 바탕으로 아세트산(Acetic acid)의 주요 Fragmentation 경로(α-cleavage, Decarboxylation, Dehydration)와 생성 이온을 예측하는 실전 해석 프로세스 |
구조 정보
- SMILES:
CC(=O)O - 분자식: C₂H₄O₂
C–C(=O)–OH
예측 가능한 fragmentation
1. CO₂ loss (-44 Da)
- Carboxyl group 존재
- 가장 우선적으로 고려
2. H₂O 관련 반응 (-18 Da)
- Hydroxyl group 존재
3. α-cleavage
- Carbonyl 인접 결합
핵심 연결
SMILES → 구조 → 결합 특성 → fragmentation → MS/MS peak
역방향 해석
Fragment → 구조 추론 → SMILES 후보 선택
7. SMILES 얻는 방법
대표 DB:
- PubChem
- ChemSpider
검색 방법
- 물질 이름
- CAS 번호
- 분자식
8. 후보 SMILES 선택 전략
실무에서는 후보가 매우 많습니다.
필터링 단계
- 정확 질량 (ppm 기준)
- 동위원소 패턴
- fragmentation 매칭
가장 중요한 단계는
구조 기반 fragmentation 검증
9. SMILES의 한계
- 3D 구조 정보 부족
- stereochemistry 제한
- canonical 필요
10. 핵심 정리
SMILES란
구조를 텍스트로 표현한 표준 방식
가장 중요한 이유
구조 기반 해석 가능
실무 핵심 흐름
분자식 → 후보 생성
SMILES → 구조 확인
MS/MS → 정답 선택
핵심 연결
SMILES → 구조 → fragmentation → MS/MS 해석
관련글 :
- SMILES 기반 In-silico Fragmentation과 실측 MS/MS 매칭 (실전 예시)
- MS/MS 드노보 시퀀싱(De novo Sequencing) 원리: b/y Ion 기반 펩타이드 서열 복원
- LC-MS/MS에서 SMILES의 역할: 펩타이드 구조와 질량분석 데이터의 연결
- MS/MS 및 LC-MS/MS De novo Sequencing 원리 (Database Search 차이)
- 실제 MS/MS spectrum 해석 방법
- InChI와 InChIKey란 무엇인가? LC-MS/MS 구조 동정(Structure Identification)에서 중요한 이유
이 글은 LC-MS/MS 기반 질량분석 및 proteomics 분석 전체 흐름 가이드의 일부입니다.
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기
전체 분석 구조를 단계별로 정리한 통합 페이지는 아래에서 확인할 수 있습니다.
→ LC-MS/MS 질량분석 전체 흐름 가이드 보기
※ 본 글은 LC-MS/MS 기반 proteomics 분석 경험을 바탕으로 실무 관점에서 SMILES의 역할을 설명한 내용입니다.

