
단일세포 시퀀싱은 통상적인 벌크샘플 시퀀싱과는 달리 개별 세포수준에서 유전자 발현을 분석할 수 있는 기술이다. 특히 각종 질병, 발생, 분화 등 생물학적 과정을 분석하는데 널리 활용되고 있다.
단일세포 시퀀싱은 세포 유형별로 순일한 유전자 발현의 변화를 측정할 수 있어 질병의 발생 기작을 보다 정확하게 분석할 수 있다. 그러나 단일세포 데이터의 높은 잡음과 결측률, 데이터 간의 측정값의 차이(배치효과)로 인해 실제로 질병유전자의 분석에 얼마나 효과적인지 확인되지 않았다.
연구팀은 다양한 시뮬레이션 실험과 단일세포 데이터 분석을 통해 46가지 통합분석 방법을 비교했다. 특히, 국내에서 생산한 1기 폐암환자들의 단일세포(상피세포) 데이터를 세포유형별로 통합분석했다. 이를 통해 기존에 폐암관련 유전자로 보고된 90여개 유전자들이 통계적으로 높은 순위를 가짐을 확인할 수 있었다.
연구팀은 실험의 신빙성을 높이기 위해 대규모의 코로나19 환자 샘플에서 단핵구 세포 10만개의 데이터를 추가로 분석했다. 분석 결과, 코로나 바이러스의 침입에 대응하는 것으로 알려진 130여개의 유전자가 통계적으로 높은 순위를 차지하는 것을 재차 확인, 서로 다른 유형의 질병에서 단일세포 데이터 통합 분석이 질병 유전자를 효과적으로 선별해 줄 수 있다는 사실을 증명했다.
차형석기자 stevecha@ksilbo.co.kr
저작권자 © 울산일보 무단전재 및 재배포 금지