[IT 알아보기]/IT 소식

[IT 소식] "단백질 생성 AI의 작동 메커니즘 발견"...블랙박스 해결 실마리 될까

이호스트ICT 2024. 1. 3. 17:38

(사진=셔터스톡)

신약 연구에 사용하는 단백질 생성 인공지능(AI)이 약물 효과를 예측하기 위해 화학적 상호 작용을 예측하는 것보다 주로 기존 데이터를 답습한다는 연구 결과가 나왔다. 이는 AI가 결론을 내리는 과정을 인간이 파악하지 못하는 '블랙박스' 문제의 실마리가 될 수 있다는 주장이다.

사이테크데일리는 31일(현지시간) 독일의 본 대학교 연구진이 신약 발견에 활용하는 GNN(그래프 신경망) 애플리케이션을 통해 AI의 결론 도출 과정을 연구, '네이처 머신 인텔리전스'에 논문을 게재했다고 보도했다.

이에 따르면 GNN은 아미노산의 위치 벡터와 방향 벡터를 출력하는 도구로, 특정 분자가 표적 단백질에 얼마나 강하게 결합하는지 예측한다. 대표적인 단백질 생성 AI인 구글 딥마인드의 알파폴드도 GNN 아키텍처를 사용한다.

GNN은 단백질과 화합물(리간드) 사이에 형성된 복합체를 나타내는 그래프로 훈련한다. 하지만 GNN이 예측을 출력하는 방식은 인간이 엿볼 수 없는, 즉 '블랙박스'와 같다.

연구원들은 생성 화합물을 분석하는 '엣지샤퍼(EdgeSHAPer)'라는 애플리케이션을 개발, 6개의 다른 GNN 아키텍처를 분석했다. 이를 통해 연구진의 의도 대로 GNN이 화합물과 단백질 사이의 중요한 상호 작용을 학습해 예측을 내놓는지, 아니면 다른 방식으로 단백질 구조를 예측하는지를 알아보려는 것이다.

그 결과 연구진은 GNN이 예상되는 화학 작용을 바탕으로 하기보다는 기존에 훈련한 데이터에 크게 의존해 생성물을 내놓는다는 것을 발견했다.

즉 연구진은 이미 실험을 통해 잘 알려진 데이터로 6개의 GNN을 훈련한 뒤 다른 화합물을 생성하도록 했는데, 결과물을 엣지샤퍼로 분석한 결과 기존 학습 데이터가 가장 큰 영향을 줬다고 밝혔다.

연구를 주도한 위르겐 바요라흐 교수는 “GNN이 예상대로 작동한다면 화합물과 표적 단백질 사이의 상호 작용을 학습해야 하며, 예측은 특정 상호 작용의 우선순위를 정하여 결정돼야 한다"라며 "그러나 분석 결과 6개 중 대부분 GNN은 주로 기존에 잘 알려진 리간드에 중점을 뒀으며, 단백질-약물 상호작용에 초점을 맞춘 것은 몇차례에 불과했다"라고 말했다.

또 “이는 목표 단백질에 대한 분자의 결합 강도를 예측하기 위해 GNN이 목표 단백질에는 관계없이 훈련 중에 접했던 화학적으로 유사한 분자와 결합 데이터를 '기억'했다는 뜻"이라며 "이처럼 학습된 화학적 유사성이 본질적으로 예측을 결정했다”라고 설명했다.

연구진은 이를 '영리한 한스 효과(Clever Hans effect)'에 비유했다. 한스는 1900년대 초반 산수를 할 수 있는 것으로 유명했던 말이다. 그러나 나중에 밝혀진 바에 따르면 한스는 실제로 계산할 수 있었던 것이 아니라, 문제를 던져준 인간의 몸짓과 뉘앙스에서 결과를 추론한 것으로 알려졌다.

GNN도 한스와 마찬가지로 실제 단백질을 생성한 것이 아니라, 연구진이 제공한 데이터 자체에서 이미 답을 유추했다는 말이다.

'단백질-리간드 친화성을 예측하는 GNN의 학습 특성' 논문 (사진=본 대학교)

이에 대해 일부 전문가도 "GNN이 화합물을 생성해 낸다는 것은 과장된 것"이라고 지적했다. 하지만 바요라흐 교수는 이번 연구가 미칠 긍정적인 면을 강조했다. 그는 "GNN 조사 모델 중 2개는 테스트 화합물의 효능이 증가할 때 더 많은 상호 작용을 학습하는 명확한 경향을 보여줬다"라며 "아마도 GNN은 수정된 표현과 훈련 기술을 통해 원하는 방향으로 더욱 개선될 수 있을 것"이라고 말했다.

그러나 분자 그래프를 기반으로 물리량을 학습할 수 있다는 가정은 일반적으로 주의해서 다뤄야 한다고도 강조했다. 그는 “AI 모델의 예측을 설명하는 방법 개발은 AI 연구의 중요한 영역"이라며 “결국 AI는 흑마법과 같은 것이 아니다”라고 강조했다.

또 이번 연구는 AI의 블랙박스 비밀을 해명하는 유망한 접근 방식이라고 밝혔다. 연구진은 단백질 생성 AI 이후의 프로젝트로 새로운 무기화합물을 생성하는 화학 모델에 접근하고 있다.

임대준 기자 ydj@aitimes.com

원문: https://www.aitimes.com/news/articleView.html?idxno=156260