기계 학습을 사용하여 화학물질의 독성 평가 개선

소식

홈페이지홈페이지 / 소식 / 기계 학습을 사용하여 화학물질의 독성 평가 개선

Jan 28, 2024

기계 학습을 사용하여 화학물질의 독성 평가 개선

암스테르담 대학교 연구진과 동료 연구진

암스테르담 대학의 연구원들은 퀸즈랜드 대학 및 노르웨이 수자원 연구소의 동료들과 함께 기계 학습을 사용하여 화학 물질의 독성을 평가하기 위한 전략을 개발했습니다.그들은 기사에서 자신의 접근 방식을 제시합니다. 특별호 "환경 과학, 공학 및 기술 발전을 위한 데이터 과학"으로 환경 과학 기술 박사 학위를 취득했습니다. 이 연구에서 개발된 모델은 QSAR(정량적 구조-활동 관계) 모델링을 기반으로 하는 기존의 in silico 평가와 비교할 때 상당한 개선을 가져올 수 있습니다.

연구원들에 따르면, 기계 학습을 사용하면 새로운 화학 물질의 안전 설계 개발과 기존 화학 물질 평가 모두에서 분자의 위험 평가를 크게 향상시킬 수 있습니다. 후자의 중요성은 유럽과 미국의 화학 기관이 수년에 걸쳐 개발되었지만 환경 거동이나 독성에 대한 지식이 거의 또는 전혀 없는 약 800,000개의 화학 물질을 나열했다는 사실에서 설명됩니다.

화학적 운명과 독성에 대한 실험적 평가에는 많은 시간, 노력, 자원이 필요하기 때문에 모델링 접근법은 이미 위험 지표를 예측하는 데 사용되고 있습니다. 특히 원자 배열 및 3D 구조와 같은 분자 특징을 물리화학적 특성 및 생물학적 활성과 연관시키는 QSAR(정량적 구조-활동 관계) 모델링이 종종 적용됩니다. 전문가들은 모델링 결과(또는 가능한 경우 측정된 데이터)를 기반으로 분자를 예를 들어 화학물질 분류 및 표시에 관한 세계 조화 시스템(GHS)에 정의된 범주로 분류합니다. 특정 범주의 경우 분자는 더 많은 연구와 적극적인 모니터링을 거쳐 최종적으로 입법을 받게 됩니다.

그러나 이 프로세스에는 본질적인 단점이 있으며 그 중 대부분은 QSAR 모델의 한계로 인해 발생합니다. 이는 매우 동질적인 훈련 세트를 기반으로 하는 경우가 많으며 외삽을 위해 선형 구조-활동 관계를 가정합니다. 결과적으로, 많은 화학 물질은 기존 QSAR 모델로 잘 표현되지 않으며 그 사용은 잠재적으로 상당한 예측 오류와 화학 물질의 잘못된 분류로 이어질 수 있습니다.

Environmental Science & Technology에 발표된 논문에서 Saer Samanipour 박사와 공동 저자는 QSAR 예측 단계를 완전히 건너뛰는 대체 평가 전략을 제안합니다. 암스테르담 대학 반트호프 분자과학연구소의 환경 분석 과학자인 사마니푸르(Samanipour)는 같은 대학 생물다양성 및 생태계 역학 연구소의 환경화학자인 안토니아 프라에토리우스(Antonia Praetorius) 박사와 팀을 이루었습니다. 퀸즈랜드 대학교 및 노르웨이 수자원 연구소의 동료들과 함께 그들은 분자 설명자를 기반으로 화학 물질의 급성 수생 독성을 직접 분류하기 위한 기계 학습 기반 전략을 개발했습니다.

이 모델은 급성 어류 독성(96시간 LC50 값)에 대해 실험적으로 얻은 907개 데이터를 통해 개발 및 테스트되었습니다. 새로운 모델은 각 화학물질의 독성 값(96h LC50)에 대한 명시적인 예측을 건너뛰고 각 화학물질을 미리 정의된 여러 독성 범주로 직접 분류합니다. 이러한 범주는 예를 들어 급성 수생 위험에 대한 GHS 범주에 대한 기사에서 설명한 것처럼 특정 규정이나 표준화 시스템에 의해 정의될 수 있습니다. 모델은 훈련 세트에 사용된 데이터의 분산을 약 90%, 테스트 세트 데이터에 대해 약 80%를 설명했습니다.

이 직접 분류 전략은 QSAR 회귀 모델 기반 전략에 비해 잘못된 분류가 5배 감소했습니다. 그 후, 연구자들은 32,000개 화학 물질의 대규모 세트의 독성 범주를 예측하기 위해 전략을 확장했습니다.

그들은 다양한 소스와 다양한 화학물질군에 대한 실험 데이터 세트를 그룹화하여 더 큰 훈련 세트를 생성할 수 있기 때문에 직접적인 분류 접근 방식이 더 높은 정확도 예측을 가져온다는 것을 보여줍니다. 다양한 국제 규정과 분류 또는 라벨링 시스템에 규정된 대로 미리 정의된 다양한 카테고리에 맞게 조정할 수 있습니다. 앞으로 직접 분류 접근 방식은 다른 위험 범주(예: 만성 독성)뿐만 아니라 환경적 운명(예: 이동성 또는 지속성)으로 확장될 수 있으며 화학적 위험 및 위험에 대한 in-silico 도구를 개선할 수 있는 큰 잠재력을 보여줍니다. 평가.