원자력 특화 거대언어모델 ‘AtomicGPT’ 공개 < 보도자료 < 소통마당

10 원자력 특화 거대언어모델 ‘AtomicGPT’ 공개

작성일: 2024.12.11
조회수: 1,580

- 원자력 분야에서 기존 언어모델의 성능을 추월 -

- 원자력 연구와 원전제어 지원을 위한 에이전트로 확장 계획 -

□ 한국원자력연구원은 세계 최초로 원자력 분야에 특화된 인공지능 거대언어모델 ‘AtomicGPT’를 개발했다고 11일 밝혔다. 해당 모델은 전세계 언어모델이 공유되는 허깅페이스(Huggingface)에 온라인으로 공개됐다.

ㅇ 이번 개발에는 연구원 디지털원자로·AI연구센터 인공지능응용연구실 유용균 실장과 염승돈 UST(과학기술연합대학원대학교) 석사과정 학생, 서울과학기술대학교 멀티모달자연어처리 연구실의 임경태 교수와 최창수 석사과정 학생이 공동으로 참여했다.

사진 1. 한국원자력연구원은 AtomicGPT를 활용해 다양한 문서작업을 진행하고 있다.

□ 연구원은 80억 개, 700억 개 파라미터 규모를 갖는 두 가지 버전의 AtomicGPT를 개발했다. 파라미터는 생성형 AI가 정보를 학습하고 기억하는 시냅스 역할을 하는데, 그 규모가 커질수록 답변의 수준이 높아진다. 작은 규모 버전은 빠르고 가볍게 사용하기 위해, 큰 규모는 어려운 질의 응답을 위해 사용한다.

ㅇ 연구진은 AtomicGPT를 원자력 분야에 최적화하기 위해 대량의 일반 지식과 원자력 분야 공개 논문, 사전, 규정집, 보고서 등을 학습데이터로 사용했다. 특히, 10년 이상 원자력 연구개발을 담당해 온 전문가들이 어휘와 지시문을 가공해 실사용에 적합하다.

ㅇ 원자력 특화 모델답게 연구원이 자체 개발한 성능 검사기준인 ‘원자력 분야 평가 기준(AtomBench)’에서 메타의 라마3.1(Llama3.1), 알리바바의 큐원2.5(Qwen2.5) 등 글로벌 기업의 언어모델보다 5~24% 이상 답변의 정확도가 높은 성능을 보이는 것을 확인했다.

□ 원자력 분야는 일상에서 흔히 사용하지 않거나 다른 뜻으로 사용되는 전문용어가 많아 일반적인 ChatGPT를 활용한 검색은 그 한계가 명확했다. 특히 원자력산업은 보안이 중요한데, ChatGPT와 같은 상용 AI 모델은 보안에 취약할 수 있어 사용이 어렵다. 이때 AtomicGPT를 유용하게 활용할 수 있을 것으로 기대한다. 원자력산업의 핵심 업무인 각종 보고서 작성, 규제 준수 검토, 기술 검증, 표준화 절차, 형상 관리 등에 AtomicGPT를 활용해 업무 효율성을 크게 향상하고 인적 오류를 최소화하는 데 기여할 수 있다.

사진 2. Huggingface에 공개된 AtomicGPT

□ 아울러, 연구원은 AtomicGPT를 문서 업무 활용에 그치지 않고, 원전 시뮬레이터를 제어하는 ‘원자로 AI 운전원’에 적용하는 연구를 수행 중이다. 이는 원자로 내 사고 상황을 예측하고 인간 전문가를 보조하는 역할을 하게 된다. 특히 원자로의 실시간 데이터를 기반으로 이상을 감지하고 잠재적 사고 상황을 예측해 원자력 발전소의 안전성을 향상하는 데 큰 도움을 줄 것으로 기대한다.

□ 인공지능응용연구실 유용균 실장은 “원자력 특화 거대언어모델을 누구나 사용하고 직접 학습할 수 있게 공개함으로써 원자력계의 산학연이 거대인공지능 연구에 협력할 수 있는 틀을 마련하고자 한다.”라며, “이를 통하여 궁극적으로 원자력 발전소를 보다 안전하고 효율적으로 운영하는 인공지능 에이전트를 개발하고자 한다.”라고 밝혔다.

파일

이전 다음 목록

담당부서: 미디어소통팀
담당자: 이현정
연락처: 042-868-2062

최종수정일2023.02.01

만족도평가

페이지의 내용이나 사용 편의성에 대해서 만족하십니까?

매우만족 5점 만족 4점 보통 3점 불만 2점 매우불만 1점

의견등록

전체메뉴

보도자료

HTML소스복사