- 응모기간: 12월 23일 ~ 2월 28일
배경 음악이 재생 중입니다.
ChatGPT는 거짓말과 프로프간다에 기회를 제공한다는 단점에도 불구하고
정확한 데이터에서 나온 결과물이 매우 정확하게 출력되기에 유용하며,
논문 작성에 들여야 하는 노력의 상당 부분을 대체 가능하다.
글 최관우(원광보건대학교)
ChatGPT는, 테슬라의 창업자인 일론 머스크가 세운 OpenAI에서 2022년 11월에 공개한 대화형 인공지능 서비스이다. 서비스 이용은 ChatGPT 사이트(https://chatgpt.com)에서 회원가입 후, 무료 또는 유료로 이용할 수 있다. 사용법은 사이트에 접속해 질문이나 요구사항을 텍스트로 작성한 후 실행하면 답변이 생성된다[그림-1].
여기서 입력하는 대화문을 ‘프롬프트(Prompt)’라 하고, 이에 대한 AI의 답변 생성을 ‘응답(Response)’이 생성된다고 표현한다. 기능 자체는 이전에 나온 구글검색과 다를 바 없다. 그러나 차이점은 결과물인데, 전문가가 썼다 해도 손색이 없을 정도의 보고서를 작성하는가 하면 시를 짓기도 하고 소설을 쓰기도 한다.
ChatGPT는 기계가 인간 언어를 이해하고 구사할 수 있도록 하는 대규모 언어 모델(LLM)의 대표적 사례로, OpenAI의 생성형 인공지능(AI) GPT-3.5를 기반으로 만들었다. LLM은 단어를 조합해 나오는 문장 가운데 가중치를 자연스러운 문장에 부여하는 통계 모델로, 이러한 LLM을 이용한 ChatGPT는 방대한 학습 데이터를 기반으로 인간과 비슷한 문장을 써 내려간다. 여기서 얼마나 인간과 비슷한 문장을 쓰느냐는 인간 뇌의 시냅스에 해당하는 파라미터(매개변수)의 수에 따라 좌우되는데, 초기버전인 GPT-3는 파라미터가 1750 억개에 이르렀고, 현재 출시된 GPT-4는 100 조개를 보유한 것으로 알려져 있다. 참고로 숫자가 클수록 성능도 뛰어나다. 그러다 보니 ChatGPT는 우리가 그동안 많이 사용했던 검색 서비스를(키워드를 입력해 유사성이 높은 웹사이트 링크를 차례대로 보여주는 방식) 벗어나 사용자의 질문에 곧바로 정답을 제시한다. 즉, ChatGPT를 사용하면 이제는 원하는 내용을 찾기 위해 검색 서비스가 제시하는 수많은 링크를 일일이 클릭하는 수고를 들이지 않아도 된다는 것이다. 이러한 편리함으로 인해 지난 20년 가까이 검색 시장의 왕좌를 차지해 온 구글 뿐만 아니라 애플이나 삼성도, 앞으로 형성될 거대 시장을 선점하기 위해 사활을 걸고 기술을 개발하고 있는 것이다.
그러나, 완벽할 것 같은 ChatGPT도 문제점은 있다. 바로 ChatGPT가 생성한 글 또는 정보가 거짓일수 있다는 점이다. 물론 이 문제점은 ChatGPT 만이 아니라 학습 데이터를 기반으로 하는 모든 AI의 문제점이다. 이와 같이 생성된 AI의 응답이 거짓일수 있는 이유는, AI는 응답을 생성할 때 웹사이트와 뉴스, 블로그 게시물 등의 온라인 데이터를 기반으로 학습하여 제시하기 때문이다. 그러다 보니 이 정보들 가운데 잘못된 내용이 섞여 있다면 그것을 기반으로 학습한 AI의 응답도 거짓이 될 수 밖에 없다. 이를 두고 AP(미국연합통신)는 “AI 도구는 산업을 재편할 수 있는 잠재력이 있지만 자신의 목적을 달성하기 위해 거짓말과 프로파간다를 하려는 사람에게도 새로운 기회를 제공한다”고 꼬집었다.
필자는, 이러한 문제점을 감안하더라도 ChatGPT는 매우 유용하다고 생각한다. 왜냐하면, 데이터가 정확하다면 결과물도 매우 정확하게 출력되기 때문이다. 이를 응용하면 논문을 계획하고, 분석하고, 작성하는데 매우 유용하게 활용할 수 있다. 필자가 ChatGPT를 사용할수록 드는 생각은 십여 년 동안 논문을 작성하기 위해 공부하고 노력했던 상당부분을 앞으로는 ChatGPT가 대체 하겠구나 라는 생각이었다. 그만큼 ChatGPT는 전문가의 관점에서도 매우 유용하고 뛰어나다고 생각한다. 따라서 이번호를 시작으로 ChatGPT를 이용하면 어떠한 점이 논문 작성시 유용하게 활용될 수 있는지 하나하나 알아보고자 한다.
논문을 작성하기 위해 연구주제를 선정하면 가장 먼저 해야 일은 그 주제와 관련된 문헌을 검색하고 분석하는 일이다. 왜냐하면 충분한 문헌고찰을 통해 기존 연구들의 경계를 파악하다 보면 독창성 있는 연구 주제가 도출되며 핵심 연구결과를 유기적으로 연결하여 효과적으로 전달할 수 있기 때문이다. 여기서 관련문헌의 검색은 의학 및 보건학 분야라면 지난호에 연재된 PubMed 이용하면 손쉽게 검색할 수 있다. 그러나 문제는 확보한 관련문헌을 읽어보고 분석하는데 시간이 많이 소요된다는 것이다. 더불어 대부분의 쓸만한 문헌은 영어로 작성되어 있다 보니 한글로 작성된 문헌보다 이해하기 어려울 수도 있다. 이럴 때 ChatGPT를 유용하게 활용할 수 있다.
우선, 시작하기에 앞서 연구주제와 관련된 문헌을 PubMed나 구글 학술검색을 통해 pdf 파일로 다운로드 받았다고 가정해 보자. 참고로, 본 내용에 예제로 사용된 문헌은 MR Arthrography와 관련된 Direct MR Arthrography at 1.5 and 3.0T라는 Radiology에 게재된 문헌인데, 꼭 저 문헌을 다운로드할 필요는 없으며, 본인이 연구에 참고했던 다른 문헌을 사용해도 상관이 없다.
다운로드 받은 문헌을 내 연구에 이용하려면 우선 문헌의 내용을 파악하여야 한다. 문헌의 내용을 파악하기 위한 가장 간단한 방법은 직접 읽어보는 것이다. 그러나 직접 읽어보는 것은 연구자의 외국어 능력에 따라 편차가 많이 발생하기 때문에, 시간이 많이 소요될 수도 있고 내용을 부정확하게 파악할 수도 있다. 또한 중요 문헌이 영어가 아니 비영어권 언어라면 그 또한 큰 어려움이 따른다. 이때 ChatGPT를 활용하면 언어종류에 제약 없이 빠르고 비교적 정확하게 문헌의 내용을 파악하고 분석할 수 있다.
ChatGPT를 활용하여 문헌의 내용을 파악하는 방법은 매우 간단하다. 내가 원하는 부분을 ① 문헌에서 복사(Ctrl+C)한 다음 ChatGPT 사이트에 접속하여 ② 메시지 창에 붙여 넣은(Ctrl+V) 후 ③ “한글로 번역해줘”라고 입력하고 ④ 실행 버튼을 누르면(Enter) 영문으로 작성된 내용을 한글로 번역해서 응답을 생성(출력)한다[그림-2].
그러나 위와 같이 문헌의 특정 부분을 선택하여 붙여넣기 하는 방법은 문제가 있다. 왜냐하면, 특정 부분을 선택하기 위해서는 연구자의 영어실력으로 문헌 전체 내용을 미리 파악하여야 하거나 아니면 번역프로그램을 추가적으로 사용하여 문헌 전체를 번역하고 내용을 파악해야 특정 부분의 선택이 가능하기 때문이다. 물론 봐야 할 문헌이 한, 두편이라면 할 수 있다. 그러나 문헌이 여러 편이라면 위 방법은 연구자의 상당한 인내와 시간이 필요하다.
이때 유용하게 사용하는 방법이 바로 pdf 파일 자체를 업로드하는 방법이다. 즉, 분석하고자 하는 ① 문헌의 pdf 파일을 ChatGPT 사이트에 접속하여 끌어 놓은(Drag and drop) 후 ② 파일이 업로드 된 메시지 창에 “파일을 열어 요약해줘(or 분석해줘)” 라고 입력하고 ③ 실행 버튼을 누르면(Enter) 문헌 전체를 요약해서 응답을 생성(출력)한다[그림-3].
추가적으로, 마우스를 이용한 끌어 놓기 외에 또 다른 파일 업로드 방법은 메시지 창의 파일첨부 버튼(클립 모양)을 클릭하여 나타난 열기 창을 통해 업로드 할 수 있다.
파일은 업로드하는 방법은 매우 유용한 방법이다. 그러나 분석해야 할 문헌이 수십에서 수백편이라면 역시 앞의 복사 붙여넣기 방법처럼 연구자의 상당한 시간과 인내가 필요하다. 더불어 문헌분석을 하다 보면 때로는 동일 주제 문헌을 함께 비교해야 될 경우도 발생하는데, 위처럼 하나하나 파일을 업로드하는 방법은 문헌 내용이 요약되더라도 한편씩 요약되기 때문에 여러 편을 함께 비교하여 내용을 파악하기에는 어려움이 따른다.
이럴 때 사용하는 방법이 여러 문헌의 pdf 파일을 한꺼번에 업로드하는 방법이다. 예를 들어, 동일 주제의 문헌을 비교분석 하기위해 두개의 pdf 파일을 다운로드 했다고 가정하자. 이때 분석방법은 ① 두 문헌의 pdf 파일을 ChatGPT 사이트에 접속하여 한꺼번에 끌어 놓은 후 ② 두 파일이 업로드 된 메시지 창에 “두 파일을 열어 비교해줘(or 요약해줘, 분석해줘)”라고 입력하고 ③ 실행 버튼을 누르면(Enter) 끝이다. 그러면 아래와 같이 최종적으로 두 문헌 전체를 ChatGPT가 비교해서 응답을 생성(출력)한다[그림-4].
참고로 파일 업로드는, 무료버전은 하루에 분석할 수 있는 파일수가 3개로 제약이 있으며, 유료버전은 하루 제약은 없지만 한번에 분석할 수 있는 파일수가 10개로 제약이 있다. 그러나 10개 이상이라도 유료버전은 zip 파일로 압축하여 업로드하면 용량이 512MB가 넘지 않는 이상 분석할 수 있으니 참고하길 바란다.
이번호에는 ChatGPT에 대한 첫번째 시간으로 논문 작성 시 매우 중요한 참고문헌 분석에 대해 ChatGPT의 유용성을 살펴보았다. 비교적 간단한 방법이지만 위에 제시한 기능을 잘 활용한다면 내 연구주제와 관련된 핵심 문헌을 선정하기 위해 수십에서 수백편의 문헌을 사전 분석할 때 매우 유용하게 활용할 수 있을 것이다.