- 응모기간: 8월 28일 ~ 9월 30일
배경 음악이 재생 중입니다.
글 최관우(원광보건대학교)
좋은 논문을 쓰는 일은 기존 연구 결과에 새로운 벽돌 한 장을 쌓아 올리는 일이다. 이를 위해서는 기존 연구에 대한 철저한 문헌고찰이 필수적인데, 왜냐하면 충분한 참고문헌을 통해 기존 연구들의 경계를 파악하다 보면 독창성 있는 연구 주제가 도출되며 핵심연구결과를 유기적으로 연결하여 효과적으로 전달할 수 있기 때문이다. 반면 문헌고찰이 충분히 이루어지지 않은 채 작성한 논문은 기존 연구와 탄탄한 비교 분석이 없으므로 고찰이 허술해지며 전달하고자 하는 연구 논리가 약해진다.
의학 및 보건학 관련하여 문헌고찰 시 가장 많이 사용하는 검색엔진은 PubMed이다. PubMed는 MEDLINE(Medical Literature, Analysis and Retrieval System+Online, 미국 국립의학도서관(NLM) 저널 데이터베이스)을 주로 접근할 수 있게 해주는 자유 검색엔진으로 미국 국립 보건원의 국립의학도서관이 데이터베이스를 유지·관리한다.
MEDLINE은 생명과학, 생물의학, 건강심리학, 의약학 등 보건·복지 분야와 관련된 방대한 자료를 보유하고 있는 데이터베이스로 전 세계에서 출판되는 5,200여 종의 생의학저널에 수록되는 논문의 서지 및 초록정보를 제공하며, 1966년부터 시작해 현재는 35만 건에 달하는 참고문헌을 보유하고 있다. 특히, 질 높은 의학 및 보건학 자료가 가장 풍부한 데이터베이스 중 하나로, 관련 분야의 연구자들이 자신의 연구를 진행하기 위한 기초자료로 최신 연구나 의학적 발전에 대한 정보를 얻기 위해 자주 사용한다. 그러나 1997년 이전에는 MEDLINE에 접속하기 위해서는 의학 도서관과 같은 시설을 통해 유료로 이루어졌는데, PubMed 시스템이 1996년 1월에 개발되고 1997년 6월 대중에게 무료로 공개되면서 현재는 누구나 쉽게 MEDLINE에 접속하여 문헌을 검색할 수 있다(참고로, 문헌의 전문을 다운로드 시 상업용 데이타베이스일 경우 유료 접근 권한이 있어야 다운로드 받을 수 있다).
시간을 절약하며 연구에 적합한 참고문헌을 찾기 위해서는 검색식을 많이 조합해 보고 수정해 나가는 연습이 무엇보다도 중요하다.
PubMed를 이용한 문헌 검색의 가장 단순한 방법은 PubMed 사이트(https://pubmed.ncbi.nlm.nih.gov/)에 접속한 후 검색어를 입력한 다음 Search 버튼을 누르는 것이다. 그러나 이 방법의 가장 큰 문제점은 검색어에 따라서 관련성이 떨어지는 문헌도 많이 검색된다는 것이다. 이처럼 관련성이 떨어지는 문헌이 검색되는 이유는 PubMed의 ATM(Automatic Term Mapping) 기능 때문이다. ATM 기능은 검색어(자연어)가 자동으로 PubMed에 색인된 MeSH(medical subject headings)로 변환되어 검색되는 기능으로, 검색에 입력 시 우선 MeSH 주제명과 자연어 키워드(All field)의 교집합(AND)으로 검색하고, MeSH 주제명에 검색어가 없을 경우 순차적으로 저널명 및 저자명과 자연어의 교집합으로 검색이 이루어진다. 이와 같은 작동원리는 상당히 민감도가 높고 풍부한 정보 검색이 가능하다는 장점이 있으나 상대적으로 관련성이 부족한 문헌도 많이 검색된다는 단점이 있다.
예를 들어, acute stroke 환자에서 시행한 diffusion과 perfusion MRI 영상의 mismatch 혹은 penumbra에 관한 관련문헌을 조사한다고 생각해 보자. 가장 단순한 방법을 이용하면 검색창에 acute stroke diffusion perfusion MRI mismatch penumbra를 순차적으로 입력한 후 Search 버튼을 누르면 된다. 그러면 [그림1]과 같이 195개의 문헌이 검색되는데, 여기서 검색결과인 195개의 문헌은 매우 많은 것 같지만, MRI 분야가 쉽게 접근하기 어려운 한정된 연구분야이기 때문에 실제로는 적은 편에 속한다. 일반적으로 연구가 많이 진행되는 질병이나 의학분야의 경우 PubMed는 ATM 기능으로 인해 몇 천 개에서 몇 만 개의 문헌이 검색된다.
연구자로서 이렇게 많은 문헌이 검색될 경우 어려운 점은 검색된 문헌을 하나하나 확인하여 자신의 관심사와 관련이 없는 문헌들을 연구자의 식견으로 판단하여 제외해야 한다는 것이다. 물론 불가능한 것은 아니지만 관련문헌이 [그림1]처럼 195개가 아니라 몇 천 개 또는 몇 만 개일 경우 많은 시간을 문헌검색에 허비하게 되거나 또는 문헌고찰을 소홀히 할 수밖에 없다. 따라서 연구자는 PubMed를 이용한 문헌검색 시 이와 같은 문제점을 방지하기 위해 문헌검색 전략을 가지고 접근해야 한다. PubMed를 이용한 문헌검색 전략은 검색어 선정, 검색식 조합, 검색식 수정의 순서로 작업해 볼 것을 추천한다.
검색어 선정이란 연구자가 연구와 관련된 문헌들을 찾고자 할 때 입력하는 검색어를 말한다. PubMed에는 두가지 형태의 언어유형이 있다. 자연어와 MeSH term(통제어)인데, MeSH term은 미국 국립의학도서관이 자료(논문이나 책 등)를 분류하기 위해 계층화시킨 통제된 공식용어이고, 자연어는 공식용어를 연구자들마다 서로 다르게 지칭하는 용어이다(참고로, entry term은 자연어 중 미국 국립의학도서관이 MeSH term의 유사어로 인정한 용어이다). 따라서 검색어 선정 시 정확하고 특이도가 높은 검색이 목적이라면 MeSH term을 사용하여 검색어를 선정해야 하고, 최신 연구까지 모두 포함하거나 민감도가 높은 검색이 목적이라면 연구자들마다 다르게 지칭하는 자연어까지 포함하여 검색어를 선정하는 것이 유리하다.
다시 예시로 돌아가 acute stroke 환자에서 시행한 diffusion과 perfusion MRI 영상의 mismatch 혹은 penumbra에 관한 관련문헌을 조사한다고 생각해 보자. 여기서 acute stroke은 자연어이므로 acute stroke에 대해 정확하고 특이도가 높은 문헌검색을 위해선 acute stroke의 MeSH term이 무엇인지 확인해야 한다. 자연어에 대한 MeSH term은 MeSH Database에서 확인한다. MeSH Database는 PubMed 메인화면 우측하단에 위치한 MeSH Database 글자를 클릭하면 들어갈 수 있는데, acute stroke에 대한 MeSH term은 MeSH Database 창에서 acute stroke을 입력한 후 Search 버튼을 누르면 [그림2]와 같은 결과를 확인할 수 있다. 위 과정을 통해 자연어인 acute stroke의 MeSH term은 stroke 혹은 ischemic stroke으로 통제되는 용어임을 확인할 수 있다.
이와 같은 과정을 통해 자연어인 acute stroke을 MeSH term인 ischemic stroke으로만 바꾸어 검색해도 정확도와 특이도를 높이면서 확인해야 할 참고문헌을 [그림3]과 같이 195개에서 162개로 줄일 수 있다.
그러나 아직도 162개의 참고문헌을 문헌고찰 하기에는 어려움이 있다. 이때 작업해야 하는 것이 두번째, 검색식 조합이다.
검색식 조합이란 불리언 연산자를 이용하여 검색어들을 조합하는 것으로 이를 이용하면 다양하고 정밀한 결과를 얻어낼 수 있다. PubMed에서 검색 시 많이 쓰이는 불리언 연산자는 다음과 같은 것들이 있는데, 참고로, PubMed는 접속사 및 부사는 검색되지 않고 불리언 연산자는 반드시 대문자로 입력해야 한다.
불리언 연산자를 이용하여 검색식을 조합하기 위해서는 PubMed의 메인화면에서 Advanced 글자를 클릭하면 검색식을 조합할 수 있는 창이 나온다. 이때 검색식을 조합하기 위해 가장 먼저 선행되어야 할 것은 Add terms to the query box 항목에서 필드테그(검색할 범위)를 [그림4]처럼 지정하는 것이다.
일반적으로 검색식 조합 시 필드테그는 Title/Abstract을 가장 많이 선택한다. 왜냐하면 참고문헌을 찾을 때 시간을 절약하기 위해 제목(Title)과 초록(Abstract)을 우선보고 내 연구와 적합한지 판단한 후 적합하다면 시간이 많이 걸리는 전문(full text)을 나중에 보기 때문이다.
따라서 필드테그를 Title/Abstract으로 선택한 다음 입력창(Enter a search term)에 검색어를 입력한 후 불리언 연산자인 AND, OR, NOT 중 하나를 선택하면 아래의 Query box에 검색어가 조합이 되고, 위 과정을 반복하여 검색어 조합이 Query box에 최종 완성된 후 Search 버튼을 누르면 불리언 연산자로 검색어를 조합한 검색 식이 검색이 된다. 따라서 다시 예시로 돌아가 필드테그를 All field에서 Title/Abstract로 선택하고 ischemic stroke AND, diffusion AND, perfusion AND, MRI AND, mismatch AND, penumbra AND를 순차적으로 입력하면 Query box에 검색어가 다음과 같이 (((((ischemic stroke[Title/Abstract]) AND (diffusion[Title/Abstract])) AND (perfusion[Title/Abstract])) AND (MRI[Title/Abstract])) AND (mismatch[Title/Abstract])) AND (penumbra[Title/Abstract])으로 조합이 되고 이때 Search 버튼를 누르게 되면, All field의 ischemic stroke diffusion perfusion MRI mismatch penumbra의 165개 보다 정확도와 특이도가 높은 문헌을 [그림5]와 같이 64개로 줄일 수 있다.
하지만 64개의 참고문헌도 하나하나 문헌고찰을 하기에는 너무 많다. 이때 마지막으로 작업해야 하는 것이 바로 검색식의 수정이다.
검색식 수정이란 여러가지 기호나 문자를 이용하여 연구하고자 하는 의도에 맞게 검색어를 수정하는 것이다. 이를 이용하면 가장 최적의 결과물을 얻어낼 수 있는데 검색식 수정 시 가장 많이 쓰이는 기호나 문자는 다음과 같은 것들이 있다.
다시 예시로 돌아가 보자.
우리의 검색목적은 acute stroke 환자에서 시행한 diffusion과 perfusion MRI 영상의 mismatch 혹은 penumbra에 관한 관련문헌을 조사하는 것이다. 이때 중요한 것은 논리적인 판단을 통해 검색식의 선후 관계를 조정하여 수정하는 것인데 위 조사에서는 앞의 예시인 순차적 입력방법보다 두 가지 요인을 고려해 볼 필요가 있다.
첫번째는 acute stroke 환자에게 MRI 검사를 시행해야 diffusion과 perfusion 영상을 얻을 수 있다는 점이고, 두번째는 diffusion과 perfusion 영상이 불일치 되는 부분을 mismatch 또는 penumbra로 저자마다 다르게 표현할 수 있다는 점이다. 따라서 위 두가지 요인을 고려하여 검색식의 선후 관계를 다음과 같이 (ischemic stroke[MeSH Terms] AND MRI) AND diffusion AND perfusion AND (mismatch OR penumbra)로 MeSH Terms과 괄호 우선검색으로 검색식을 수정하면 64개에서 38개로 정확도와 특이도가 가장 높은 문헌을 [그림6]과 같이 찾을 수 있다.
그러나 철저한 문헌고찰이 뒷받침된 좋은 논문을 쓰기위해서는 정확도와 특이도가 높은 논문 뿐만 아니라 민감도가 높은 최신 논문까지 검색해야 한다. 특히 메타분석(meta-analysis)이나 학위논문을 쓸 경우에는 연구와 관련된 모든 문헌이 검색되어야 하는데 이때 사용하는 방법이 민감도가 가장 높은 MeSH term과 자연어까지 모두 포함하여 검색하는 방법이다. 즉, acute stroke 환자에서 시행한 diffusion과 perfusion MRI 영상의 mismatch 혹은 penumbra에 관한 관련문헌을 조사할 때, 민감도가 가장 높은 검색을 실시하기 위해서는 모든 검색어의 자연어와 MeSH term을 전부 조사한 다음 [검색어1]처럼 나타낼 수 있다.
[검색어1]
((“Acute Stroke“[Title/Abstract] OR Stroke[MH] OR “Cerebrovascular Stroke“[Title/Abstract] OR “Cerebral
Stroke“[Title/Abstract]) AND ( Diffusion Magnetic Resonance Imaging[MH] OR “Diffusion MRI“[Title/Abstract] OR “Diffusion Weighted MRI”[Title/Abstract] OR “MRI, Diffusion Weighted”[Title/Abstract] OR “DWI”[Title/Abstract]) AND (Magnetic Resonance Angiography[MH] OR “Perfusion Weighted MRI”[Title/Abstract] OR “MRI, Perfusion Weighted”[Title/Abstract] OR “PWI”[Title/Abstract])) AND (mismatch OR penumbra)
즉 자연어와 MeSH term, 불리언 연산자와 괄호 등 여러가지 기호나 문자를 Query box에 함께 조합해 검색하는 것이다. 그러면 [그림7]과 같이 총 298개의 논문이 검색 되는데 이는 위에서 검색식을 통해서 언급한 문헌보다 매우 많은 문헌이지만 모두 연구주제와 적절하게 연관되어 있는 질 높은 검색을 통해 나온 문헌이기 때문에 메타분석이나 학위논문 논문 작성시 꼭 분석해야 하는 논문들인 것이다.
마지막으로 검색창의 좌측에 있는 filters 및 타임라인의 활용을 통해 필요한 출판연도 혹은 Article 타입을 골라내면 더 좋을 것이고 구(phrase)검색이나 절단(truncation) 검색을 활용하면 더 좋을 것이다.
시간을 절약하며 연구에 적합한 참고문헌을 찾기 위해서는 검색식을 많이 조합해 보고 수정해 나가는 연습이 무엇보다도 중요하다. 왜냐하면 연구를 위한 문헌검색에는 최선의 정답이란 없기 때문이다. 따라서 예시로 든 검색식을 참고하여 연구 주제에 맞는 검색어를 선정하고 검색식을 조합, 수정해 나가는 과정을 적극적으로 활용한다면 방대한 정보의 바다에서 본인에게 필요한 문헌을 쉽게 찾을 수 있을 것이다.
의학·보건학 분야에서 가장 널리 사용되는 검색엔진 중 하나인 PubMed를 이용한 문헌 검색 전략은 검색어 선정, 검색식 조합, 검색식 수정의 순서로 작업해 볼 것을 추천한다.