환자-대조군 연구는 특정 질병이 있는 환자군과 없는 대조군을 선정하여 비교하는 연구 형태이다. 연구목적은 질병이 있는 환자군에서 질병이 없는 대조군에 비해 위험요인의 노출 빈도가 차이가 있는지를 살펴봄으로서 노출과 질병의 연관성을 규명하는 것이다. 환자-대조군 연구의 진행은 우선 연구하고자 하는 질환을 선정한 후 이 질환과 관련될 수 있는 다양한 요인들을 조사한다. 어떤 요인들을 조사해야 하는지를 결정하기 위해서는 구체적인 연구 가설 및 목적을 분명히 하는 것이 중요하며, 관련 질환에 대한 인과적 지식에 대한 사전 이해가 필요하다.
환자-대조군 연구는 이미 발생한 환자를 확보하여 진행하므로 다른 연구 형태보다 상대적으로 발생이 드문 질환에 적용하는 것이 유리하다. 그리고 질병의 잠복기가 긴 질환일 때 이들 질환이 발생하기까지 오랜 시간을 기다릴 필요 없이 새로이 발생하는 환자들을 모집하여 효율적으로 연관성을 평가할 수 있다. 또한 환자군과 대조군을 같은 집단에서 선정하는 것이 결과를 일반화시키는 데 유리하다. 따라서 점차 환자군과 대조군을 별개로 선정하는 전통적인 환자-대조군 형태보다 코호트를 기반으로 한 환자-대조군 방식을 선호한다.
역학에서 인구집단의 규모가 클수록 연구에 유리한 것은 분명하지만, 규모가 작더라도 중요한 주제를 잘 설계하여 진행하는 것이 더 중요하다. 예를 들어 1747년 수행된 괴혈병을 예방하기 위한 실험연구에서는 12명을 두 명씩 나누어서 진행하였고, DES(diethylstilbestrol)라는 약제의 복용과 여성 질암(vaginal adenocarcinoma)과의 관련성 평가를 위해 1960년대 말 실시된 역학연구는 단지 8명의 환자와 32명의 대조군을 관찰한 환자-대조군 연구였다. 역학에서는 인구집단의 특성이 우선적이며 집단의 규모 자체는 부차적이라고 할 수 있다.
환자-대조군 연구를 위한 이상적인 환자군은 환자군 전체이다. 그러나 현실적으로 모든 환자를 조사한다는 것이 불가능하므로 전체 환자군을 대변할 수 있는 환자를 선정하는 것이 중요하다. 현재 환자(유병자)들은 전체 환자들 중에서 살아남은 일부만을 대표할 수 있기 때문에 새로 발생된 환자들만을 포함시키는 것이 바람직하다. 예를 들어 폐암 환자-대조군 연구 시, 현재 입원한 폐암 환자를 환자군으로 정의한다면 예후가 좋은 폐암 환자들만 살아남아 있을 수 있어 전체 폐암 환자를 대변하지 못하고, 이로 인해 폐암과 위험인자와의 연관성을 올바로 파악하지 못할 수 있다.
환자-대조군 연구를 수행할 때 환자군을 최대한 동질적(homogeneous)으로 정의하는 것이 중요하다. 환자군에 환자가 아닌 대상자가 포함되면 결과를 왜곡시킬 수 있기 때문이다. 악성종양과 같이 상대적으로 분명히 정의 내릴 수 있는 질환들도 있지만, 신경정신질환들은 진단의 정의가 나라 및 병원별로 차이가 날 수 있다. 만약 질병의 정의를 분명하게 정의하기 곤란한 경우는 확실한 경우(confirmed), 가능한 경우(possible) 등으로 나누어 분류하고 향후 민감도 검사를 통해 각각 비교할 수 있다.
환자군 선정 시 대표성이 중요하긴 하지만 현실적 상황에 따라 여성, 고령층, 특정 지역 등 국한된 환자군을 대상으로 진행하는 것이 연구 수행에 유리할 수도 있다. 물론 이 경우에는 산출된 결과 해석 시 환자군이 특정 집단에 국한되었다는 주의가 필요하다. 또한 발생자를 확보하기가 불가능한 경우(선천성 이상 등)와 매우 드문 질환의 경우(근위축성축삭경화증 등) 유병자를 대상으로 한 환자-대조군 연구를 시행하기도 한다.
환자군은 병원에서 진단되는 환자들, 지역사회에서의 등록 환자, 코호트 연구에서 발생되는 환자, 단면조사 시 확인된 환자 등 여러 자료원에서 확보할 수 있다. 자료원별로 장단점이 있어 예를 들어 병원에서 환자를 확보하는 것은 쉬울 수는 있어도 지역사회에서 확보한 질병자와 다른 특성을 가질 수 있다. 환자-대조군 연구에서 이상적인 환자군은 새롭게 초기에 진단된 연구집단을 대표하는 전체 환자이다. 따라서 가능한 특정 기관 혹은 병원이 아닌 보다 포괄적인 인구집단에 기반한 지역사회에서의 등록 환자 혹은 코호트 연구에서 발생하는 환자군을 대상자로 선정하는 것이 바람직하다.
환자-대조군 연구에서 같은 환자들이라도 누구와 비교하느냐에 따라 위험도가 높게 혹은 낮게 해석될 수도 있으므로 누구를 대조군으로 선정하느냐가 중요하다. 대조군(control) 혹은 비교군(reference group)은 ‘환자군이 만약 해당 위험요인이 없었다면 어떻게 되었을까를 말해주는 반사실적(counterfactual) 조건에 대한 현실적인 대리 집단’이다. 그러나 현실적으로 이러한 이상적인 집단은 확보하기가 불가능하며 결국 대조군은 이 목적에 가장 근접한 환자군과는 다른 인구집단에서 선정한다.
대조군은 조사하고자 하는 해당 질병이 없다는 것을 제외하고 환자군과 비슷한 특성이 있는 사람들, 즉 환자군이 발생한 모집단을 대표하여 선정한다. 이때 대조군이 반드시 아무 질병이 없어야(disease-free) 하는 것은 아니며, 관심 질병을 제외한 다른 질병이 있는 대조군도 가능하다. 따라서 지역사회 대조군의 경우 환자군과 같은 지역 내 거주하는 사람들로 선정하고, 병원 환자군의 경우 같은 병원 내에서 대조군을 선정한다. 그러나 환자군과 대조군을 지역사회와 병원에서 선정하는 경우 각 모집단이 달라 위험도의 크기가 달라질 수 있다. 일반적으로 병원기반 환자-대조군 연구가 지역사회 기반 연구보다 바이어스의 가능성이 크고 위험도가 높게 나오는 경우들이 있다.
대조군 선정 시 중요한 점은 대조군이 환자가 발생한 인구집단을 반영해야 한다는 것이다. 이때 환자군을 반영한다는 의미는 1) 환자와 같은 특성을 보여야 하는지와 2) 환자가 나온 집단을 대표해야 하는지의 개념적 차이가 존재한다(이 두 가지 상황은 개념적 차이인지 실제로는 비슷한 경우가 많다). 만약 환자군이 전체 환자집단을 대표해서 선정된다면 1)과 2)는 차이가 없으나, 병원 환자군처럼 지역 인구집단을 대표하지 못할 때의 대조군 선정은 2)의 대표성보다는 1)의 환자군과의 비교성을 적용한다. 이러한 사항들을 고려하면 환자-대조군 연구는 1)과 2)의 조건이 함께 만족하는 지역사회 기반한 연구가 바람직하다. 환자군과 대조군이 한 인구집단에서 선정된다면 이는 결국 코호트 연구 방법의 개념과도 연결된다.
대조군 선정 시 또다른 중요한 점은 대조군이 노출 요인과 독립적(independant)이어야 한다. 만약 대조군이 연구하고자 하는 노출이 많거나 적은 집단이라면 결과가 과소 혹은 과대평가될 수 있다. 예를 들어 의료 방사선 노출과 뇌종양 연구를 할 때 대조군을 외상환자로 설정하면 이들은 이미 외상으로 인해 CT를 촬영했을 가능성이 높기 때문에(즉 노출과 비독립적이다) 보고자 하는 관련성을 과소평가할 수 있다.
대조군은 가능한 범위에서 다양한 집단(multiple controls)을 확보하는 것이 연구 결과를 입체적으로 파악하는 데 유리하다. 예를 들어 어린이 뇌종양과 방사선 노출과의 연관성에 대한 환자-대조군 연구에서 정상군 대조군만 활용한다면 방사선이 뇌종양의 위험도를 증가시키는지만 검증할 수 있다. 그런데 2가지 대조군 즉 다른 종양 환자군과 질병이 없는 정상군을 선정하여 환자군과 비교한다면 더 많은 근거를 제공할 수 있다. 즉 만약 뇌종양 환자에게서만 위험도가 증가하고 다른 암환자 대조군에서는 차이가 없었을 경우, 방사선 노출이 뇌종양의 위험도를 특이적으로 증가시킨다고 할 수 있다. 반대로 다른 암환자 대조군에서도 방사선 노출에 의한 위험도가 증가한다면 방사선은 뇌종양뿐만 아니라 다른 암종의 위험도도 증가시킨다고 해석할 수 있다. 이렇듯 환자-대조군 연구에서 여러 대조군을 활용할수록 더욱 깊이 있는 정보를 제공해 줄 수 있다.
또한 대조군으로 다른 종양 환자군을 설정함으로써 회상 바이어스의 가능성을 확인해 볼 수 있다. 예를 들어 만약 뇌종양 환자에게서만 방사선 노출력이 높았다면 회상 바이어스의 가능성이 적다고 할 수 있다. 왜냐하면 뇌종양 어린이의 엄마가 다른 종양이 있는 어린이의 엄마보다 특별히 더 회상 바이어스에 영향을 받았다고 가정하긴 어렵기 때문이다. 그러나 만약 뇌종양 혹은 다른 종양이 있는 어린이의 엄마가 모두 방사선 노출력이 높았다면 회상 바이어스의 가능성이 크다고 할 수 있다. 이처럼 여러 대조군을 갖는 것은 여러 가설을 탐색하고 잠재적 바이어스를 파악하는 데 유용하다.
환자-대조군 연구에서는 교란변수를 통제하고 노출 요인과 건강 영향 간의 관련성을 보다 효율적으로 판단하기 위해 환자군과 대조군을 짝짓기(matching)한다. 짝짓기의 목적은 환자와 대조군 간에 노출 요인 이외의 요인들을 최대한 비슷하게 맞춰주기 위함이다. 즉 대조군 설정에서 질병 여부 외에 다른 요인들은 환자군과 최대한 같게 만드는 것이 비교성을 높이는 데 중요하다.
짝짓기 방법은 개별 환자별로 짝짓기 변수의 특성이 같도록 대조군을 맞추는 개별 짝짓기(individual matching) 방법과 환자군 집단의 변수 특성 분포에 따라 대조군에서도 변수의 분포를 같게 짝짓는 빈도 짝짓기(frequency matching) 방법이 있다. 개별 짝짓기가 빈도 짝짓기보다 실행의 어려움이 있지만 교란변수를 더 확실히 보정시킬 수 있다. 왜냐하면, 빈도에 따라 대조군이 모집되었을 경우에는 조건을 충분히 일치시키지 못해 잠재 교란작용을 유발할 수 있기 때문이다. 예를 들어 10 세 단위로 빈도 짝짓기한 경우 50세 구간 분포는 같으나 환자군은 모두 59세인데 대조군은 51세인 경우라면 연령에 대한 짝짓기 효과는 제한적이다.
환자와 대조군의 짝짓기 비율은 1:1 혹은 1:2 등을 사용하지만 검정력을 높이기 위해 1:4까지도 사용한다. 그러나 환자군의 숫자가 적은 것을 대조군의 숫자를 증가하여 표본수를 보충하려는 것보다는 환자군 자체를 최대한 많이 확보하는 것이 바람직하다.
짝짓기를 하게 되면 짝짓기한 변수에 대해서는 연관성을 볼 수가 없다. 따라서 노출변수와의 연관성을 조사하고자 하는 변수이거나 노출과 질병과의 경과 과정에 관여하는 변수인 경우 짝짓기를 하지 않는다. 만약 변수의 역할이 불분명할 경우 연구 설계 시에는 짝짓기하지 않고 필요 시 자료분석 단계에서 보정할 수 있다. 따라서 일반적으로 연구 설계단계에서는 중요한 최소한의 변수(성별, 연령, 지역 혹은 나라, 인종)들만을 짝짓기하고, 그 외 교란변수로 작용할 만한 변수들에 대해서는 분석단계에서 모델에 추가함으로써 보정한다.
또한 노출과 질병 간의 직접적인 인과적 경로(causal pathway)에 없는 변수라고 하더라도 노출 변수와 관련성이 있는 변수의 경우 과짝짓기(over-matching) 문제점이 나타날 수 있다. 예를 들어 심혈관 질환과 운동과의 연관성 연구에서 흡연 여부, 사회계층 및 소득 수준 등을 짝짓기시켰다면 심혈관 질환과 운동 여부는 관련성이 적게 나올 수도 있다. 왜냐하면 운동 습관은 짝짓기한 변수들과 밀접히 연관되어 있으므로 이들이 짝짓기될 경우 운동상태가 같이 짝지어질 수 있기 때문이다. 따라서 너무 많은 변수를 짝짓기하는 것은 바람직하지 않으며, 현실적으로도 짝짓기 변수가 많아지면 대조군을 확보하는 것이 더 어려워진다.
환자-대조군 연구에서의 분석 지표로는 오즈비 혹은 교차비(odds ratio)를 사용한다. 오즈비의 산출은 짝짓기 방법에 따라 달라진다(그림 3.5.1). 즉 빈도 짝짓기를 했다면 질병자 중 노출자의 비를 비질병자중 노출자의 비로 나누는 방식을 취한다. 한편 개별 짝지은 경우에서는 환자군과 대조군이 서로 같이 노출 혹은 비노출된 경우는 노출과 질병과의 관련성에 대해서 의미가 없으므로 서로 불일치한 경우(discordant pairs)만이 위험도 산출에 활용된다. 즉 같은 환자-대조군 연구라고 하더라도 어떻게 짝짓기를 하였느냐에 따라 서로 다른 계산 방식이 적용되며, 개별 짝짓기의 경우 조건부 로지스틱(conditional logistic) 방법을, 빈도 짝짓기의 경우 비조건부 로지스틱(unconditional logistic) 방법을 적용한다.
그림 3.5.1 환자-대조군 연구에서 짲짓기 방법에 따른 오즈비 산출 방법
오즈비가 발생률의 대리지표로서 제한점이 있지만, 발생률이 드문 질병일 때(일관된 기준은 없으나 약 10% 미만) 상대위험도 지표로 유용하게 사용된다. 즉 노출군에서의 발생오즈는 (노출군의 발생률/1-노출군의 발생률)로 산출되는데 이때 발생률이 적다면 분모는 1.0에 가까워져 발생오즈는 발생률과 거의 비슷하게 된다. 이렇게 산출된 노출 및 비노출 집단의 오즈비는 발생률을 직접 산출하지 못할 경우 연관성 지표로서 유용하게 활용되며 기여위험도 산출에도 오즈비를 적용할 수 있다. 그러나 질병 발생률이 크다면(노출군의 발생률/1-노출군의 발생률)의 값은 1.0보다 커져서 오즈비는 연관성을 과대평가하게 된다. 따라서 오즈비가 코호트 연구에서의 발생비와 같은 의미로 사용되려면 해당 질환의 규모가 적어야 한다는 가정(rare disease assumption)이 필요하다.
오즈비 값은 집단간 발생비(rate ratio) 값은 같다고 하더라도 각 인구집단내 질병 및 노출 유병정도에 따라 달라진다. 예를 들어 흡연과 폐암과의 연관성 연구에서 남녀간 폐암발생률과 흡연률이 다르다면 성별로 산출된 오즈비 값의 크기는 직접 비교하기에 제한적이다. 즉 비록 발생률을 근거로 한 남녀별 흡연의 폐암에 대한 상대위험도는 성별로 같다고 하더라도 오즈비에 근거한 상대위험도 값은 남녀별 인구집단 특성 자체의 차이 때문에 다른 값을 보인다.
오즈비를 통해 위험인자들 간 연관성의 크기를 비교할 수도 있다. 예를 들어 만약 1세 증가에 따라 동맥경화증의 두께가 0.01mm만큼 증가한다고 알려져 있고 간접흡연 여부가 동맥경화증의 두께를 0.011mm만큼 증가시킨다고 한다면, 간접흡연은 동맥경화증 발생에 있어서 1세 증가시키는 것과 같은 위험도를 가진다고 추정할 수 있다. 또한 산출된 위험인자의 위험도 크기로 나누어 해당 위험인자가 몇 세의 연령 증가와 관련이 있는지도 비교할 수 있다. 그러나 이러한 상대적 크기 비교는 산출된 각 위험인자의 속성, 질환의 중증도, 노출 수준에 따라 다를 수 있어 제한적으로 활용될 수 있다.
환자-대조군 연구 시 전체를 대변하지 못하는 환자군 혹은 대조군을 선정하면 바이어스(selection bias)가 초래될 수 있다. 이러한 선택바이어스는 환자군과 대조군 내 참여자와 미참여자 간의 특성 차이가 큰 경우에도 나타날 수 있다. 일반적으로 환자군보다 대조군이 참여하지 않을 가능성이 더 크며, 실제로 역학 연구에서 대조군의 참여율이 지속적으로 감소해 왔다. 또한 환자군과 대조군 간 연구 참여 의지가 노출과 관련이 있고, 이 경향이 대조군보다 환자군에게서 더 크거나 작을 때(독립적이지 않을 때) 연관성 평가 시 바이어스가 발생될 수 있다.
환자-대조군 연구에서는 현재 발생한 질병과 관련된 과거의 노출 정보를 수집하는 것이므로 회상 바이어스(recall bias)가 발생할 수 있다. 특히 대조군이 과거 노출 상황에 덜 주의를 기울여 정보를 불충분하게 보고할 수도 있다. 예를 들어서, 백혈병으로 사망한 아이의 엄마는 건강하게 태어난 아이의 엄마보다 임신 중 엑스선 노출과 같은 과거의 경험에 대해 더 정확한 정보를 제공할 가능성이 크다. 또한 연구대상자의 질병 상태(중증도)에 따라 차이가 나는 정보를 제공할 수 있다. 질병 상태가 심한 환자일수록 그 원인(혹은 원인이라고 믿는) 요인에 대해서 더 많이 회상하기 때문이다.
연구자가 질병 상태를 알고 있다면 정보를 확보하는 데 바이어스를 초래할 수 있다(observer bias). 따라서 정보 수집 시 대상자가 환자 혹은 대조군인지를 모르고 실시하는 것이 바람직하다. 그러나 환자-대조군 연구는 질병이 이미 발생한 상태에서 조사하는 것이므로 눈가림법(blindness)을 적용하기가 현실적으로 쉽지 않다. 따라서 정보 바이어스를 줄이기 위해서 가능한 기록된 자료(일지 및 사업장 자료 등)를 활용하는 것이 바람직하며, 환자군과 대조군 내에서 신뢰도와 타당도를 비교함으로써 회상 바이어스가 있었는지를 확인하는 것도 필요하다.
체르노빌 사고로 인한 방사성요오드 노출과 갑상선 암에 대한 평가를 위해 벨라루스와 러시아 지역 주민을 대상으로 한 환자-대조군 연구가 진행된 바 있다. 방사능 오염지역 주민에서 276명의 어린이 갑상선암 환자와 1,300명의 짝지어진 대조군(연령, 성별, 지역)을 선정하여, 인터뷰 조사를 통해 생활 관련 요인들 및 요오드 섭취 관련 정보 등을 조사하였다. 자료 분석은 조건부 로지스틱 회귀모델을 적용하여 오즈비를 산출하였으며, 연구 결과 방사성요오드 노출량과 갑상선 암의 위험도는 남녀 어린이 모두에게 유의하게 증가하였다(체르노빌 사고 참고).
CT 촬영과 뇌종양과의 연관성을 보기 위해서 병원 기반 환자-대조군 연구가 일본에서 실시되었다. 120명의 뇌종양 환자와 360명의 충수염 환자(2011-2015년)를 대조군으로 하여 성별, 연령 및 진단일시를 1:3으로 짝짓기하였다. 이때 연구대상자 포함기준은 진단시 나이가 10-24세로서 병원에 입원한 경우로 설정하였다. 노출 평가는 촬영된 CT에 대한 부위, 횟수, 기계적 정보를 평가하는 방법과 프로그램(NCI-CT)을 적용하여 선량을 평가하는 방법을 적용하였다. 자료 분석 시 노출과 질병의 잠재기간은 2년으로 설정하였으며 조건부 로지스틱 회귀모델을 적용하였다. 연구 결과 CT 촬영의 횟수 및 뇌선량 값과 뇌종양 위험도와는 유의한 연관성이 관찰되지 없었다.