(가) 의미와 유형
교란 작용(confounding)이란 질병과 특정 원인과의 관련성을 왜곡시키는 현상을 말하며 이러한 현상을 발생시키는 인자를 교란변수(confounder)하고 한다. 예를 들어 커피 섭취와 암 발생과의 연관성 연구를 할 때 방사선 노출량이 많은 작업자가 노출되지 않은 작업자에 비해 커피를 많이 마신다면 마치 커피와 암이 연관된 것처럼 보일 수 있다. 그러나 관찰된 암위험도 증가는 실제로 방사선에 의한 것으로 방사선이라는 교란변수가 커피와 암의 연관성을 교란시킨 것이다.
교란변수가 있다고 반드시 교란 작용이 관찰되는 것은 아니다. 예를 들어 방사선 노출과 암 발생 연관성 연구에서 노출자가 비노출자에 비해 연령이 적고 흡연자 많다면 연령과 흡연이라는 2개의 교란변수들이 존재함에도 불구하고 서로 상쇄되어 교란 작용이 관찰되지 않을 수 있다.
관찰연구에서는 변수를 인위적으로 할당하지 않기 때문에 대부분의 역학연구에서 교란변수를 중요하게 고려한다. 그러나 교란변수가 되기 위해서는 노출 요인뿐 아니라 건강 영향과도 동시에 상관성이 있어야 하며, 그렇지 않으면 노출과 질병 사이의 연관성을 교란시키지 못한다. 예를 들어 흡연이 폐암의 위험인자인 것은 분명하지만 만약 방사선 노출과 연관성이 없다면 흡연은 교란변수로 작용하지 않는다. 일본 원폭 생존자 연구에서도 방사선 노출이 흡연여부에 상관없이 순간적으로 발생하였기 때문에 방사선 노출과 암과의 연관성을 파악하는 데 교란변수로 작용하지 않았다.
교란변수의 종류는 시간에 따라 고정된 요인(time-fixed)과 시간에 따라 변하는 요인(time-varying)으로 나눌수 있다. 예를 들어 노출과 사망 사이에 근무여부가 교란변수로 작용할 수 있다(건강근로자효과 참고). 이때 근무여부는 특정 시점의 고정된 상황에서의 상태를 보정할 수도 있고 만약 시점에 따른 변화하는 근무 상태까지 파악하였다면 시간 의존 교란요인으로 보정할 수도 있다.
교란변수가 질병의 위험요인이라는 조건은 그 자체로서의 위험요인(즉 비노출군에서도 위험요인으로 작용)을 의미한다. 즉 노출 요인과 함께 질병 발생에 기여하거나 효과변경인자로 작용하는 경우는 해당되지 않는다. 또한 교란변수는 노출에 의해 영향을 받지 않아야 한다(즉 DAG에서 화살표의 방향성이 교란변수에서 노출로 향한다). 만약 노출에 영향을 받는 변수라면 교란보다는 중재변수 혹은 간접 노출 지표의 역할을 하게 된다.
이상적인 비교는 노출요인이 있는 군을 다른 조건은 모두 동일한 상황에서 노출요인이 없는 군과 동시에 비교하는 것이다. 그러나 이러한 상황은 반사실적 조건으로 현실적으로 불가능하다. 따라서 역학연구에서는 두 개의 서로 다른 집단을 비교하게 되는데 이때 노출 요인 외에 다른 요인들의 분포가 달라 교란작용이 일어날 수 있다. 교란변수는 하나 혹은 여러 개일 수 있으며, 측정할 수 있는 것이 있지만 측정되지 못한 것도 있을 수 있으며, 혹은 어설프게 측정된 것도 있다. 또한 조건부 교란 작용, 즉 하나의 교란변수가 다른 변수에 의해 교란될 수도 있으며 이럴 경우 다른 변수의 상황에 따라 교란 작용을 할 수도 있고 하지 않을 수도 있다. 따라서 일부 측정된 교란변수들을 보정하였다고 하더라도 두 집단을 동일하게 맞추었다고 확신하긴 어렵다.
교란 작용은 다른 말로 교환가능성(exchangeability)의 부족이라고 표현한다. 교환가능성은 노출집단이 비노출집단과 노출요인을 제외하고는 평균적으로 같은 위험도를 갖는 조건을 말한다. 교환가능성이 부족하다는 것은 집단 간 교란 작용과 선택바이어스 등이 있다면 특정 집단에 근거한 연구결과가 다른 집단에게 적용되지 않는 것을 의미한다. 조건부교환가능성(conditional exchangeability)은 특정 조건하에서 교환가능성이 존재하는 것이므로 여기서 특정조건이란 교란변수를 통제할 경우를 의미한다.
같은 교란변수라고 하더라도 인구집단에 따라 서로 다른 영향을 결과값에 줄 수 있다. 교란변수로 인해 실제 연관성을 과대평가(overestimation)하게 되는 경우(관련성의 크기가 실제보다 커짐)를 양의 교란 작용(positive confounding) 이라고 한다. 예를 들어 일본 원전 종사자의 방사선과 폐암 연구에서 원전 작업을 많이 하는 작업자일수록 흡연을 많이 해서 방사선과 암위험도를 사실보다 크게 나타나게 했다. 반면 교란변수가 실제 연관성을 과소평가(underestimation)하게 하는 경우(관련성의 크기가 실제보다 작아짐)를 음의 교란 작용(negative confounding) 이라고 한다. 미국 원전 종사자에서는 일본 원전 종사자와는 반대로 방사선에 노출되는 종사자들이 흡연을 덜 하였고 이로 인해 흡연은 방사선의 영향을 과소평가하게 하였다. 이는 미국 원전 시설에서 고선량 작업 시 금연이 엄격히 요구되었기 때문이다.
(나) 파악 및 중요성
교란변수는 대표적인 3가지 특성을 갖고 있다. 첫째는 노출이 없다고 하더라도 질병의 위험요인이다(직접뿐 아니라 간접적인 위험요인도 포함된다). 둘째는 연구집단(특히 비질병군)에서 노출요인과 관련성이 있다(질병군내에서만의 위험요인들간 관련성만으로는 충분하지 않다). 셋째 노출에 의해 영향을 받는(즉 노출과 질병의 인과적 경로에 있는) 변수는 아니다. 이 특성들중 첫쨰와 셋째 특성은 주로 기존 지식에 의해 판단할 수 있으며 자료 자체에서 파악할 수 있는 것은 둘째 특성이다.
같은 교란변수라도 교란 작용은 질병에 따라 다르게 나타날 수 있다. 예를 들어 흡연에 의한 교란 작용은 흡연에 의한 상대위험도가 높은 질병들에서는 크게 나타날 수 있어도 흡연과의 상대위험도가 작은 질병들의 경우 교란 작용이 나타나더라도 적게 나타난다. 예를 들어 흡연과 폐암의 상대위험비가 방사선에 의한 폐암의 상대 위험비보다 높기 때문에 폐암 연구 시 흡연의 보정은 중요하다. 반면 흡연과 다른 암종의 상대위험비는 폐암보다 상대적으로 낮기 때문에, 흡연에 의한 교란작용의 중요성도 상대적으로 낮아진다. 즉 특정 질환에 중요하게 작용하는 교란변수라고 하더라도 다른 질환에서는 위험요인이 아닐 수도 있고, 위험요인이라고 하더라도 연관성의 크기가 다를 수 있어 교란작용의 효과가 다르게 나타난다.
교란변수를 파악하고 통제하는 것 자제는 쉽지 않은 과정이며 단순하지도 않다. 예를 들어 전체집단에서 교란 작용을 단순히 있다 혹은 없다고 말하는 데에는 상당한 개략적 추론이 필요하다. 실제로는 각 세부 집단별로, 노출형태 및 정도별로 교란 작용이 나타날 수도 있고 아닐 수도 있기 때문이다. 예를 들어 원폭 생존자 연구에서 방사선 노출과 암위험도 평가 시 의료 노출에 의한 교란 작용은 방사선 고노출자에게만 가능성이 있었으며 저노출자들에게는 적었다.
또한 같은 방사선 노출이라고 하더라도 각 연구별로 교란변수로 작용하는지에 대한 판단은 다를 수 있다. 예를 들어 직업적 방사선 노출 연구의 경우 의료방사선이나 환경방사선 노출량이 오히려 더 많을 수가 있기 때문에 이들의 교란 작용을 파악하는 것이 중요하다. 반면 치료방사선 노출에 의한 건강 영향 연구에서는 그 자체가 높은 선량이므로 다른 형태의 방사선 노출에 의한 교란작용은 상대적으로 큰 의미를 갖지 못한다.
특정 요인이 교란변수로서 작용했는지, 만약 했다면 얼마나 영향을 미쳤는가를 파악하는 것은 중요한 역학 연구 주제이다. 일반적으로 1) 노출과 결과변수 모두와 관련이 있는지 2) 층화하였을 때 결과가 변하는지 3) 보정하였을 때 결과가 변하는지 등을 점검한다. 그러나 단순히 결과값의 변화 정도와 변수간 유의성만으로는 교란작용을 판단하는데 한계가 있다(예를 들어 변수간의 관련성만으로는 교란변수와 콜라이더 변수를 구분하지 못할 수 있다). 따라서 교란변수 파악을 위해서는 주어진 자료내에서 통계적 분석에 의존하는 것이 아니라 해당 연구주제에 대한 지식을 통한 인과적 이해를 먼저 도식화하는 것이 필수적이다.
한편 교란의 정도(degree)는 1) 교란요인과 질병과의 연관성의 크기 2) 그리고 노출 및 비노출군내 교란변수의 분율에 따라 다르게 나타난다. 비록 특정 교란요인의 분포가 노출군과 비노출군간에 유의한 차이를 보이지 않더라도 질병과의 연관성이 큰 경우라면(높은 상대위험도) 교란작용을 크게 유발할 수 있으며, 반대로 연관성의 크기가 작다면 노출 비노출간 변수의 분율에 차이가 유의하더라도 교란작용이 분명하지 않을 수 있다. 따라서 단지 노출 비노출군간에 특정 변수들의 분포 차이가 유의한지를 살펴보는 것은 교란변수 파악에 충분하지 않다.
인과적 도식(causal diagram)에서는 뒷문경로 (backdoor path)가 열려있는 것을 교란변수라고 구조적으로 정의 (structural definition) 한다. 즉 노출과 질병간의 직접 관련성 외에 다른 가능한 경로를 의미한다. 이것은 교란변수에 대한 기존의 비구조적 정의 (노출 및 결과와 관련성이 있고 노출과 결과의 중간단계가 아니어야 한다)와 구별된다. 물론 둘간에 실제로 차이가 없는 경우가 많지만 구조적 정의가 보다 정확한 의미를 담고 있다고 할 수 있다.
교란작용(confounding)은 있느냐 없느냐의 절대적 기준인 반면 교란변수(confounder)는 다른 변수들이 어떻게 고려되느냐에 따라 될수도 안될수도 있는 상대적 개념이다. 단지 특정 변수를 모델에 추가할 경우 위험도의 값이 변했다는 이유로 보정해야 할 교란변수로 파악하는 것은 올바르지 않다. 왜냐하면 특정 변수가 교란변수로 작용한 경우외에도 선택바이어스(콜라이더)로 작용해서 결과값의 변화를 초래할 수도 있기 때문이다. 전자의 경우는 보정한 값이 참값에 가깝지만 후자의 경우는 보정함으로서 결과값이 왜곡된다. 따라서 교란변수를 파악하는 별도의 통계적 방법이 있지 않으며 깊이 있는 해당 분야의 전문적 지식과 자료에 대한 철저한 탐색적 분석과정을 통한 역학적 사고 과정이 필요하다.
표 2 오류(Table 2 fallacy)는 노출변수와 질병에 대한 모델에서 보정을 위해 포함된 공변수(covariates)들의 값이 노출변수 값과 같이 제시되는 경우를 말한다. 오류라고 하는 이유는 공변수들의 경우 노출변수와 같은 인과적 차원에서 선정된 것들이 아니므로 이들 계수값의 의미는 노출변수의 값과 다르기 때문이다. 즉 하나의 모델에서 노출변수의 계수값은 공변수들의 영향이 보정된 결과변수에 대한 전체효과(total effect)를 의미하는 반면, 공변수들의 계수값은 노출변수로 인한 간접효과는 보정된 직접효과(direct effect)만을 의미한다. 만약 공변수들에 영향을 주는 다른 교란변수들이 추가된다면 공변수들의 계수값은 달라진다. 따라서 하나의 모델에서 산출된 공변수들의 계수값들을 노출변수값과 같이 하나의 표(주로 표 2)에 제시하는 것은 바람직하지 않다. 만약 공변수들의 효과를 파악하고자 한다면 주요 노출변수에서와 같이 별도의 접근이 필요하다.
교란변수로 설정된 변수라고 하더라도 시기적 흐름을 고려하면 교란이 아닌 노출의 간접 효과가 될 수 있다. 예를 들어 방사선 노출 작업으로 흡연을 많이 하고 이것이 암 발생으로 이어진다면, 흡연은 교란변수가 아니라 방사선 노출의 간접 지표 역할을 한다. 이 경우 흡연이 교란변수인지 노출의 간접지표인가를 구분해야 하며 경우에 따라 불분명할 때도 있다.
(다) 교란작용의 최소화
교란변수를 충분히 보정하지 못하면 결과에 바이어스가 초래될 수 있고, 교란변수를 과보정하게 되면 통계적 검정력을 감소시킬 수 있다. 교란작용을 최소화하기 위해서는 해당 연구 분야의 전문내용을 통해 무엇이 교란변수가 될지를 미리 아는 것은 중요하다. 사전 지식에 근거하여 교란변수 보정 방법들을 적용할 수 있기 때문이다. 그렇지만 인과성이 충분히 밝혀지지 않은 경우들이 많아 알려지지 않은 교란변수가 존재할 수 있다. 또한 교란변수임을 알고 있지만 해당 연구에서 측정하지 못한 측정되지 않은 교란변수(unmeasured confounders)와 아직 알려지지 않은 교란변수(unknown confounder)도 관찰된 연관성으로부터 인과성을 파악하기 위해서 고려해야 한다.
연구설계 단계에서 교란변수를 보정하기 위해 무작위 할당(randomization), 제한(restriction), 짝짓기(matching) 등의 방법이 적용된다. 무작위할당은 교란변수를 직접 보정하는 것은 아니지만 알려지지 않은 보정요인을 비슷하게 만들 가능성을 높여주는 것이므로 알려진 혹은 알려지지 않은 교란변수를 모두 통제하는 데 효율적이다. 반면 제한과 짝짓기는 알려진 교란변수만을 통제할 수 있다(예를 들어 60세 미만으로 제한하거나 비흡연자로만 국한하는 등).
자료 분석 단계에서 교란작용을 최소화하는 방법들에는 표준화(standardization), 층화분석(stratification), 다변량 분석(multivariable analysis)등이 있다. 만약 교란변수가 직접 측정되었다면 이러한 분석 방법들로 보정하는 것이 가능하다. 직접 측정을 못했다면 교란변수와 연관이 되었을 변수를 대신 보정함으로써 어느 정도 교란효과를 감소시킬 수 있다(예를 들어 흡연 정보가 없을 때 사회경제적 수준 혹은 호흡기 질병력을 흡연의 대리지표로서 보정한다).
교란변수가 노출변수와 완전히 일치할 경우는 노출과 교란변수를 떼어 놓을 수 없기 때문에 보정 자체가 불가능하다. 만약 교란변수와 노출변수가 밀접히 관련된 경우 다중공선성이 발생할 수 있으며(예를 들어 대기오염과 거주 지역, 교육수준과 소득, 단백질 섭취와 식이지방 등), 보정 시 과보정(overadjustment)이 될 수 있다. 따라서 일반적으로 중요한 최소한의 변수들만을 보정하는 것이 권장된다. 실제로 주요 변수만을 보정하면 다른 잠재적 교란인자들은 저절로 같이 보정되는 경우들도 있다(예를 들어 방사선 종사자들의 연령과 출생년도를 보정하면 입사년도에 대한 보정은 불필요해진다).
교란변수를 보정했어도 충분히 보정되지 않는 잠재 교란영향이 가능하다. 측정된 변수 자체가 노출을 충분히 반영하지 못할 때 나타날 수 있는데 예를 들어 흡연의 교란 작용을 줄이기 위해서는 통계적 모델에 흡연량(pack-year) 변수를 넣을 수 있다. 그러나 모델에 총 흡연량을 넣는다고 교란변수에 대한 충분한 보정이 이루어지는 것은 아니다. 왜냐하면 현재 흡연자와 과거흡연자가 동일한 총 흡연량을 갖는다고 하더라도 그것이 의미하는 바는 다르기 때문이다. 따라서 흡연 여부에 따라 대상자를 비흡연자, 과거흡연자, 현재흡연자로 구분하여 층화분석을 실시하고 각 집단 내에서 총 흡연량을 보정하면 잠재교란작용을 줄일 수 있다. 이처럼 교란변수의 영향을 최소화하기 위해서는 층화 및 모델을 통한 보정이 동시에 적용하는 것이 필요하다.
직접 측정되지 않았지만 교란작용을 할 수 있는 변수는 음성대조군(negative control)을 설정함으로서 교란 여부를 정성적으로 파악(detecting)할 수 있다. 예를 들어 방사선 노출과 악성종양과의 연관성을 파악하는데 교란작용을 할 수 있는 흡연 정보를 측정하지 못한 경우 방사선 노출과는 관련없지만 흡연과는 밀접히 관련된 질병 (COPD 질환 등)을 음성대조군으로 설정한다. 만약 방사선 노출과 COPD 위험도가 관련이 없게 나오면 비록 흡연을 직접 보정하지는 못하지만 그 변수에 의해 교란될 가능성을 적다고 판단할 수 있지만, 만약 방사선 노출과 COPD의 위험도가 높게 나온다면 합리적인 결과가 아니므로 흡연에 의한 (unmeasured confounder) 교란작용이 있었다고 판단할 수 있다.
교란 작용의 파악은 연구에서 관찰된 연관성(association)이 인과성(causality) 인지를 설명하는 것으로, 특정 위험요인에 대한 노출을 줄이는 일차예방에서 매우 중요하다. 만약 교란된 결과에 의해 불필요한 요인을 예방하거나 중요한 요인을 간과할 수 있기 때문이다. 그러나 이차예방에서는 고위험군의 파악이 중요하기 때문에 교란된 결과라고 할지라도 유용한 지표가 된다. 예를 들어 고혈압이 흑인에 많다는 현상은 여러 요인에 의한 교란작용이 포함되어 있겠지만, 이차예방을 위해 흑인들을 표적 집단(target population)으로 접근하는 것은 현실적으로 중요하다. 즉 인종이란 요인이 고혈압과 인과성을 갖는다는 해석은 교란된 현상이지만, 흑인에게서 고혈압이 많다는 것은 관찰된 현실이다. 따라서 교란 작용은 인과성 규명을 위해서 궁극적으로는 밝혀져야 할 사항이지만, 원인 파악이 아닌 현실적 문제를 풀어가는 이차예방의 과정으로서는 덜 중요하다.
(라) 연구 사례
일본 원폭 생존자 연구에서 방사선 노출과 건강 영향을 파악하는 데 흡연과 의료방사선 노출이 의미 있는 교란 작용을 하지 않은 것으로 파악되었다. 원자폭탄이 동시에 모든 사람에게 방사선을 노출한 것이기 때문에(exposure at random) 특정 인구집단에 선택적으로 방사선 노출을 시켰을 가능성은 적다. 이 연구에서 흡연은 교란 작용보다는 비흡연자에게 더 큰 방사선의 영향을 보여준 효과변경인자로 파악되었다.
환자를 대상으로 의료 방사선 노출과 악성종양에 관한 연구에서는 적응증에 의한 교란(confounding by indication) 작용이 발생할 수 있다. 즉 의료 방사선 검사는 어떤 질환이나 증상이 있는 경우 받게 되는데, 그 질환 자체가 암 위험도를 증가시킬 수도 있다. 이러한 상황에 기저질환(indication)은 암 발생의 위험요인이며 동시에 방사선 노출과 밀접한 관련성을 가지므로 의료 방사선 노출과 암 위험도의 연관성을 교란시킬 수 있다. 대표적으로 CT 촬영과 어린이 암 역학 연구들에서 많이 보고되었다 (CT 연구 참조).
같은 요인이지만 다른 노출 형태인 경우 교란 변수로 작용할 수 있다. 예를 들어 프랑스 원전 종사자 연구에서 '직업적 방사선 노출'의 영향에 '자연방사능'과 '의료노출 방사선'이 교란작용을 하였는지 평가한 바 있다. 즉 직업 방사선 노출에 따른 암위험도를 초과상대위험도로 산출하고 여기에 각 의료 및 환경방사선량을 보정 변수로 추가함으로써 그 변화를 파악하였다. 연구 결과 방사선량 자체는 자연방사선이 휠씬 크지만 실제로 그로 인한 영향은 적었고, 의료방사선량은 자연방사선량 보다 적었지만, 그 효과는 상대적으로 더 커서 위험도를 줄이는 방향으로 영향을 주었다. 그 이유는 환경방사선 노출은 직업 방사선과 연관성이 적지만 의료방사선은 직업방사선량과 비례하였기 때문이다. 이러한 결과는 직업 노출 연구를 할 때 의료 방사선 노출을 파악하여 보정하는 것이 중요하다는 것을 의미한다.
건강검진(screening) 여부도 교란변수로 작용될 수 있다. 예를 들어 건강검진이 유방암 가족력이 있는 사람들에게 권장되었다면, 건강검진은 암발견을(결과변수) 증가시키고 가족력과도(노출변수) 연관되어 있으므로 가족력과 유방암과의 연관성 평가에서 교란변수로 작용할 수 있다. 비스하게 방사선 노출이 높은 지역주민들에게 건강검진이 많이 실시되었다면 건강검진은 방사선 노출과 암발생에 모두 관련성이 있으므로 방사선 노출과 암발생과의 연관성을 교란시킬 수 있다.
방사선 역학연구를 포함한 직업 역학연구에서는 건강생존자 효과를 보정하기 위해 흔히 근무 기간을 보정하고 있다. 근무 기간은 1) 누적 노출량과 밀접히 관련되어 있고 2) 근무 기간에 따른 건강 영향의 차이가 있다면 교란변수로 작용할 수 있기 때문이다. 15개국 원전 종사자 연구에서는 근무 기간을 보정한 바 있으며 보정하지 않은 경우는 위험도가 감소하였다. 또한 영국, 미국 원전 종사자 및 국제 원전 종사자 연구(INWORK) 등에서도 근무기간 보정은 암의 초과상대위험도를 증가시킨 바 있다.
국내 방사선관계종사자 연구에서도 근무 기간이 길수록 누적 방사선량이 높았으며 사망력은 낮았다. 즉 건강근로자효과에 의한 음의 교란 작용(negative confounding)이 존재하였다. 따라서 이를 보정하기 위해 근무 기간을 통제한 바 있으며 보정 전후의 변화는 유의하지 않았지만 보정한 경우 방사선에 의한 초과상대위험도 값이 유의하지 않은 수준에서 증가하였다 (이전 노출에 영향을 받는 근무 상태에 대한 보정은 건강근로자효과 참고).
저선량 방사선 노출과 악성종양과의 인과성에 대한 역학연구들에서 잠재적인 교란작용과 선택바이어스의 가능성을 고찰한 결과 결과가 심각하게 왜곡되지는 않았다고 보고된 바 있다(표 6.4.1). 왜냐하면 1) 실제로 흡연 및 석면 등 다른 주요 교란변수들이 방사선량과 약하게 관련되어 있거나 역관련성을 보인 경우도 있으며 2) 교란변수 존재 자체가 적어 영향이 크지 않았기 때문이다. 예를 들어 일부 질환의 경우 CT 노출과 암발생에 중요한 교란변수임에는 분명하지만, 질환 자체의 발생이 적어 그로 인한 교란영향은 적을 것으로 추정되었다.
표 6.4.1 저선량 방사선 노출과 악성종양 연구들에서 교란 작용과 선택바이어스의 가능성
(가) 의미와 종류
효과변경(effect modification)이란 변수의 수준에 따라 효과가 다르게 나타나는 것을 말하는 것으로 노출과 질병의 기전적 관계를 보는 개념이다. 정확한 용어는 연관성 변경(association modification)이라고 할 수 있지만, 연관성이 일반적으로 효과 크기로 표현되므로 '효과변경(effect modification)'이라고도 표현한다. 또한 각 층간 효과가 다르다는 차원에서 '이질성'을 의미하며, 각 변수가 효과에 서로 관련되어 있다는 의미에서 '상호작용'이라고 표현하기도 한다. 거의 모든 질환은 한가지 요인이 아닌 여러 요인이 함께 작용하여 발생하므로 효과변경은 현실적 상황을 반영하는 개념이다.
상호작용(interaction)은 생물학적 상호작용과 통계적 상호작용으로 구분한다. 생물학적 상호작용(biological interaction)은 단독이 아니라 다른 요인이 있을 때 질병의 기전으로 작용하는 상황을 말한다. 예를 들어 홍역에 걸리는 상황은 균에 의한 영향과 개체의 면역상태가 같이 작용해야만 발생한다. 일반적으로 환경 및 유전적 요인이 함께 작용하여 질병에 걸리는 경우들이 상호작용에 의한 영향으로 설명될 수 있다. 이런 의미에서 생물학적 상호작용은 둘 이상의 요인이 질병 발생에 기여하기만 하면 되는 개념으로 사실 모든 질병 발생에 존재하는 현상이다. 즉 생물학적 상호작용은 질병 발생에 두 가지 요인이 같이 존재하는 경우를 말하며, 그 크기가 얼마인지를 말하는 상호작용(덧셈 혹은 곱셈작용)과는 구별되는 의미이다. 만약 두 요인이 각각 독립적이어서 동시에 노출되었을 때 추가적인 위험도가 없다고 하더라도 두 요인이 있어야 질병이 발생하므로 생물학적 상호작용은 있다고 표현될 수 있다.
통계적 상호작용(statistical interaction)은 생물학적 상호작용이 있다는 전제하에 효과를 파악한다. 여기에서 효과는 연관성의 정도를 의미하며 위험요인들이 각각 기여했다면 상호작용은 없다고 표현되며, 추가적인 효과가 있어야 통계적 상호작용이 있다고 표현된다. 즉 통계적 상호작용이 없다는 것은 생물학적 상호작용이 없다는 것과는 다른 개념이다.
상호작용을 어떻게 평가(측정)하느냐의 방법으로서 덧셈 상호작용(additive interaction)과 곱셈 상호작용(multiplicative interaction)으로 구분한다. 만약 위험요인들이 각각만 기여하여 추가적인 효과가 없다면 통계적 상호작용은 없는 것이며, 추가적인 효과가 있다면 이 추가량이 얼마이고 어떤 방향으로 작용했는지를 통계적 관점에서 곱셈 및 덧셈 상호작용으로 분류한다. 덧셈 상호작용은 추가적인 효과를 절대위험도로 평가하며 곱셈 상호작용은 상대위험비로 평가한다. 덧셈과 곱셈 상호작용은 단지 다른 척도를 통해 상호작용을 살펴본다는 차이일 뿐 추가적인 효과를 평가한다는 의미는 같다.
같은 노출 요인이라고 하더라도 연구에 따라 다른 형태의 통계적 상호작용을 보일 수도 있다. 예를 들어 표 6.4.2와 같이 방사선 노출과 폐암 위험도를 살펴본 연구에서 흡연은 우라늄 광부들에서는 곱셈 상호작용으로 작용했지만, 일본 원폭 생존자들에게서는 덧셈 상호작용에 더 가까웠다. 즉 특정 변수의 상호작용이 한 가지 형태로 정해져 있는 것이 아니라 인구집단의 특성(기저 위험도의 차이 등)에 따라 달라질 수 있다. 일반적으로 방사선과 흡연의 상호작용은 덧셈보다는 곱셈 상호작용에 더 가까워 보이지만 인구집단에 따라 다르다.
표 6.4.2 인구집단별 방사선과 흡연 노출에 따른 폐암의 상대위험도 비교
(나) 평가 방법
덧셈 상호작용은 두 요인이 각각 노출된 효과 크기(발생률)의 합을 두 요인에 동시에 노출된 효과크기와 비교하여, 이 차이가 없으면 덧셈 상호작용은 없으며(같이 작용했다고 하기보다는 각각이 독립된 인과적 기전을 보인 경우이다), 동시에 노출된 효과크기가 더 크다면 양(positive), 작다면 음(negative)의 덧셈 상호작용이라고 한다. 곱셈 상호작용은 두 요인이 각각 노출된 효과 크기(상대위험도)의 곱을 두 요인에 동시에 노출된 효과 크기와 비교하여, 차이가 없으면 곱셈 상호작용이 없으며, 동시에 노출된 효과 크기가 더 크다면 양, 작다면 음의 곱셈 상호작용이라고 한다.
상호작용의 존재 여부와 크기는 어떤 효과측정(효과의 차이 혹은 효과의 비)을 사용하느냐에 따라 달라진다. 즉 같은 효과 크기라고 하더라도 어떻게 바라보느냐에 따라 상호작용이 있거나 없다고 판단할 수 있다. 예를 들어 덧셈 상호작용 측면에서는 존재한다고 표현될 수 있지만, 곱셈 상호작용으로는 없다고 표현될 수 있으며, 따라서 곱셈 상호작용이 없다는 것이 상호작용 자체가 없다는 것을 의미하지는 않는다.
곱셈과 덧셈 상호작용 중 무엇이 더 적합한 것이냐에는 연구자의 역학적 판단에 근거한다. 즉 상호작용 평가의 결과값은 산술적 계산으로 산출된 것이고 그 값의 해석을 위해서는 역학적 근거에 기반하여 연구자가 합리적으로 판단하는 것이 필요하다. 만약 어떤 상호작용이 맞는지 판단하기 어려우면 종합적 해석을 위해 두 가지 결과를 모두 제시하는 것이 바람직하다.
덧셈 상호작용 파악은 발생률을 알 수 있는 코호트 연구에서 가능하다. 다른 연구 방법에서는 발생률 자체를 얻기보다는 상대위험도 지표를 제시하기 때문에 곱셈 상호작용이 덧셈 상호작용보다 많이 활용되고 있다. 일반적으로 상호작용은 교란 작용을 먼저 확인하고 나서 평가하는 방식을 권장한다. 만약 상호작용을 먼저 조사하면 교란 작용이 잠재되어 있으므로 상호작용에 대한 위양성이 나타날 수 있기 때문이다.
효과변경 작용은 인구집단의 기저 위험도에 따라 다르게 나타날 수 있다. 예를 들어 아래 표와 같이 인구집단 1에서 상대위험도 비가 2이며 절대위험도가 0.125인 상황에서 인구집단 2의 위험도를 적용하는데 상대위험도 비로 혹은 절대위험도 차이로 하느냐에 따라 서로 다른 값을 적용할 수 있다. 첫 번째 방법은 인구집단 1에서 상대위험도가 2.0이므로 단순히 2를 곱하면 인구집단 2에서의 위험도 값이 0.250이므로 2를 곱해 0.50가 된다. 이 값은 비노출군의 위험도 0.250과 위험비 측면에서 보면 2.0, 위험도 차이로 보면 0.25가 된다. 두 번째 방법은 인구집단 1에서의 위험도 차이 (0.250-0.125)를 더해주면 인구집단 2에서 노출군의 위험도는 0.250+0.125=0.375가 된다. 이 값은 위험도 비로 보면 0.375/0.25=1.50이지만 위험도 차이로 보면 인구집단 1과 같이 0.125가 된다. 즉 만약 인구집단 2의 노출 집단에서 관찰된 위험도가 0.50에 가깝다면 곱셈 상호작용을, 0.375에 가깝다면 덧셈 상호작용을 한 것으로 판단할 수 있다. 이처럼 같은 노출요인이라고 하더라도 인구집단 간 기저 위험도의 차이에 의해 효과변경의 형태가 다르게 나타날 수 있다.
표 6.4.3 기저 위험도 변화에 따른 효과변경 작용
만약 인구집단 간 기저 위험도 값이 비슷하다면 기존의 알려진 위험도 값을 다른 인구 집단에 그대로 적용할 수 있다. 그러나 인구집단 간 기저 위험도가 다르다면 상대위험도 비 혹은 절대위험도 차이 둘 중 어느 지표를 기준으로 하느냐에 따라 다른 인구 집단에서의 위험도 값이 달라진다(그림 6.4.1). 예를 들어 위암의 경우 일본 원폭 생존자 집단의 발생률이 서양인보다 높아 원폭 생존자 집단에서 관찰된 방사선의 위험도를 미국인에게 절대위험도 차이로 적용한 경우 상대위험비를 적용한 경우보다 증가한 값을 산출하게 된다. 반대로 유방암의 경우는 미국인의 기저위험도가 높아 일본인에게 관찰된 방사선 위험도의 절대치를 적용할 경우 상대위험도를 적용한 경우보다 낮은 값을 산출하게 된다. 즉 상대위험도 비와 절대위험도 차이 모두 한 측면만을 보는 것이므로 연구집단의 위험도를 다른 집단에 적용할 때 완벽하지 못하다. 따라서 방사선 역학에서는 위험도의 인구집단 전이(population-to-population risk transport)를 장기별 암종에 따라 상대 혹은 절대위험도의 분율을 조합하고 있다. 그러나 같은 인구집단이라고 하더라도 기저 위험율은 시간에 따라 변화하는 경우가 많다(예를 들어 흡연률 증가에 따른 폐암 증가). 따라서 위험도의 인구집단 전이에서는 지속적인 위험도 평가를 실시하고 가장 적합한 상대 및 절대 지표의 조합을 적용하는 것이 필요하다.
그림 6.4.1 기저 위험도가 다른 인구집단에 저대 및 상대위험도 모델을 적용할 경우의 위험도 전이 효과(LSS, 일본 원폭 생존자 연구)
(다) 교란변수와 효과변경인자의 차이
교란변수란 보고자 하는 요인과 질병과의 연관성을 혼란시키는 부정적 의미의 변수로서 반드시 보정해야 하지만, 효과변경인자는 노출과 질병 간의 연관성에 설명력을 추가하는 긍정적 의미의 변수로서 보정하면 바이어스가 증가된다. 즉 효과변경인자를 통해서는 질병 발생의 내용을 더욱 자세히 살펴볼 수 있지만, 교란변수는 인과적 관련성을 혼란시킨다. 따라서 교란변수인지 효과변경변수인지를 구분하는 것이 중요하다.
교란 작용은 인과성을 파악하기 위해서 없애야 할(관심이 없는) 현상인 반면, 상호작용은 인과성의 내용을 더 잘 설명해 줄 수 있어 자세히 살펴보아야 할 현상이다. 상호작용이 있으면 군간 효과크기의 값이 다르게 나타나므로 동질성을 평가하는 것이라고 볼 수 있다. 따라서 교란 작용은 비인과적 연관성의 파악(identifying noncausal associations)으로, 효과변경은 효과의 이질성 파악(assessing heterogeneity of effects)이라고 표현하기도 한다.
일반적으로 교란 작용 발생 시 각 군별 효과측정 값은 비슷하지만, 전체값이 각 군별 값의 범위를 벗어난다. 반면 효과변경은 각 군별 효과측정 값은 다르며 전체 값이 각 군별 값의 범위 내에 있다. 교란 작용 자체에 대한 통계적 방법은 없지만, 상호작용은 그 값 자체를 평가하는 통계적 방법이 존재한다.
특정 변수가 교란 또는 효과변경인자로 정해져 있는 것은 아니어서, 어떤 변수가 교란변수로 작용할 것이냐 또는 효과변경인자로 작용할 것이냐는 연구마다 다르다. 예를 들어 흡연과 암발생 연구 시 연령에 따라 흡연율이 다르고 연령이 암발생의 위험요인이라면 교란인자로 설정할 수 있다. 그러나 연구자가 흡연으로 인한 암발생 효과가 젊은 사람들보다 고령층에서 더 높게 나타나는지에 관심 있다면 연령은 보정이 아니라 효과변경인자로서 파악해야 할 인자이다.
교란변수와 효과변경인자는 배타적으로 구별될 수 있는 변수가 아니다. 효과변경인자(effect modifier)는 기저위험도에 영향을 주어 효과를 조절한다. 즉 효과변경인자는 기저위험도를 변화시키는 모든 변수를 말하나 교란변수와 같이 노출요인과의 관련성이 있을 필요는 없다. 반면 교란변수는 기저위험도를 변경시키고 노출인자와도 관련이 되어있다. 따라서 정의상 교란변수는 효과변경인자라고도 할 수 있으며 특정 변수가 교란 작용을 보이면서 동시에 효과변경인자로 작용할 수도 있다.
예를 들어 폐경 상태는 영양상태와 유방암 사이의 교란 작용이 될 수도 있고(폐경이 특정 영양소와 연관성이 있고 폐경인 경우 그 영양소를 덜 먹는다면), 폐경 여부에 따라 특정 영양소와 유방암의 관련성이 달리 나타난다면(폐경에 따른 호르몬 관련 상태에 따라 영양소가 암에 미치는 효과가 다를 수 있다) 효과변경인자라고 할 수 있다. 이때 결과를 교란변수처럼 보정하고 제시해야 하는지 아니면 효과변경인자로 취급하여 층별로 나누어서 제시해야 하는지는 연구 목적에 따라 다르다. 만약 애매한 경우에는 보정된 결과와 층화하여 나누어진 결과를 함께 제시한다.
효과변경인자는 기전을 파악한다는 의미뿐 아니라 만약 노출을 제거하는 것이 불가능한 경우 이 변수를 조절함으로서 건강영향을 줄일수 있다는 실용적 의미를 가진다. 이러한 의미는 노출과 건강영향 사이에 기전적으로 직접 관련되어 있는 중재변수(mediator)의 경우 더욱 중요하다. 예를 들어 질병에 대한 유전적 소인은 어쩔 수 없지만 그 유전인자가 발현하는데 관여하는 중재변수 혹은 효과변경인자를 통제함으로서 질병발생을 예방하거나 줄일 수 있다.
(라) 연구 사례
프랑스에서 2000년부터 2010년 사이에 CT 검사를 받은 10세 미만의 소아 약 7만 명을 대상으로 후향적 코호트 연구가 진행되었다. 이 연구에서 누적 장기선량에 대한 초과상대위험도는 뇌종양이 mGy당 0.022(95% CI -0.016, 0.061), 백혈병은 mGy당 0.057(95% CI -0.079, 0.193), 림프종은 mGy당 0.018(95% CI -0.068, 0.104)로 CT 노출과 관련해서 유의한 초과 위험은 발견되지 않았다. 그런데 암 발생 위험을 높이는 기저질환을 보정하였을 때에는 초과상대위험도가 뇌종양은 mGy당 0.012, 백혈병은 mGy당 0.047, 림프종은 mGy당 0.008로 감소하였다. 즉 기저질환을 보정한 경우 백혈병의 위험도 변화는 적으나 뇌종양과 림프종은 상대적으로 많이 감소하는 경향을 보였다. 따라서 CT에 의한 암위험도 평가 시 기저질환의 영향이 효과 크기를 과대평가할 수 있다고 보고하였다.
한편 암 위험도를 증가시킬 수 있는 기저질환 여부별로 층화하여 살펴보면 CT로 인한 소아암의 위험도가 기저질환에 의해 유의하게 달라졌다. 즉 기저질환이 없는 군의 초과상대위험도는 mGy당 뇌종양 0.028, 백혈병 0.187, 림프종 0.025로 모두 증가하였으나 기저질환이 있는 집단에서는 각각 -0.005, -0.012, -0.005로 모두 음의 값을 보였다. 이러한 기저질환 유무에 따른 위험도의 차이는 기저질환이 교란 작용보다는 효과변경인자(qualitative interaction)로 작용했다는 것을 의미한다. 즉 기저질환이 없는 군에서 기저질환이 있는 사람보다 방사선의 효과가 더 크게 나타난 것으로 평가되었다. 이러한 결과들을 종합하면 기저질환은 일부 교란작용을 보이기도 했으나(특히 뇌종양의 경우), 전체적으로 효과변경인자로 작용하였다고 볼 수 있다. 따라서 전체 인구집단에 대해 초과상대위험도를 합쳐서 보여주기보다는 기저질환별 유무별로 나누어서 제시하는 것이 바람직하다.
표 6.4.4 기저질환 유무에 따른(층화 및 보정) 뇌종양, 백혈병, 림프종의 초과상대위험도