一家"胡說八道醫(yī)院"擁有一種治療癌癥的藥物, 根據(jù)過去的記錄, 該藥物對一些患者非常有效, 但是會讓一些患者感到更痛苦...
我們希望有一種判別準(zhǔn)則能幫助我們判斷哪些病人該吃藥,哪些不能吃藥.研究發(fā)現(xiàn)該癌癥與基因表達(dá)有關(guān),也許基因表達(dá)能給我們提供幫助...
首先使用一個基因判別
把所有病人的基因X轉(zhuǎn)錄水平畫在數(shù)軸上, 用綠點表示服用藥物有效的病人, 紅點表示服用藥物后更痛苦的病人.
我們可以看到服用藥物有效的大部分患者的基因X轉(zhuǎn)錄水平都較低
服用藥物無效的大部分患者的基因X轉(zhuǎn)錄水平都較高
但在中間, 我們發(fā)現(xiàn)紅點和綠點是有交叉的, 所以如果只使用基因X來判別只能獲得"還可以"的分類效果.那么使用更多的基因來判斷會不會有更好的效果呢?
使用兩個基因判別
這次我們使用基因X和基因Y來判別.以基因X的轉(zhuǎn)錄水平作為橫坐標(biāo), 基因Y的轉(zhuǎn)錄水平作為縱坐標(biāo), 綠點代表藥物有效的患者, 紅點代表藥物無效的患者.
直觀來看, 我們可以使用一條直線來劃分這兩類患者.
直線左下方的判斷為"應(yīng)該吃藥"的患者, 右上方的判斷為"不應(yīng)該吃藥"的患者. 我們可以看到使用兩個基因來判斷要比單個基因更為準(zhǔn)確, 然而這還不夠完美.那么使用三個基因會獲得更好的結(jié)果嗎?
使用三個基因判別
這次我們加入了基因Z, 以基因Z表示虛線那條坐標(biāo).雖然有點丑, 但這個圖是一個三維圖(請發(fā)揮你的想象力), 比較大的點是離我們比較近的點, 比較小的點則離得較遠(yuǎn).