報 告 人:陳國波 副研究員
報告題目:大規(guī)模醫(yī)學(xué)遺傳數(shù)據(jù)分析與實(shí)踐
報告時間:2023年6月9日(周五)上午9:00
報告地點(diǎn):靜遠(yuǎn)樓1506
主辦單位:數(shù)學(xué)與統(tǒng)計學(xué)院、數(shù)學(xué)研究院、科學(xué)技術(shù)研究院
報告人簡介:
陳國波,2009年浙江大學(xué)數(shù)量遺傳學(xué)博士,2011~2015年澳大利亞昆士蘭大學(xué)大腦研究所博士后。2017年至今,浙江省人民醫(yī)院臨床醫(yī)學(xué)研究所副研究員。從事統(tǒng)計遺傳學(xué)研究,在Nature,Lancet,Am J Hum Genet,Hum Mol Genet,Bioinformatics,Mol Ecology等雜志發(fā)表論文40余篇,Google Scholar引用超3200次,H-index 19。
報告摘要:
醫(yī)學(xué)遺傳學(xué)數(shù)據(jù)逐漸涌現(xiàn)為數(shù)據(jù)挖掘與分析的重要場景,尤其DNA測序數(shù)據(jù)結(jié)合表型數(shù)據(jù)構(gòu)成全基因組關(guān)聯(lián)分析(Genome-wide association studies,GWAS)的規(guī)范數(shù)據(jù)格式,直接可以作為各類醫(yī)學(xué)預(yù)測的數(shù)據(jù)源。但醫(yī)學(xué)數(shù)據(jù)和DNA數(shù)據(jù)受到隱私保護(hù)的各類限制,現(xiàn)實(shí)中很難直接使用或者交互,極大限制了數(shù)據(jù)體量的擴(kuò)增。本研究采用隨機(jī)矩陣的計算框架,采用projection的方式,對基因型數(shù)據(jù)進(jìn)行單向哈希加密,精準(zhǔn)測算projection所需要的維度k與最終求解精度的量化關(guān)系,開發(fā)出適用于多方計算的encG-reg(encrypted genotype regression)。以兩份真實(shí)世界的UKBiobank的約50萬GWAS樣本以及中國本土6個基因組相關(guān)研究所的約6萬份GWAS樣本,展示了如何在多方計算下采用encG-reg完成醫(yī)學(xué)遺傳學(xué)數(shù)據(jù)的親屬鑒定,以及將要展開的進(jìn)一步工作內(nèi)容和數(shù)據(jù)分析層面的各類挑戰(zhàn)。