12月24日消息,在自然語(yǔ)言處理(NLP)領(lǐng)域頂級(jí)會(huì)議EMNLP 2019上,阿里AI獲得微生物群落信息抽取比賽(BB Task)“關(guān)系和實(shí)體聯(lián)合抽取”任務(wù)冠軍,相關(guān)技術(shù)已被用于搭建醫(yī)療領(lǐng)域通用知識(shí)圖譜。阿里巴巴達(dá)摩院計(jì)劃推出業(yè)內(nèi)首個(gè)掌握全域醫(yī)療知識(shí)的通才型AI醫(yī)生。
EMNLP由國(guó)際語(yǔ)言學(xué)會(huì)(ACL)下屬的 SIGDAT 小組主辦,阿里AI參加的BioNLP工作坊旨在解決生物醫(yī)學(xué)領(lǐng)域的NLP問(wèn)題,BB Task(Bacteria Biotope Task)是其重點(diǎn)賽事。
BB Task要求參賽者從論文、病例、網(wǎng)頁(yè)等非結(jié)構(gòu)化文本中抽取與微生物有關(guān)的知識(shí)。在最考驗(yàn)綜合實(shí)力的關(guān)系和實(shí)體聯(lián)合抽取任務(wù)中,阿里AI名列全部三項(xiàng)評(píng)測(cè)第一。
不管對(duì)人類還是AI,醫(yī)療都是高難度學(xué)科,微生物更是典型的細(xì)分領(lǐng)域,可供AI學(xué)習(xí)的資源非常有限。但唯有攻克低資源語(yǔ)料領(lǐng)域,AI醫(yī)生才有可能成為通才。
達(dá)摩院醫(yī)療AI團(tuán)隊(duì)設(shè)計(jì)了基于BERT的多任務(wù)學(xué)習(xí)模型,借助大規(guī)模語(yǔ)料對(duì)關(guān)系和實(shí)體進(jìn)行建模,再通過(guò)大規(guī)模語(yǔ)料與低資源語(yǔ)料之間的知識(shí)遷移,提升AI對(duì)低資源語(yǔ)料的信息抽取能力。
達(dá)摩院正在研發(fā)業(yè)內(nèi)首個(gè)涵蓋所有科室知識(shí)的醫(yī)療領(lǐng)域知識(shí)圖譜。知識(shí)圖譜是描述真實(shí)世界各種實(shí)體/概念及其關(guān)系的語(yǔ)義網(wǎng)絡(luò)圖。通俗地說(shuō),將真實(shí)世界的知識(shí)以機(jī)器能夠理解的方式存儲(chǔ)到計(jì)算機(jī)中,就是知識(shí)圖譜。
信息抽取是搭建知識(shí)圖譜的關(guān)鍵一步。真實(shí)世界的醫(yī)學(xué)知識(shí)散布于科學(xué)論文、醫(yī)療病例、新聞報(bào)道等文本,AI通過(guò)從中抽取實(shí)體、關(guān)系、屬性等知識(shí)要素來(lái)學(xué)習(xí)知識(shí)。
用上醫(yī)療知識(shí)圖譜的對(duì)話機(jī)器人(骨科)
用上醫(yī)療知識(shí)圖譜的對(duì)話機(jī)器人(乳腺外科)
知識(shí)要素常以三元組方式表示,比如「實(shí)體1-關(guān)系-實(shí)體2」「實(shí)體-屬性-屬性值」等。比如,比爾蓋茨、美琳達(dá)夫婦的關(guān)系,用三元組表示就是「比爾蓋茨-夫妻-美琳達(dá)」,比爾蓋茨和巴菲特的關(guān)系則是「比爾蓋茨-合作伙伴-巴菲特」。懂得這些之后,AI就能回答“比爾蓋茨的夫人是誰(shuí)”之類的問(wèn)題。
基于知識(shí)圖譜這一核心技術(shù),達(dá)摩院未來(lái)還將推出智能醫(yī)療保健輔助系統(tǒng)“健康智能導(dǎo)引”,開辟AI時(shí)代的健康管理新模式。
目前,阿里巴巴已與多個(gè)知名藥企及互聯(lián)網(wǎng)醫(yī)療平臺(tái)達(dá)成合作,人們很快就能體驗(yàn)到由達(dá)摩院醫(yī)療知識(shí)圖譜支持的智能醫(yī)療對(duì)話系統(tǒng)。
Copyright ? 2004-2025 健康一線-健康視頻網(wǎng)(vodjk.com)All rights reserved.