关于医学信息，你不可不知的那些事

医学信息是个啥

1989年，一个牛逼的组织：国际医学信息协会决定勾搭世界卫生组织，一起搞点事。他们决定在自己的老本行健康领域，引入新的元素：信息科技，调用计算机科学、数学、生物学、统计学、医学等等学科的内容一起来作用在健康领域，攻克医学的大难题。我们国家医学信息的积累最早来源于医学图书馆与医学情报学，其实就是医学的文献资料什么的。

既然要把一个学科的事儿搞成兄弟们一起来帮忙，总得有点方法吧，医学信息就建立了这样的方法。这些方法就是：找吃的（采集），收起来（存储），安排好（管理），分配好（标准化），该吃的时候拿出来（信息提取），混搭材料准备（数据整合），搞个新菜（数据挖掘），大家一起吃（信息共享），给去远方打仗的兄弟们带上或留下（协同）。

那搞这些是为了干啥呢？这作用就大了，比如医学信息都一个标准了，大家用起来方便啊，信息都是散的，咱们搞个系统不就有体系了吗，查起来就方便啊，引入更多资源构建个体系，大家就好找啊，还能知道最新发生了啥，咱建个面向大众的库大家没事头疼脑热就可以查查有没有跟自己匹配的症状，好知道自己要不要去医院啊。

标准这个东东真是非常的重要，没有它，大家都没有可以交流的平台。于是，美国首先建立了巨多牛逼的标准，比如一体化医学语言系统，它里面就有N多不同的医学词汇，不管你叫它癌症和肿瘤，它都能给你识别出来是一个东西。再比如HL7，这时一个卫生信息交换标准，不管你使用什么系统，不管你用的什么硬件，它都可以给你搞一个信息交换，看看彼此数据裸奔的样子。

目前，我国就属于建设的初步发展阶段，缺乏信息资源，缺乏信息标准，缺乏理论支撑，缺乏专业人才，缺乏资金投入，等等。但是，我们国家很重视的好吗，年年都在投钱，我们还是在努力滴。

医学大数据是神马

自从大数据时代降临，医学领域就成为首当其冲的典型，为啥呢？医学信息实在太多辣，你每次看病都有病例，那也是数据之一，你的超声影像，你的检查结果，哪个都是医学数据。人这么多，去医院的人那么多，每次去医院还要做一堆事，数据能不多吗，更何况临床数据还只是医学数据的一部分。

医学数据自身具有量大、增速快、多样性、价值高的特点，所以说现在百度腾讯阿里都拼了命的想往医学领域挪屁股占地盘，因为它有价值啊。可是呢，医学数据种类实在太多，但是却没有很多统一化的标准或者转换工具。那你再想从这里头挖点矿，当然要想想其他的办法，找找其他的兄弟帮帮忙了。计算机科学就是这样被引入进来的。

大数据的技术就是要从各样的数据中，迅速提取出有价值的信息，它可以搞定数据资源的整合、组织、分析，而且数据不需要在一起，分布式的都不在话下。毕竟人家是高级操作系统，能协调这些小弟一起完成任务，这里主要包括Hadoop分布式系统基础架构)，HBase（非关系型分布式数据库）、MapReduce(处理大规模数据集的秉性运算模式)。分析这些数据，则会应用到我们常听到的数据挖掘、机器学习、自然语言处理、模式识别、预测建模等。

这里多一句嘴，在医学信息领域，你必须知道的医学标准有国际疾病分类法ICD，也就是所有的疾病都在这里，有它自己的分类；医学系统命名法-临床属于、当代医疗操作术语集... HL7卫生信息交换标准、医学数字影像和通讯标准等临床信息标准。医学主题词表、一体化医学语言系统等医学知识组织语言标准，也就是说，医学知识都在这里面了。

元数据是用来描述信息或数据的数据，它是结构化的，它会描述信息的存储位置、信息资源属性等等。关于元数据，还有很多标准，比如都柏林核心元数据是按照资源内容描述、知识产权、外部属性特征3种基本类型设置的元数据，里面包括题名、主题、描述、来源、语种、关联等。

what is 医学本体？

这可是个专业词汇，它是一些共享概念的规范化说明，是一种医学知识表示的方式。比如平时我们泛化地说疾病，可是这里规范说法就是疾病本体。疾病本体里面不仅有所有的疾病，他们的概念，还有他们之间的关系，最重要的是，它还是计算机可读哦。

医学本体由类、属性、属性的限制条件和与类相关的实例构成。类就是指概念啦，比如癌症，属性就是指它有什么特点，细胞异常，变异了嘛，实例就是肺癌、肝癌等等。

那么，还得补充说明一下，什么是医学知识标识呢？这是一种约定的结构来表示医学知识，并且必须能被转化为计算机可读的形式的处理方法。它可以表示事实、关系、统计、动作等等很多知识。

表示方法就有很多啦，比如（1）一阶谓词逻辑，谓词逻辑是指非真即假，可以表示状态等知识，也可以表示因果关系。（2）产生式表示具有因果关系的知识。比如有A才有B （3）框架表示比如{框架名、姓名、年龄、工作年限} （4）语义网络使用网络的方式表示概念之间的关系（5）面向对象嗯，这个就比较难解释了，大体可以理解为归类的方法（6）医学本体，就是上面提到的这种，可以表示很多东西（7）神经网络模拟人的大脑结构的一种信息表示，一般由多层神经元结构组成。

数据整合与挖掘

数据整合分为逻辑上和物理上的整合，逻辑上的整合就是资源不在这里，但你可以有一个连接或其他方式找到这个资源。物理整合就是指东西已经拿过来，你就从这里取就好啦。

最重要的数据挖掘来啦，这可是最有价值的一部分了，计算机中最牛的算法在医学领域多半用到这了。挖掘也要有挖掘的规矩，首先你要提出问题，然后准备数据、对数据进行预处理，包括一致性、准确性、区冗余等，之后进行数据建模，分为描述模型和预测模型。描述模型包括聚类、关联和序列等，预测模型包括分类、回归、时间序列等。最终，通过跑出来的数据进行结果分析与评估。

方法都很炫酷啦，具体包括这些方面：聚类、决策树、网络神经、遗传算法、关联规则、支持向量机、贝叶斯理论、时间序列分析等。

决策树是指用树形结构展现数据受各变量影响情况的分析预测模型，根据目标变量产生效应的不同，制定分类规则，对数据进行分类。神经网络，通过非线性预测模型，可以完成分类、聚类、关联等多种任务。支持向量机则是通过某种首先选择的非线性映射将输入的向量映射到更高维的特征空间去，以实现最优分类。贝叶斯理论则是对位置的状态用主管概率估计，然后用贝叶斯公式对发生概率进行修正的做法。

医学自然语言处理与模式识别

医学中同样有一门很重要的门类，就是自然语言处理，也就是用计算机可读可理解的方式来标识自然语言中的语言学规则，实现自然语言生成等内容。处理流程一般分为，文本切割、句子切割、分词、词性标注、语法分析、语义分析、语用分析等。

而目前大火的机器学习方法多用在此处，机器学习是将要解决的问题视为一个分类问题。其中，有监督的学习是指先要有一套有标注的训练样本，让计算机通过概率统计数据驱动的方法学习，将一些新的样本划分到其中的一个类或多个类。无监督学习又称聚类，是指完全没有标注样本，单纯通过语料来训练学习系统。

医学模式识别是指通过对医学领域中的事物的特征进行处理和分析，实现对这些事物或现象进行描述和解释的技术。方法与之前提到的很多方法类似，主要应用于影响识别、信号分析，数据监测等方面。

日后，我们将对以上提到的所有计算机技术、统计学原理、信息技术做更为深入的了解。

以上内容参照中华医学百科全书。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 156,630评论 4赞 359
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 66,405评论 1赞 289
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 106,382评论 0赞 237
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,548评论 0赞 203
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 51,853评论 3赞 285
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,276评论 1赞 209
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,638评论 2赞 309
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,350评论 0赞 195
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,015评论 1赞 238
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,309评论 2赞 240
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 31,836评论 1赞 256
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,206评论 2赞 251
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,767评论 3赞 231
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 25,972评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,715评论 0赞 192
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,319评论 2赞 269
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,222评论 2赞 258

关于医学信息，你不可不知的那些事

推荐阅读更多精彩内容