2020年6月16日
第一,您觉得统计学在医疗行业扮演一个什么样的角色。
第二,您觉得生物统计发展最核心的是什么
第三,我想加入的的贝达药业在生物统计发展的长远路线是什么
第四,第四是我个人对前辈的一点请教啦。请问一下你对我这种刚进入医疗统计行业的后生有什么建议。
我的终极目的是:总有一天我会告诉我自己数学有什么用,想做一个预言家,因为能够预言,像拥有一种超能力。
值得注意的是四种封闭式问题得到的都是结构化数据,但是由于答项的设计不同,最后得到的数据类型也有所差别。比如,单选题、多选题得到的通常是定性数据(定类数据或定序数据),
1,主要通过柱形图、饼图、频数频率表、列联表等手段来开展统计分析,大多停留在描述分析的层面;
2,通过量表(五级/七级、评分式)可以得到定量数据,满足后续更为复杂的数据分析要求,比如回归分析、多元分析(因子分析、聚类分析,等等)。
当然,不能绝对地说哪种问题形式好、哪种数据类型优,只是希望我们在设计问卷时,提前把后续的数据分析也纳入思考范畴。带着分析需求来设计问题,会让你的问卷更有针对性。
我现在还停留在描述分析的层面,医学统计学是我目前的发展方向。
为什么要做假设检验?这个理解来自于CSSD国际论坛。
统计学检验的方法很多,t检验、秩和检验、χ2检验等等,千奇百怪,你怎么选?怎么用?
其实这些检验,都是基于假设检验。所谓“一叶而知秋”,说的就是假设检验。以小窥大也是假设检验。
为什么要用假设检验呢?如果我们要比较两个人身高体重:很简单,把他们都称一下,胖瘦自知。但是如果我们要比较两个城市或者两个国家的身高时,怎么办。于是,统计学里面就用一种聪明的偷懒的方法来比较,那就是抽样。我们可以从两个城市中拿出两个样本,比如每个城市都随机抽取100个人,分别对比他们的体重。然后使用样本对比的结果去推断和估计总体对比的结果。也是说,假设检验就是用样本来推断总体。
对地震的认识:
地震的产生和传播本质上都是时间历程相关的------先是岩体的变形、聚合、分离(各种蠕变,弹、塑性变形),伴随着岩体应力场的不断变化(近似准静态),然后当应力场达到某个临界点时,瞬间产生断裂等剧烈的动力变形,产生巨大的应力波。但我们暂时只能对剧烈的应力波传递进行有效的检测,而对前者——岩体中物质点位移和相应应力场的准静态变化——无能为力,因为断裂等发生具有随机性(受不稳定的边界条件影响)。这种随机性注定了地震本身是不可能完全准确地预测的,这也是“地震不可预测”观点的根本论据。但从科学的角度来说,只要在“某个时间段内给出具有一定置信度的预报”就能认为是预测。地震比气象更难预测,现在地震预测不能做到天气预测那样准确的问题和难点有二!
a1. 控制方程和分析模型不准确。 这点容易理解,不同于大气(流体,连续,含有固、流耦合边界)预测,地震预测涉及流、固两态,而且是非均质,各向异性,不连续的问题。据我了解,目前很多地震模型都是基于连续体(或加入间断层)模拟的,但这点和实际上偏差较大。不过现在很多学者开始尝试用散体模型来分析(如中科院的陆坤权教授),希望能得到更合理的结果。其次,诱导地震的机理和控制方程现在也没有很完善的理论。
a2.地震可能属于自组织临界系统(self-organized criticality system), 这种系统里动力学的吸引子正在临界点上,因此它具有高度的不稳定性和随机性。任何微小的变化都可能导致完全不同的后果。地震的次数和震级服从幂率分布(古滕堡-里克特定律),这正是自组织临界系统的特点之一。
b. 边界条件检测的成本过高。在庞大地壳中大量深源安放检测器可能也是一件需要大量时间和资金才能实现的事。而且仪器要防热,防压,防水的确也不是简单易做的问题。
希望科学发展到有一天能够预测地震,避免人们遭到灾难。7月22日。
7月23日,如何利用SPSS进行医学数据正态性检验?
医学参考值(medical reference value),是指包括绝大多数“正常”人的人体形态、功能和代谢产物等各种生理及生化指标的常数,也称正常值。而“正常”人的生物医学数据随着环境、时间等条件在一定范围内波动,这个正常范围的波动即为医学参考值范围(medical reference range)。下面,我们一起来看看如何用spss统计软件中的正态分布法来确定单变量样本的医学参考值范围。 下方视频中有完整的理论讲解、spss中的操作步骤、分析结果的解读。
操作步骤:打开spss统计软件,依次点击“分析——非参数检验——1个样本”。
数据分析思维和业务的理解,是分析师赖以生存的技能。
这个背后就是一种算法的能力,我们在浙江高速做了一个最大的算法级别的项目,这个项目非常简单,就是把所有的在高速上手机的信令搜集回来,然后通过信令的切换,能够预知到,未来两三个小时,高速拥堵的情况,那么这个准确率达到了92%,这个是非常难的,此之前的世界纪录是80%。数据能力靠模型和历史数据预测能力达到92%,对于非常复杂的交通环境,这是一个世界级的算法专家才可以做到的。
8月1日
了解到了医疗试剂的稳定性分析,可以对测试结果进行稳定性、瓶间差分析,还可以统计阳性率,什么叫阳性率,目前了解的就是异常率。
稳定性分析里面有一个回归分析。
8月4日,应该在学习统计学知识的同时,培养自己的数据思维方式。思维方式才是最重要的。
我在想怎么考察和培养一个人的数据分析能力,那就先拿我自己做实验吧。
考官:首先给出你一份杂乱无章的原始数据,你能从里面看出什么?
我:不好意思我什么都看不出来。
考官:那你会怎么做可以让你看出点什么来。
我:首先我会通过一些方式了解这些指标的含义,
其次我会问我的需求方你想知道什么,
然后朝着需求方的目标建立我的统计模型
再通过我的知识和技能去实施统计过程
输出我的数据分析报告,将其可视化。
拿给我的需求方,看有什么意见,再修改。
总结这个过程的不足,完善我的统计流程。
这便是我的完整的数据分析思路。同时我自己也是我的需求方。其实我对这个词不是很感冒,我更愿意说我想要做什么,怎么去做。
2019年6月10日
圣人:什么是机器学习?
雪雪:就是教机器学习;
圣人:那什么是教机器学习?
雪雪:打比方说给机器做一道题,教它去逐渐探索做这道题的规律、方法,然后将这道题千变万化再给它做;训练它适应新事物的能力;这种能力在机器学习里面称为‘泛化能力’(generalization ability)
哈哈哈哈哈哈哈,今天收获不错。
圣人:那我再且问你,你说数学与统计学有何不同?
雪雪:这个很简单,在数学的要求里数学是准确的、唯一的;而统计学是不准确的,是研究概率的。
2020年4月14日
专业能力和语言能力,齐头并进。
永远训练自己学习新东西的能力,混江湖,没有一技之长,如何行走。
学东西,只有自己能讲出来,才算学到了;能学以致用,才算学会了;否则只是学习了。
只有自己搞懂了熟练应用,方能传授他人,否则便会误人子弟。
第一次接触P—B回归;对原理的理解和学习。