「科研」这几个非肿瘤临床数据库你不会不知道吧(一)

上篇文章提及了几个公共的临床数据库,可能有小伙伴已经迫不及待想来分一杯羹了,毕竟基础实验上手难,周期长,重复性差,不一定有结果,有结果也不一定是你想要的趋势。而临床研究,只要有数据,利用各种花式统计分析来一套,凑上几张图表,发个要求不高的SCI还是可以的。但前提是如何获取数据。今天我就来分享几个数据库获取数据的方法吧。

当然,我说的是非肿瘤数据库。怎么样,对于你是不是正中下怀?是不是深得你心?因为在数据库方面,不论是生信分析还是临床研究,肿瘤领域可谓是不胜枚举独领风骚,而非肿瘤则是一贫如洗,两袖清风,三阳开泰,四通八达……不好意思没刹住车。总之,就是你看到的关于数据库的介绍大部分都是肿瘤的,而非肿瘤的寥若星辰。闲话少叙,直奔主题吧。

1 MIMIC III https://mimic.physionet.org/

MIMIC全称是Medical Information Mart for Intensive Care, 是一个重症医学数据库。2003年,在NIH的资助下,来自贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)、麻省理工(MIT)、牛津大学和麻省总医院(MGH)的急诊科医生、重症科医生、计算机科学专家等共同建立的一个数据库。

MIMIC III 目前的版本是1.4 (V1.4),共包含了2001年6月至2012年10月间在Beth Israel Deaconess Medical Center住院的38645名成年个体和7875名新生儿的的58000余次住院资料,包括患者在急诊和ICU治疗期间基本信息(年龄、性别、基础病史),住院期间完整的诊疗信息(治疗措施、药物,生命体征、实验室检查等)以及临床结局等信息。这些资料被整理成了26个CSV格式的表格供研究者免费查询和获取。


MIMIC 官网

以上两段是整合网上的信息,给大家一个直观的介绍,这些并不重要。我们只要知道有一群牛逼的大佬共同组建了一个危重症患者的数据库,包含了很多数据,这些数据隐藏了患者的姓名等隐私信息。重要的是,这些信息可被研究人员免费申请获取并用于发表论文。免费,没错,这谁顶得住。

大家可以去Pubmed 用关键词MIMIC搜索下,截止目前为止,已经有328篇文章了,IF从2分到25分不等,但是浏览下标题,会发现大多数是关于sepsis的。这也不奇怪,因为这些数据本来就是从急诊和ICU收集的。那么其他科室有用武之地吗?以“heart failure” 和MIMIC 检索下,只有13篇文章,而且分值都不高。说明可以用,但是可能不太好找idea。其他科室也可以相似的方法检索下,看看MIMIC对你的价值多大。


pubmed 搜索


pubmed 心衰文章


因为网上对该数据库获取数据的方法步骤有了非常详细的教程,我就不再赘述了。大家可以在微信里搜索 MIMIC III,你会得到一大把的推文和公众号,我推荐 医学方,这个号有关于MIMIC 的专题系列文章,看完一定获益匪浅。不过因为这些推文有些早,而网站有更新,有些步骤可能需要自己摸索下。以你们的智慧,应该是没问题的。哦,自信点,把应该去掉。


大致的步骤如下:CITI网站注册账号→学习“data or specimens only research”课程和参加考试→获得CITI证书→physionet注册账号→提交申请→授权后下载数据。看上去有点繁琐,但是作为一个样本庞大又免费的数据库,比起自己建数据库,付出这点努力是很值当的。很多同学看到要学课程还有考试可能就感到头大,“难不难”、“时间长不长”、“我这种英语渣渣能考过吗”。负责地告诉你,这不是高考这种选拔人才的考试,目的也不是要考倒你。课程总共有9个模块,8个需要答题。你如果有兴趣,可以一个一个模块点击看看,有两种模式选择,一种是长文本自己阅读,一种是网站把文本转化为PPT并且有声朗读,都比较费时,建议第二种,毕竟懒惰是人的天性,而且PPT把文本结构化,便于记忆和理解。每个模块看完后点击QUIZ答题,3-5个选择题,如果你认真看了课程,答题不在话下,如果你是划水的,那就蒙吧,因为提交答案后,系统会给出正确答案,你可以记住,然后再次答题,重题率很高。所有模块答题平均得分90就可以获得证书了。


CITI证书


completion report


获得证书后去physionet提交申请,注意是提交completion report而不是证书,然后就是慢慢等慢慢等慢慢等(这首歌有点上头了)。以前是2周内给回复,网上有人品爆棚的3天左右就得到回复,但是现在改成4周了,我的申请已经快4周了,自己邮箱和导师邮箱翻了个底朝天,然鹅仍然杳无音信,打算4周后催催。


可能有同学摇头了,折腾这么久,还要等一个月,还是洗洗睡吧。你给我起来,我早就说过,没有什么事是一沓钱不能解决的,如果有,也不需要两沓。所谓有人的地方就有江湖,有利益的地方就有交易。有人早就察觉到你们的痛点了,所以就专门有这样的数据搬运工,医科研 了解一下,各个数据库搬运,价格感人。尽管MIMIC明确规定数据只能申请者本人使用,不得分享,但是你懂得。如果你视金钱如己命,那么 经管之家 论坛了解下,有人也共享了数据。还是那句话,办法总比困难多。


不过,还是得给大家打个预防针,毕竟样本有几万人,而且各项信息齐全,体积自然不小。据一位不愿透露姓名的网友说,整个数据有40+G。估计你要满脸黑线了,存储这些数据我的电脑都要卡成砖块了,那恭喜你找到个换新电脑无懈可击的理由了。然后,后面数据分析也并不简单,需要一定的编程基础。你心中此时可能有千万只某种马呼啸而过,看了这么久,看了个寂寞。我想说的是,任何事如果你要比别人优秀,那你就得付出比别人多的努力和精力。反正,你用或者不用,这个数据库就在那里。你不用别人可就用了。


好了,没想到就有这么多字数了,本来想一次性分享完,限于篇幅,剩下的数据库下次再分享吧。

举报
评论 0