快捷分类

基于综合智能信息的医疗数据采集平台

更新时间：2016-07-05

1　引言

目前医院的临床信息系统已经相对较多，但近几年在医院信息化建设过程中，“数据孤岛、服务割裂”的现象越来越明显，各系统的数据不能得到很好的采集和整合[1－3]. 同时医院同一科室在用设备种类繁多，有些比较陈旧，甚至不支持数据对外输出. 随着医院信息化建设的发展，临床和管理信息系统积累了大量数据，但由于信息系统的复杂性和多样性，导致各系统间数据分散，标准不一致，难以实现交换和共享. 通过建立统一规范的数据采集平台，可以解决医院存在的这些问题. 为推进信息标准化工作，促进标准的规范和使用，实现分散数据资源的集成和利用，建立一体化的信息集成平台成为迫切需要解决的问题.

统一的平台符合国家卫计委提出的各大信息系统互联互通的原则，遵循HL7、DICOM等通信标准，进行数据采集存储[1]. 对于不支持对外输出的设备，通过人工智能技术，软硬结合的方式，运用智能摄像头，抓取设备数据，进行数据识别存储[4－11]. 该技术能解决业界信息化厂商无法获取众多设备数据的难题.

基于OCR（Optical Character Recognition）技术的医疗图像数据采集平台，采用OCR技术[4－8]，直接从屏幕界面上抓取直观数据，不需要花费时间和成本集成设备、解析数据. 可以统一解决医疗设备新旧不一、数据接口不一致等造成的数据提取难题. 通过统一标准的数据采集平台采集医院各大系统的患者临床数据，经加工整理、归档及分析，再通过互联网无缝对接数据分析应用平台，为科研、精准医疗、药厂制药等提供有效的数据应用.

在进行临床急诊时，医护人员往往需要手写医嘱、记录病情并输入医院的信息系统中. 不仅浪费抢救时间，还可能会出现人为失误. 而嵌入式语音识别系统可借助固定或便携可穿戴设备进行语音识别，通过芯片中的语音处理及识别算法，将语音转换为文字或指令进行记录，并自动进行说话人识别（Speaker Identification）和说话人确认（Speaker Verification）[12－16]，而后进行语音电子签名. 语音信息可被转录成文字并显示在HIS系统、PACS系统、CIS系统等希望输入文字的位置. 基于树莓派的嵌入式语音识别系统，可以解决由人工录入而导致的医嘱信息错误，记录耗时等问题. 本系统能够减少人力资源的消耗，提高医护人员的工作效率，产品成本可控，可移植性较强.

2　实施原理及过程

本系统分为3个模块，图像识别模块、语音识别模块、综合数据集成模块. 图像识别模块负责收集医疗设备的图像数据，而后对数据进行识别处理，再将识别的结果通过Http请求传输到上位机中并显示. 语音识别模块则负责收集医生护士的语音信息，进行语音识别和说话人身份确认，最后将讲话的内容转录成文字并显示在HIS系统、PACS系统、CIS系统等希望输入文字的位置.

这是一个很有趣味的问题.直观感觉有两种结果,也就是镜面与水平面成70°角或20°角.却不知不觉犯了与文[1]所指的同样错误.原来学习光学让我们产生了思维定势,误将问题限定在同一平面中考虑.其实,许多人都有这样的生活体验,当阳光射入室内时,用一面镜子可将光线反射向每一个角落.因此,这一问题应在三维空间中进行思考.这就需要借助处理空间线面关系的数学模型.所以,该问题是体现数学与生活及其它学科间联系,培养学生解决问题能力的好素材,有助于学生认识数学的应用价值.

2.1　图像识别模块

视频采集模块负责对医疗设备图像数据的采集，采用的是树莓派自带的 Pi Camera. 摄像头插入到树莓派的CSI Camera Port接口中，若安装正确，在树莓派系统的/dev目录下便会出现video0节点，此时只要在树莓派上打开摄像头模块，就可以使用摄像头进行图像的采集.

参考文献：

图1　图像识别流程图

如图1所示，技术方案依次包括以下步骤.

S1：由摄像头采集医疗数据图像，对采集的医疗数据图像进行预处理；

据介绍，菌肥的功能性微生物是从生姜种植土壤中分离筛选所得。使用该菌肥的生姜在种植期苗齐、苗壮、株高、色泽深绿、分支多，有效防控了生姜土传病害，同时也可改良土壤，增加土壤团粒结构，提高土壤的通气、透水、保水保肥能力，最终实现生姜的高质高产。

S2：字符切割：将预处理的医疗数据图像的前景与背景分割开，再将前景中待识别的字符串切割成一个个的待识别字符；

S3：将待识别字符的HOG描述子作为训练后的判别模型的输入参数进行字符识别；

S4：将字符识别数据发送至上位机；

着眼于全美国的中美文化交流，早在2005年推出的“中国文化节”在整个10月风靡了首都华盛顿特区，成为当年在美国引起巨大反响的文化交流盛事。作为文化节压轴戏的中国经典话剧《茶馆》在全美巡回演出，让这壶浓香四溢的中国酽茶饮醉东西南北的美国人。

训练后的判别模型通过以下步骤进行训练.

S101：对采集的医疗数据图像进行预处理；

S102：字符切割：按阈值i将预处理的医疗数据图像前景与背景分割开，再将前景中待识别的字符串切割成一个个的样本字符，所述样本字符为0～9共10个字符，i取不同的值m次，共获得10*m个样本字符；

S103：对样本字符以一度为步长分别进行左右各n次转动，得到20*m*n个样本；

S104：提取每个样本的HOG描述子，将最终得到一个描述子集作为训练样本来求SVM的判别模型.

上述待识别字符的HOG描述子以及样本的HOG描述子通过以下方法得到：对图像进行网格化，在每个单元格内利用梯度方向直方图统计梯度信息，每4个单元格为一块，在块内4个单元格内像素点进行加权投影得到4*9共36维的特征矢量，最终图像内所有块内特征矢量集合即为HOG描述子.

上述S1和S101的对采集的医疗数据图像进行预处理是对医疗数据图像进行倾斜校正，倾斜校正包括以下步骤.

S301：应用canny算子进行边缘检测；

S302：计算倾斜角，通过霍夫变换公式将图像空间中像素点变换到检测参数空间中，参数空间中一个点还原到图像空间中即为一条直线，图像空间中每个像素点，经过变换公式得到一条在参数空间中的曲线，同一条直线上的点在参数空间中的变换曲线相交于一点，在参数空间里统计每个位置上曲线相交次数，相交次数最多的位置在还原后的图中也就是最长的一条直线，由该直线的斜率获得倾斜角；

S303：检测出倾斜角后进行空间坐标变换和插值运算，对图像进行旋转完成倾斜校正.

字符切割包括以下步骤.

S401：二值化，首先将图片灰度化，灰度图可以分为包含待识别字符串的前景和不包含待识别字符串的背景，根据类间最大方差准则确定二值化阈值；

S402：形态学处理，通过腐蚀运算消除边界点，使边界向内收缩；

要保护捕食螨。捕食螨是许多益螨的总称，其范围很广，包括赤螨科、大赤螨科、绒螨科、长须螨科和植绥螨总科等。捕食螨是一种杂食性益螨，主要食物是柑桔红蜘蛛、锈壁虱等植物叶螨，是柑桔红蜘蛛的天敌。利用捕食螨防控可替代化学防治方法，对生产无公害、绿色脐橙非常重要。

S403：垂直投影，对经过形态学处理的二值图进行水平方向上的投影，据投影图特征将字符串分割成一个个字符.

本系统方法不需要根据设备厂商协议去解析和集成数据，可以自动采集集成数据. 并且基于OCR技术的图像数据在智慧医疗中的应用通过图像识别技术对数据进行智能化存储识别，对传输到Web端的数据有效集成，解决医院信息化建设过程中，“数据孤岛、服务割裂”的问题. 语音信息的识别存储可以识别到具体的人，医生可以进行语音签名，口头下达医嘱，并将之转化成文字存储. 避免了设备陈旧不支持对外输出，医护人员需要手动抄写数据等弊端. 提高了医护人员工作效率.

年轻刑警听到这儿，猛地拧了下眉头，一拍桌子说，喂喂喂，想玩滑头不是？给我交代仔细点儿，说，你到底是怎样跑出来的？到底为什么要跑出来？

2.2　语音识别模块

本模块采用独立成分分析（Independent Component Analysis， ICA）[13－14]实现盲信号分离，结合PCA[15]做预处理. 并采用基于梅尔频率倒谱系数（MFCC）＋高斯混合模型（Gaussian Mixture Model，GMM）[16]的说话人识别算法，实现说话人识别及语音签名. 如图2所示，语音盲分离与说话人识别的处理流程如下.

对测试语音同样进行特征提取，与系统训练时产生的模型进行比较，相似度最大的即判定为说话人.

手机服务器通过TCP协议管理多个手机终端。同通讯服务器一样，对首次登录的手机终端进行监权，成功连接后，通过轮巡的方式依次接收每个手机终端的请求数据包，按照事先约定的TCP协议中不同命令请求发送相应的应答数据包。手机终端可实现功能包括查询历史数据、显示实时数据、显示报警信息以及修改报警阈值等。

图2　语音信号分离与识别流程图

S2：对采集到的观测信号x( t)进行盲源分离；

S3：分离后得到声源矩阵

采用独立信息系统集成网关，以存储过程、视图、Web Service及其他数据同步机制，按需访问HIS、PACS、RIS、LIS、EMR等服务器，选择性同步患者住院信息、医嘱信息、检查信息、检验信息、病历等数据到数据库服务器. 搭建综合数据集成平台（CDR），通过智能型数据采集平台和OCR系统的配合，可以有效采集各科室信息系统数据，并汇总到临床数据中心，进行数据统一管理. 通过对数据的整理分析，可将有效数据进行输出，返回供医院医生参考使用. 结构图如图3所示.

S5：最终得到目标语音.

[5]ANTANI S， CRANDALL D， KASTURI R. Robust extraction of text in video[C]. Barcelona∶ IEEE computer Society， 2000.

S201：假设源信号彼此间独立且是非高斯分布的，采用线性混合模型x( t)=As( t )，其中A是未知的M*N混合矩阵. 分离源信号S=A−1 x ，为了方便书写，用表示A的逆矩阵（或广义逆矩阵），于是上式变成S=Wx.

S202：当独立成分的个数小于混合信号个数时，混合矩阵A不可逆使用主成分分析（Principal Component Analysis，PCA）降维，实际上就是降噪使得混合矩阵A可逆.

感知风险是指消费者在使用无现金支付时，主观认为使用该支付方式带来的风险程度。消费者在无现金支付过程中可能面临病毒入侵手机、手机丢失、操作失误等带来钱财损失的财务风险，也可能面临身份信息、银行卡信息等个人信息被泄露甚至非法使用的隐私风险。消费者对风险的感知程度不一致，不同程度的感知风险，将会影响其对无现金支付的感知价值。

从8月3号开始，这栋楼的耗水量直线上升，直到8月7号之后开始平稳，经与系统中设置的往年同期耗水量进行对比后，发现日均耗水量比去年同期上升了60%左右，平台发生了报警，显示5号楼用水量异常。管理者根据报警情况立即对5号楼周围的管网进行排查，历时半个月，在五号楼外面的地下水管发现爆管位置，经过抢修，用水量在9月份回落到正常范围内。

S203：白化，本质上是去相关加上缩放，它要求信号经过变换后具有单位方差，同时彼此之间不相关.因此，以 PCA 形式展开可以得到

其中，E是以协方差矩阵Dy 的单位范数特征向量为列的矩阵，D是以Dy的特征值为对角元素的对角矩阵.

S1：麦克风列阵采集多通道语音信号，记为观测矩阵

2.3　综合数据集成模块

S4：对分离后得到的S( t)进行说话人识别；

图3　基于综合智能信息的医疗数据采集平台整体结构图

3　系统测试及分析

利用从医疗设备显示屏图像中采集的数字字符集进行分类器的训练，调整Pi－camera角度使得字符倾斜角不超过20°，再利用训练好的分类器进行字符识别并传输至raspberry处于同一局域网内的上位机，在上位机中查看当前帧及其处理结果. 测试设备包括：树莓派三代B＋；800万像素 Pi Camera；显示器；华为双频无线路由器等.

3.1　图像识别测试

如图4所示，利用在医院拍摄的一段视频作为测试视频. 以下表格的测试数据是从视频中截取出来的一部分数字图像. 我们在同一设备上，将不同倾斜角度的字符的数据作为测试数据. 以5°作为一个步长，以0°为基准，左右±20°，15°，10°，5°作为测试数据. 图5是以0°，－20°为例的测试情况.

图4　图像识别模块工作图

针对测试的视频，从测试结果统计字符识别系统并未出现误差. 但在摄像头采集视频有抖动时，“0.26”被错误识别为“2..2.6..”，“395”被错误识别成“.39.5”，“712”被错误识别为“712…”，这是由于在首帧进行鼠标选区后，系统会对区块内各体征参数值进行定位，为提高OCR运行效率，后续帧直接根据首帧的定位进行字符的识别，而根据观察发现，由于摄像头不稳定导致的视频抖动会使得对后续帧中体征参数的定位是错的，最终造成上述错误的识别结果. 该系统需对摄像头进行固定.

3.2　语音识别测试数据

采集混合语音，3位说话人同时发声，录制的混合信号长度为3 s，选定其中一位为目标说话人，首先进行盲源分离，得到单独的恢复语音，然后做特征参数提取操作，分别与目标说话人的参数模型进行匹配，最为相近的视为同一个人，并将对应的恢复语音放大输出. 这一部分的系统平均运行时间如表1所示.

从表1中可以看出，语音分离和识别部分总用时略小于语音信号本身的长度，基本满足医疗信息化实时性需求.

表1　系统平均运行时间

操作　时间/s混合语音分离　2.33目标说话人识别　0.32

图5　0°和20°的测试

4　总结与展望

一般情况n不小于20.

上庄乡也对舍饲羊养殖提出了针对性的饲养管理，根据羊的不同生长阶段对其营养需求进行调配补给。如针对出生4个月以内的羔羊应该在其出生后20 d左右开始补充饲喂精饲料，逐渐过渡到饲喂青饲料。育成羊阶段要在其断奶后、配种前进行牧草与精料的混合饲喂，这样可有效提升羊的体力，对其健康生长也有很大帮助。

在以教师教为中心的传统教学中，教师是知识的传授者。但是，在以学生的学为中心的现代教学中，教师的角色行为则表现在：通过预测学生的特征，帮助学生确定适当的学习目标，并尽力协调学生找到达到目标的最佳途径；指导学生掌握学习的策略和发展能力；创设丰富的教学情境，激发学生的学习动机和学习兴趣，充分调动学生的积极性。可见，教师在学生的学习中，主要是为学生提供资料和辅助学生学习，由学生知识的传授者转换为学生学习的促进者。

[1]雷赫. 8500亿牵动医疗信息化[J]. 中国计算机用户， 2009，11（10）：55－57.

[2]侯晓林，曹梅红. 面向病人全生命周期医疗信息系统构架和关键技术的研究[J]. 计算机工程与应用， 2005，16（1）：126－130.

[3]陈晓勐. 医疗信息系统中的网络安全问题[J]. 红外，2002，12（8）：78－82.

[4]ABADPOUR A， KASAEI S. A new parametric linear adaptive color space and its implementation[C]. Rome∶ IEEE Computer Society, 2004.

步骤2进行盲源分离的步骤如下.

[6]ANANG HUDAYA M A. Recognising Patterns in Large Data Sets： A Distributed Approach[D]. Clayton∶ Clayton School of Information Technology, 2011.

[7]AI C， HOU H， LI Y，et al. Authentic delay bounded event detection in heterogeneous wireless sensor networks[J]. Ad Hoc Net，2009，7（3）： 599－613.

3）手机端APP则是与这些网络教学系统相对应的手机端操作系统，如雨课堂基于手机端微信平台开展教学活动，师星学堂基于手机端学习通开展教学活动，EZStudy教学反馈系统同样有自己的手机端应用APP。

[8]LAGANIERE R. Opencv 2 Computer Vision Application Programming Cookbook [M]. Birmingham： Packt Publishing Ltd，2011：5.

[9]白俊江，洪春勇. 基于Sobel的边缘检测方法[J].电脑知识与技术，2009，5（21）：5847－5849.

[10]边肇祺，张学工.模式识别[M]. 北京：清华大学出版社，2000：16－30.

[11]朱伟，赵春光，欧乐庆，等. OpenCv图像处理编程实例[M]. 北京：电子工业出版社，2016：5.

[12]REYNOLDS D A. Speaker identification and verification using Gaussian mixture speaker models[J]. Speech communication， 1995， 17（1）： 91－108.

大宗伯之职，掌建邦之天神、人鬼、地示之礼，以佐王建保邦国，以吉礼事邦国之鬼神示：以禋祀祀昊天上帝，以实柴祀日月星辰，以槱燎祀司中、司命、风神、雨师。以血祭祭社稷、五祀、五岳。……以玉作六端，以等邦国：王执镇圭，公执桓圭，侯执信圭，伯执躬圭，子执谷璧，男执蒲璧。……以玉作六器，以礼天地四方，以苍璧礼天，以黄琮礼地，以青圭礼东方，以赤璧礼南方，以白琥礼西方，以玄璜礼北方，皆有牲币，各放其器之色。

[13]檀蕊莲，刘建平，李哲，等.说话人识别技术及其应用[J].信息技术，2007（12）：23－25，29. DOI：10.3969/j.issn.1009－2552.2007.12.008.

[14]HYVÄRINEN A， OJA E. Independent component analysis： algorithms and applications[J]. Neural networks， 2000， 13（4）： 411－430.

比特币地址=Base58{Hash160||前4字节（SHA256(SHA256(Hash160||地址版本号）））}

[15]梁胜杰，张志华，崔立林，等. 基于主成分分析与独立成分分析的降维方法[J]. 系统工程与电子技术，2011，9（8）：2144－2148.

[16]REYNOLDS D A， ROSE R C. Robust text－independent speaker identification using Gaussian mixture speaker models[J].Speech and Audio Processing， IEEE Transactions on， 1995， 3（1）： 72－83.

作者

刘永俊，刘亚，茆寿允

基金

分类号

出处

《常熟理工学院学报》 2018年第2期

上一篇：扫地机器人的路径规划研究

下一篇：云存储关键技术研究

《常熟理工学院学报》2018年第2期文献

纳米多孔Pt-Y合金的制备及电催化性能研究作者：崔荣静，韩志达

高电压正极材料镍锰酸锂的表面包覆及其电化学性能作者：马腾飞，徐婷婷，宗意恒，杨刚

磁性弹热制冷材料概述及特性分析作者：刘剑，赵德伟

一次球磨前后柠檬酸加入量及顺序对Li3V2（PO4）3/C性能的影响作者：王媛婷，孙萍萍，庄伟嘉，焦景轩，范奇，徐庆宇

倾斜溅射FeCoDy薄膜静磁性能与磁化反转机制作者：李霞，徐展，张志，胡芳，刘二，徐锋

NiCoMnSb合金的相变和多功能特性研究作者：姚杨，许佳昊，师帅，金逸飞，韩志达，房勇，钱斌，江学范

110 kV变电站通信调度部分的电气设计作者：刘燕，王栋梁，滕晓敏，陆晓晨，秦艺峰

风力发电机周边环境实时监测装置的设计作者：袁青松，高琳琳，周玮，姚建红，李玉茹

面向智慧城市的社区环境监测系统设计作者：黄嘉航，陈明杰，秦桥，周学礼

基于扩展粒子群优化的支持向量机短时交通流预测作者：王锦添，蔡延光，黄何列，戚远航

缸套材质对汽车发动机温度分布的影响作者：张鑫，左克生，沈征江，陈庆樟

轴差前壳断裂失效分析及改进措施作者：胡顺安，季美玲，闫连龙，尚国瑞，陈庆樟

基于STM32的车内环境舒适度调节器设计作者：周玮，姚建红，袁青松，高琳琳，滕飞

汽车轮毂轴承单元摩擦力矩的测试与分析作者：李雪原，雷良育，张辉，董亮，刘兵

高Fe含量铝合金中优化富Fe析出相形态的工艺试验作者：孙德勤，袁国超，王天华，刘峰，吴强

基于fMRI数据的改进模糊聚类算法研究作者：张斌，黄婧，周国玉，王丽君，严霄，汤晓燕，况亚伟

基于边缘检测技术的果品分级方法研究作者：李承龙，鲁明丽

扫地机器人的路径规划研究作者：王亮宇，毛丽民，徐星宇，陈煜

基于综合智能信息的医疗数据采集平台作者：刘永俊，刘亚，茆寿允

云存储关键技术研究作者：张文锦，汪金虎，蓝芳萍，钱振江

变分数阶非局部边值问题的再生核配置法作者：孙雪，李秀英，唐玉洁

IGOWTA算子组合预测模型在单时间序列中的应用作者：刘攀，冯长焕

江苏省生态足迹时空变化分析研究作者：施伟，查雨清，郭翔，马唯竣，刘慧萍，姚红

伊宁市夏季PM2.5载带多环芳烃污染特征及来源解析作者：胡锋，王兴磊，赵晶

不同预处理条件下稻秸秆性能研究作者：刘军军，满增光，郭兰中，牛曙光，何春霞

杂志信息网

基于综合智能信息的医疗数据采集平台

1 引言

2 实施原理及过程

2.1 图像识别模块

2.2 语音识别模块

2.3 综合数据集成模块

3 系统测试及分析

3.1 图像识别测试

3.2 语音识别测试数据

4 总结与展望