更全的杂志信息网

大数据技术的本体论追问:数据实在,技术实在,还是关系实在?

更新时间:2016-07-05

大数据时代的到来让人们对大数据津津乐道,学界也对大数据展开了全面而热烈的讨论,人们欣喜地看到大数据给社会生产、生活、思维等方面带来的革命性影响,也在为大数据带来的一系列伦理问题而深感担忧。但是,当我们口若悬河地讨论着大数据的社会影响和伦理隐忧时,我们是否应当追问:大数据究竟所指何物?换句话说,大数据的哲学本体是什么?对于这个问题,学界的研究寥寥无几,从而出现了大数据哲学研究的本体论缺位[1]。维克托·迈尔-舍恩伯格和肯尼思·库克耶在其大数据经典著作《大数据时代》也未对大数据的哲学本体进行过相关讨论。既然大数据已经对我们的生产、生活造成了深刻的影响,也给我们的思维带来了深刻的变革,因此,我们有必要对大数据的哲学本体进行反思和澄清。

2.1 3组病例一般情况比较 我们发现,3组病例间性别、年龄、及一些基础疾病(高血压病、糖尿病、脑卒中)患病率差异无统计学意义(P>0.05),见表1。

大数据还是大数据技术

大数据还是大数据技术?这是一个问题。关于这个问题,我们必须首先反思并澄清。

在国内学界,关于大数据或大数据技术的哲学研究中,尚未发现有学者对“大数据”与“大数据技术”之间的关系给出过解释或说明;从国外学者的研究看,目前也尚未发现有哪个学者对两者的关系进行过阐述。

大数据与大数据技术之间难道没有任何区别?答案当然是否定的,只是学界正混用这两个语词,尚未有谁想到要澄清这两个概念及二者之间的关系;或许澄清这两个概念及二者之间的关系并不是一件容易的事。笔者在此尝试对这两个概念及二者之间的关系做一辨析。

[4](英)维克托·迈尔—舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013.

1)法律法规、政策等文件方面:首先,国家法律法规层面:近些年出台的《中华人民共和国旅游法》《水土保持法》《野生动物保护法》《自然保护区条例》《环境保护法》等,在宏观上对环湖地区旅游的发展起到了指导作用。2、地方规章层面:2003年青海省人大常委会通过的《青海湖流域生态环境保护条例》,对环湖地区的生态环境保护起到引领性作用;2015年1月1日起实施的《青海湖景区管理条例》对景区规划、建设、景区管理以及景区保护等方面做出规定;2011年实施的《青海省旅游条例》,对全省旅游活动进行规定。

但是,维特根斯坦说:“凡是可以说的东西都可以说得清楚。”[7]23大数据不仅可以言说,并且正被广泛地言说着。从大数据作为被言说着的对象来看,它被析解为“大”和“数据”两个方面。“大”指的是“容量之大”和“意义之大”[6]1,“大数据”指的就是大到用传统手段、工具、方法不足以处理的数据,这样的数据是海量的,并且由反映同类现象、事件、事态的海量数据构成数据集。麦肯锡公司就把大数据定义为超出传统数据库管理软件处理能力的数据集[8],德国学者Ulf-Dietrich Reips则认为大数据是传统数据处理应用程序不足以应对的巨大复杂的数据集[9],我国著名数学家徐宗本将大数据界定为不能集中存储、难以在可接受时间内分析处理、个体价值低而整体价值高的海量复杂数据集[10]。从大数据的这种本体论定义中我们可以看到,大数据具有Volunme、Velocity、Variety、Variability、Value的5Vs特征[11]

如果将大数据界定为具有5Vs特征的数据集,这样的定义对于一个有历史和丰富内涵的概念来说未免过于简单和武断了。为了厘清大数据这一概念,我们有必要对其展开历史性的追溯。历史地看,大数据的发展经过了微数据—小数据—大数据这一历史演进脉络[5]。在大数据的历史语境中,数是首先呈现的。原始人在自然崇拜中产生了数的观念,随着对数的认识不断发展,当数被刻入木头、石块、兽骨等物以做计数之用,即当数被符号化并作为符号来传达或保存信息,数即呈现为数据解蔽着世界[12]32-37。在存在主义现象学看来,技术的本质即为解蔽[13]。因此,随着数的多量化,当数通过符号化呈现为数据,数据也就在这一进程中最终绽放为技术[12]32-37。数据绽放为技术,大数据也就在数的始源处绽放为大数据技术。这样,从大数据的历史生成过程看,大数据即为大数据技术。

大数据在数的始源处绽放为大数据技术,这是科学理性的观点。然而在工具理性看来,大数据并非作为数据而独立存在,它渗透着主体的价值诉求,因而总是作为手段、工具、方法而广泛应用于工业、商业、医疗、政务管理等各个领域。大数据作为工具、手段、方法的应用即为大数据技术,在这个意义上,舍恩伯格和库克耶将大数据界定为“……采用所有数据的方法”[4]39。现代社会正是如此,人们每天都在生产、生活的过程中制造了海量数据,通过对这些海量数据的数据挖掘,各种组织(包括企业、政府、其他各类社会团体等)在各自领域挖掘出其数据相关性,从而实现对这些海量数据的数据应用,这就是大数据技术。

通过以上分析可知,大数据并不等同于大数据技术,二者之间既相互区别又密切联系。首先,大数据是传统工具、手段、方法均难以处理的海量数据集;其次,大数据是历史生成的,从其始源处看,大数据绽放为大数据技术;再次,大数据不是以本己方式独立存在的,它负荷价值,在应用中呈现为大数据技术;最后,大数据技术从始源看是技术解蔽世界的数的开显方式,从现存形式看则是大数据在生活世界的应用。

由于大数据并非独立存在,在其始源处大数据绽放为大数据技术,在现实应用中大数据开显为大数据技术,在这个意义上,我们认为大数据即大数据技术,本文倾向于使用“大数据技术”一词。

那么,大数据技术的本体是数据、技术还是关系?

大数据技术的数据实在分析

首先,数据实在是大数据技术本体的基础。数的技术化应用造成了数据,而数据的技术性绽放则使得数据历经了从微数据到小数据再到大数据的不断发展演化,并使人类最终进入大数据时代,大数据技术成为信息社会关乎人们生产生活的一个重要事件。可以这么说,没有数据作为基础的技术化应用,没有微数据-小数据-大数据的历史运演,就没有数据的技术绽放与现实应用,没有人们的实践活动造成的海量数据,也不会有大数据技术的历史生成。进入大数据时代,在大数据技术的日益广泛的应用中,我们已经进入在某种程度上只能用数据说话以取得信靠,并通过数据呈现令人信服。因此,哪怕是从最广泛的意义上我们都可以说,数据实在是大数据技术本体的基础。

从词源上看,维基百科指出,数据(data)一词为拉丁文,是datum的复数形式,并把数据界定为“已知的或已知的事实,即(thing)given。”[14]舍恩伯格在《大数据时代》中也指出,“’数据’(data)这个词在拉丁文里是’已知’的意思,也可以理解为’事实’。”[4]104

[13](德)海德格尔.演讲与论文集[M].北京:生活·读书·新知三联书店,2005:10.

研究资料和研究结果等数据均采用SPSS23.0软件进行统计分析,计量资料和计数资料分别以±s和%表示,组间比较分别采用t检验和χ2检验,其统计学意义以显著差异P<0.05表示。

因此,数据即事实。那么,事实又是什么?维特根斯坦说:“世界是事实的总体”,“世界分解为诸事实”[7]25。就此,我们是否可以理解为事实——也即数据——是世界的本原?因为进入大数据时代,我们不得不面对这样一个事实,即“数据已经统治我们的世界”[16]。整个世界,万事万物,从自然界到人类社会直到人的行为与心理,都可通过量化最终被表达为0和1,正应了舍恩伯格提出的口号:“一切皆可量化!”[4]97当我们把一切皆量化为数据之时,毕达哥拉斯关于“世界的本原是数”的古老命题在信息社会重新焕发出了媚人的光彩。数的标记最终使其表达为数据,数据即事实,事实又在维特根斯坦的逻辑分析中成为世界的本原,循此逻辑演绎,如果我们把毕达哥拉斯的古老命题稍加修改为“世界的本原是数据”,这就更加契合大数据时代的基本论调了。

“世界的本原是数据”,这个观点正得到越来越多有识之士的回应。涂子沛在《大数据:正在到来的数据革命》一书中以数据为本原构建了一个包括数据、信息、知识在内的金字塔世界[6]88;张玲玲等则为人类从过去到未来构建了一个逐步囊括数据、信息、知识、理解、智慧等五要素的数据本原世界[17]。不过,在世界的物质本原成为常识的当下社会,世界的数据本原显然无法成为人们的普遍共识。但是,我们却在“世界的本原是数据”这一命题的观照下回应着大数据技术的本原,即大数据技术在本体上看是数据实在。

一方面,大数据技术赖以生成的本原即为数据。

在大数据技术的历史性展演中,首先是由数作为数据呈现,数据作为技术解蔽世界才在人类史中绽放出来。数究竟是如何从某些群组所共有的抽象属性中被概括和抽象出来的,关于这一具体过程我们已无法确证。但是,可以设想的是,一旦数的技术化应用产生,它必然携带或储存着信息而呈现为数据,并作为数据被记录和流传下来。在数的技术化应用并在这一过程中呈现为数据时,我们可以看到,没有数的技术化应用,则不会有数据;没有数据,信息无法被存储和传递。因此,在数据作为技术的历史绽放中,信息被提示和呈现,也即是说,数据承载信息,信息藉由数据得以贮存、传递、表达。

及至近世,哥白尼首先用数据数学化地向世人揭示了天体运行的奥秘,牛顿则在《自然哲学的数学原理》中用数学语言将自然界的秘密数据化呈现,这样,宇宙自然的信息也通过数据表达了出来并通过数据获得了合法性辩护。在数学成为科学的通用语言之际,数据的权重也就在世界数学化的过程中不断增加。当信息论、控制论、系统论、协同学、混沌理论、超循环理论等复杂性科学在20世纪创立并迅猛发展,当计算机技术、互联网技术、物联网技术、智能终端技术、云计算技术等的发展足以将自然、社会、人类(包括人的行为和心理)等都以0和1的数据形式记录并存储下来,并最终通过数据挖掘成为商业、政府、生活行为(行动、决策)的依据,大数据技术的生成已经不可避免了。

因此,数据即是大数据技术的本原,没有数据的产生与海量生产,大数据技术不可能产生,更不可能有大数据技术在当今时代的广泛应用。

另一方面,大数据技术的应用实际上就是数据的应用,是对海量数据的获取、储存、分析、处理。没有人类社会永不止息的实践活动造成的与科学发展相对应的微数据到小数据再到大数据的数据的发展与海量增长,没有人类实践活动留下的数据足迹形成的海量数据,大数据时代不可能到来,大数据技术的广泛应用更会成为无源之水无本之木。正是当代人类社会广泛而深入的实践活动留下的数据足迹,在对海量数据展开深入的数据挖掘中,形成了对海量数据的应用性处理,最终形成大数据技术。

如舍恩伯格在《大数据时代》给出的大数据技术经典案例——谷歌流感趋势(GFT),就是谷歌公司通过对每天来自全球超过30亿条搜索指令留下的数据足迹展开数据挖掘后对冬季流感传播作出的概率预测。其他公司无法完成这样的预测,根本原因在于“他们缺乏像谷歌公司一样庞大的数据资源”[4]3,当然也不具备如谷歌公司那样对庞大数据进行处理的能力和统计的技术。因此,大数据技术正如舍恩伯格所言,就是“以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见”[4]4。在大数据技术的应用中,没有数据,信息将失去承载;没有数据,我们的决策将丧失依据;没有数据,我们的行动将迷失方向。数据,海量的数据,已经成为现时代人们获得新的认知、创造新的价值的源泉,并将为改变市场、组织机构以及政府与公民关系服务[4]9

由是,在大数据技术的生成及应用的双重意义上我们说:大数据技术的本体是数据实在。

大数据技术的技术实在分析

由前述知,大数据技术在生成与应用的双重意义上均表现为数据本体。但是在数据的历史运演中,数据最终要实现其技术化应用。数据绽放为技术,大数据也就在这种技术绽放中成其为大数据技术。同时,正是海量数据获取、储存、分析、处理的技术应用,大数据技术才在这种商业、政务、生活等的现实应用中成其自身。因此,从数据到技术的大数据技术生成以及大数据技术的现实应用双重意义上,大数据技术的本体又表现为技术实在。

从数据的始源处看,数据生成于人对数的认识即数的观念的产生。在《大数据技术:从数的解蔽到数据的遮蔽之现象学考察》一文中,笔者已经就数到数据的历史生成做了力所能及的详尽阐述,我们同意卡尔·B.博耶在其《数学史》一书中表达的观点,即数产生于对神的排位[12]。随着人的认识能力不断提高,当对数的认识达到多量化阶段时,我们将其刻入木块、石头、兽骨等物中作为信息保存下来并历史地呈现为数据,而这些数据表达的正是神的排位等给出的事实。

军事英语的教学活动是一种创造性的建构活动,帮助学生习得语块就意味着向创造性的语言输出过渡。作为具有成熟分析能力的学习者,在这种创新性教学模式的引导下,通过对语块不断认知、总结和使用,学生一定能获得军事英语词汇生成规则并能创造性地产出和使用。

成素梅根据是否具有实物形态将技术实在划分为一级技术实在和二级技术实在,认为一级技术实在是科学仪器等经由人的技术活动创造出来的具有实物形态的技术产品,具有实用性与创造性的基本特征;二级技术实在则是借助于仪器(即一级技术实在)与对象的相互作用所获得的数据、图像等信息或借助高科技手段通过主体对信息的接受、加工、反馈和传递的互动过程营造出来的动态的“虚拟实在”等非实物形态的信息与环境,具有再现性与对象性两个基本特征[18]。对于成教授关于一级技术实在与二级技术实在划分中回环定义的逻辑矛盾我们存而不论,这里仅就其一级技术实在及其实用性、创造性和二级技术实在及其再现性、对象性的合理成分用作来对大数据技术的技术实在做一分析。

一方面,从技术实在的划分来看,大数据技术显然不是计算机、网络设备、终端设备等科学仪器或技术产品本身,从这个意义上说大数据技术不属于一级技术实在。大数据技术是借助智能终端设备、大型处理器、存储器等技术产品获取数据信息并对其进行分析、处理、应用,就此而言大数据技术应属于二级技术实在。

另一方面,从技术实在的基本特征看,大数据技术通过获取海量数据并对其展开数据挖掘以实现在工业、商业、政务、生活等领域的实际应用——如GFT预测,日本先进工业技术研究所的坐姿研究与汽车防盗系统[4]102-103——从而使大数据技术首先具有实用性特征。其次,进入大数据时代,大数据技术的广泛运用导致人的认知方式发生革命性变革,传统知识进化路径在大数据技术造成的奇点处发生分叉,大数据知识发现开启了知识创新的新道路[19];与此同时,大数据技术的绽放使得“数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。”[4]127数据作为资源其价值不仅不会在使用中被消耗,甚至在被反复使用中发生价值增殖,从而使得“‘取之不尽,用之不竭’的数据创新”成为可能。这样,大数据技术的创造性特点在知识创新与数据创新中展露无遗。再次,海量数据呈现的事物(事件)间的相关关系不会在数据挖掘中被改变、转移或消耗,因此,只要对这些海量数据展开同一价值理性的挖掘分析,必然会重现事物(事件)间的此种相关关系。这样,大数据技术也就具有再现性的基本特征。最后,大数据技术是对数据表征背后的事物(事件)间的相关关系展开挖掘分析,事物(事件)的表达即数据成为大数据技术的技术对象,大数据技术也就获得了对象性的特点。

由以上分析可知,从技术实在的划分看,大数据技术属于二级技术实在;从技术实在的特征看,大数据技术既具有一级技术实在的基本特征,也具有二级技术实在的主要特点。大数据技术作为技术实在的此种尴尬局面正源于上文提及的一级技术实在与二级技术实在划分的内在逻辑矛盾。或许肖峰从实体实在、功能实在、技艺实在等三个层次对技术实在所作的划分更为肯綮[20]157-160,能为大数据技术的技术实在提供更有效的辩护。

1.3.4 样品测试 打开电感耦合等离子光谱仪,预热至光室温度达到38℃,打开Ar 30min后打开循环水和通风设施,安装好进样管和排液管,点着等离子体。表2为ICP-AES的测试条件汇总表,其中雾化器和进样管有专门的要求。待等离子体稳定30min按照表2条件测试工作标准系列,再测试空白试样和样品,由计算机直接得出结果,乘以样品总质量得到降尘总量见表3。

4月11日,北京市商务委员会发布《关于申报2018年度第一批商务发展项目的通知》,对商务发展领域内18个方向的项目进行资金补助。重点支持商务发展领域内促进生活性服务业品质提升、推动商业便民利民发展的项目;符合首都城市战略定位的促消费、稳增长等公共服务平台建设和典型示范类项目。对符合标准和要求的项目采取项目补助、政府购买服务、以奖代补等形式给予支持。

肖教授指出,技术的实体实在是指人工制品或人造物等物性的、实体的存在[21]72-79。技术的实体实在“几乎在常识实在论的范围内”[21]72-79,因此,反思技术实在,我们就需进一步深入到技术的功能实在和技艺实在。技术的功能实在是指技术所具有的实在的真实的功能、作用和效应;技术的技艺实在是指活动或功能视域下技术使用必然牵涉到的技巧[20]

下面,我们就从技术实在的这三个层次对大数据技术的技术实在做一扼要分析。

大数据技术的生成离不开技术社会创造的计算机、智能手机、网络设备、存储设备等人工制品,这些人工制品也正是大数据技术在常识意义上的表现。没有计算机的发明,人类不可能进入到信息社会;没有网络设施、智能终端设备等的发明与发展,人类不可能进入大数据时代。因此,大数据技术的技术实在首先就表现为人造物等实体实在。其次,大数据技术被一再强调已经对我们的生活、工作、思维、政务、商业等产生了革命性变革,并使“人们获得新的认知、创造新的价值”,“为改变市场、组织机构,以及政府与公民关系服务。”[4]9GFT预测的成功以及日本先进工业技术研究所的坐姿研究与汽车防盗系统等经典案例也对此作了有效辩护,这就是大数据技术的功能、作用、效应,是大数据技术作为技术实在在功能实在层次上的体现。再次,大数据技术也是运用计算机、网络设备、智能终端设备等人造物获取海量数据并对其进行储存、分析、处理的使用过程,在这一使用过程中,必须具备相关的知识和能力,懂得相应的技术与技巧,否则便会如舍恩伯格对其他公司在季节性流感传播预测所做的分析那样,这些公司不能像谷歌公司一样作出这种预测,就是因为他们不仅缺乏像谷歌公司一样庞大的数据资源,也由于他们缺乏相应的处理能力和统计技术[4]3。这就是大数据技术在技艺实在层次上的技术实在之义。

在其生成处及现实应用上,大数据技术从实体实在、功能实在、技艺实在等三个层次上均统摄于技术实在,因此我们说,大数据技术的本体是技术实在。

大数据技术的关系实在分析

大数据技术不仅是数据实在和技术实在,它还是关系实在。实际上,无论是数据实在还是技术实在,由此我们都可以逻辑地推导出大数据技术的关系实在。

对照组患者采用常规的方式进行B超检查,仪器为飞利浦彩超仪,让患者保持仰卧,进行常规的腹部检查。观察组患者采用CT检查,我院使用的是GE64排128层CT,根据患者实际情况适当确定扫描范围。由专业人士设定扫描参数:管电流设定为200~250mA,管电压设定为110~130kV。矩阵为512×512,螺距为0.929:l。时间为0.9s,层厚为2.4mm。

大数据的技术绽放不是为了获得数据本身,即不是为了确认已知事实,而是为了揭示蕴含在海量事实间的某种相关关系。舍恩伯格强调指出,大数据的精髓在于我们分析数据时的三个转变,即变得更多、更杂、更好,所谓更好,就是揭示数据间的相关关系。大数据表达的是海量个体在工业、商业、政务、行为、心理等领域活动的海量事实,这些海量事实看上去杂乱无章,个体活动彼此分离,似乎无迹可寻,但实际上这些“被看做分离的个体的客体具有内在的关系,即这些关系并非伴随着这些分开的个体的非关系性质而产生。”[22]运用先进的数据处理设备,对这些看似由彼此孤立的个体活动造成的海量事实展开数据挖掘,就能揭示出它们之间的相关关系。因此,大数据技术作为数据实在表征着关系,作为技术实在则揭示出关系。

一方面,数据表征关系。数据蕴含着信息,是信息的载体;而数据即事实,事实总是释放出某种信息。以GFT为例,用户每次通过谷歌搜索引擎检索“哪些是治疗咳嗽和发热的药物”就会产生一条数据并被谷歌服务器记录和存储,将这条数据蕴含的信息释放,报道的就是“用户检索了‘哪些是治疗咳嗽和发热的药物’”。那么,用户为什么要在谷歌搜索引擎上检索该词条?可能是因为用户(总之是某人)患了流感。这样,这条数据与流感的关系就建立了起来。如果有大量用户通过谷歌搜索引擎检索该词条并产生海量数据,通过数据挖掘,谷歌公司就可做出流感爆发的预测。如果用xn表示某用户在谷歌搜索引擎检索“哪些是治疗咳嗽和发热的药物”,x表示流感,N表示这条检索记录趋于无穷大,y表示流感爆发,那么我们就可以构建出如下关系式:

y=f(xn,x,N)

(1)

[12]陈艳,李君亮.大数据技术:从数的解蔽到数据的遮蔽之现象学考察[J].江苏大学学报(社会科学版),2017(2):32-37.

y=f(xn,x,e,N)

(2)

这样,关系式(2)就表达了GFT中海量数据表征的某一地区在某一时间爆发流感的可能性。

这根长发丝到底是谁的呢?思雨接触的妻子之外的女人,只有欣竹身上算是能发生点联想的人。再没有别的什么女人可以联想了。

因此,海量数据表征了与环境相关的具有同一属性的无数事实间的某种相关关系。需要注意的是:这种相关关系实际上是一种概率关系,我们将其表示如下:

Py=P{f(xn,x,e,N)}

(3)

关系式(3)表明:N越大,y与f(xn,x,e)的相关关系就越强,从而Py就越大。

另一方面,技术揭示关系。肖峰指出:“真正的技术实在不只是一种实体实在,而且也是一种活动与过程实在,还是一种关系实在。”[21]就大数据技术而言,我们可以将之理解为:大数据技术作为技术实在逻辑蕴含着并必然揭示出其关系实在。这句话包括两层意思。第一层意思是说大数据技术作为技术实在逻辑蕴含着大数据技术的关系实在。大数据技术作为技术实在的第一个层次是实体实在,大数据技术的实体存在总是有着某种实际的功能,从而使其成为功能实在;大数据技术实际功能的现实化又要求一定的方法、技巧,从而使其成为技艺实在。这样,大数据技术作为技术实在在现实中就绽放出实体—技艺—功能的逻辑链关系,只有在实体—技艺—功能的逻辑链中,大数据技术才实在地显现出来,并在人与世界发生的实践关系中得到确认。所以说,大数据技术作为技术实在逻辑蕴含关系实在。

P与U取不同的函数,可构造出不同的小波变换。经过Matlab仿真结果的分析,最终选用正交小波db2作为母小波,对功率序列进行三尺度分解。

第二层意思是说大数据绽放为技术从其作为人造物的功能来讲总是要在使用中揭示出事实间的相关关系。人们在工业、商业、生活等各领域生产出海量的数据,我们就是要利用计算机通过数据挖掘从数据这座“神奇的钻石矿”中挖掘出事物之间不曾被发现的联系[23]6。或许正是在这个意义上,舍恩伯格认为,大数据精髓的更好之义在于我们强调的不再是追索因果关系,而是发现相关关系。

为了提高全面预算的编制水平,在铁路运输企业的全面预算编制过程中,应该综合运用多种预算编制方法。比如,对于铁路运输企业的收入、支出和利润总预算,则可以采用弹性预算编制方法;对于各类设备的维修支出预算、运输支出预算、营业外支出预算等则可以采用零基预算的编制方法,能够进一步节约成本;对于预算期与会计年度相脱离的,或者是现金预算等,则可以采取滚动预算的编制方式。

小结

从以上三节的分析可知,大数据技术本体可从数据实在、技术实在、关系实在等三个维度进行审视,其中,数据实在是基础,技术实在是关键,关系实在是核心。

大数据技术的本体是数据吗?回答这个问题之前,我们应先厘清“数据”一词的含义。

其次,没有计算机技术、智能终端设备、存储技术、数据挖掘技术等的发展与应用,即使人们在生产生活中制造出海量数据,数据这座“神奇的钻石矿”也将变成数据废气,因此,技术实在是大数据技术本体的关键。实际上,人类进入大数据时代,其本身就是技术发展的结果。与前科学、小科学、大科学相对应的数据可划分为微数据、小数据、大数据,如果对技术史进行考察,我们可以发现与之对应的技术大体上可划分为手工技术、机械技术、数字技术。人类技术的发展进入到数字技术时期后,人类实践活动也达到了前所未有的广度、深度和高度,并使由于人类实践活动而生产的数据由呈几何级数向呈指数级数转变,海量数据由于数字技术的发展每时每刻不止不歇地产生。海量数据的产生并未被人们当作是一件毫无意义的事情,相反,在工业、商业、政务等诸多领域,人们都认识到,海量数据实际上是一座“神奇的钻石矿”,只要我们在特定领域运用合适的数字技术工具,我们就能在海量数据宝藏中挖掘出能为人所用的“钻石”。由此可见,技术(技术的发展)既是海量数据得以产生的关键,也同时是海量数据得以意义性呈现的关键,正是在这双重意义上我们说,技术实在是大数据技术本体的关键。

再次,数据通过信息的表达表征诸事实间的相关关系,通过数据挖掘,技术揭示出的也正是诸事实间的内在相关关系,因此,关系实在是大数据技术本体的核心。数生成为数据,孕生于数据之中的信息本身就是关系。如卡尔·B.博耶在其所著《数学史》中向我们所提示的那种可能,即数本身就蕴含着诸神之间的关系而被记录为数据呈现给我们,并被我们传承了下来[24]5-7。不仅每一个数据内蕴的信息隐藏着的是诸事实间的关系,在当今人们的社会实践活动中所生产的海量数据间,相互也构成一定的结构,并蕴含着特定的关系。数据挖掘从本质上说就是要把握数据的结构性规律,进而呈现出海量数据中蕴藏着的特定事实间的关系,实现大数据技术的工商业应用等。大数据蕴藏关系表达关系,大数据技术揭示呈现出特定事实间的关系,从这两方面我们可以得出结论说,大数据技术本体的核心是关系实在。

参考文献

特别提示,为了完成毕业论文目录的生成,我们在新建一二三级标题样式时,必须指明它们的大纲级别,这是目录能正确生成的关键。在“一级标题”时单击“格式”按钮并选择“段落”,在打开的“段落”对话框中设置“大纲级别”为“一级”;“二级标题”设置“大纲级别”为“二级”;“三级标题”设置“大纲级别”为“三级”;“论文正文”的“大纲级别”设置为“正文”。

[1]陈艳,李君亮.大数据哲学研究述评[J].广西社会科学,2017(3):50-55.

[2](德)尼采.历史的用途与滥用[M].上海:上海人民出版社,2005:67.

[3](德)黑格尔.小逻辑[M].北京:商务印书馆,1980:414.

尼采曾经断言:只有无历史的东西才是可以定义的[2]。黑格尔则说:“要下界说的对象的内容愈丰富,这就是说,它提供我们观察的方面愈多,则我们对这对象所可提出的界说也就愈有差异。”[3]虽然大数据的广泛应用及大数据概念的流行只是近些年的事情,但大数据这个概念既是有历史的,也有着丰富的内容,因此,要给大数据下一个能让学界普遍接受的定义不是一件容易的事。舍恩伯格在其《大数据时代》中始终未给出大数据概念以明确定义,他甚至认为“大数据并非一个确切的概念”[4]8。我国学者苗东升也认为,大数据还算不上是一个科学概念[5]。而涂子沛则非常谨慎地在其《大数据:正在到来的数据革命》一书外封面的内页下脚边写道:“大数据是指一般的软件工具难以捕捉、管理和分析的大容量数据,一般以‘太字节’为单位。”[6]1可见,要界定大数据概念是多么地不容易。

[5]苗东升.从科学转型演化看大数据[J].首都师范大学学报(社会科学版),2014(5):48-55.

[6]涂子沛.大数据:正在到来的数据革命[M].桂林:广西师范大学出版社,2013.

[7](奥)维特根斯坦.逻辑哲学论[M].北京:商务印书馆,2013.

[8](美)TManyika.J.;Chui.M.;Brown.B.;et al.Big Data:The next frontier for innovation,competition and productivity[R].Mckinsey Global Institute,2011.

[9](德)Snijders.C.;Matzat.U.;Reips.U.-D.Big Data:Big gaps of knowledge in the field of Internet[J].International Journal of Internet Science,2012(7):1-5.

[10]徐宗本,张维,刘雷.数据科学与大数据的科学原理及发展前景[J].科技促进发展,2014,10(1):66-75.

[11]Eiman Al Nuaimi,Hind Al Neyadi,Nader Mohamed and Jameela Al-Jaroodi.Applications of big data to smart cities[J].Journal of Internet Services and Applications,2015:1-15.

关系式(1)表示的就是数据表征着的关系。如果加上环境因素e,比如某一特定地区的某一时间段,那么关系式(1)就可改写为:

百度百科认为,“数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。”[15]对于这种“未经加工的原始素材”,我们也可以引申为事实。

[14][EB/OL].https://en.wikipedia.org/wiki/Data.

[15][EB/OL].http://baike.baidu.com/item/数据/5947370.

[16](美)冯启思.数据统治世界[M].北京:中国人民大学出版社,2013:前言Ⅲ.

[17]L.Zhang,J.Gu.Some Comments on Big Data and Data Science[J].Ann.Data.Sci.(2014)1(3-4):283-291.

[18]成素梅.论科学实在与技术实在[J].齐鲁学刊,2005(3):113-116.

[19]段伟文.大数据知识发现的本体论追问[J].哲学研究,2015(11):114-119.

提供增值服务的范围可以很广。简单一点的服务,比如提供整合每个员工某年度的所有相关信息的检索界面;提供所有员工某年度或某区间的科研项目与成果信息的检索界面;提供各个人奖、惩信息的检索界面;提供某级别职称的员工姓名;等等。

[20]肖峰.从三个层次看技术实在[J].东北大学学报(社会科学版),2004(3).

[21]肖峰.论技术实在[J].哲学研究,2004(3).

所用教材和教辅材料、习题、考试内容等,均为国际知名学者和行业专家所编,内容涉及大量国际品牌酒店管理案例,注重培养学生分析能力与创造创新能力。考试合格者,在获得学分的基础上,可获得全球酒店行业权威职业资格证书,并获得美方学位,奠定学生国际化职业生涯基础,使学生的知识结构与国际同类专业做到真正意义上的接轨。

[22]Paul Teller.Relational Holism and QM[J].Brit.J.Phil.Sci.1986(37):71-81.

[23]迈克尔·尼尔森.重塑发现:网络化科学的新时代[M].北京:电子工业出版社,2015.

[24]卡尔·B﹒博耶.数学史(上)[M].北京:中央编译出版社,2012.

李君亮
《甘肃社会科学》 2018年第02期
《甘肃社会科学》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号