让数据在云中漫步
http://msn.finance.sina.com.cn 2011-10-26 03:48 来源: 经济日报随着云计算逐渐推广,全球数据量也呈现爆炸性的增长。在云计算的环境下,如何理解数据?如何对大数据进行处理?在“2011中国智能产业高峰论坛”上,专家学者们各抒己见。
美国工程院院士陈世卿认为,在云计算环境下,数据一定要正确。“设计任何的高级应用,我们首先要考虑数据来源。只有当海量的数据是准确的、动态的,后续的设计才是有意义的。”陈世卿说。他认为在进行系统设计的时候,为了消除数据的不确定性,要随时检验数据的正确性。基本数据源应该遵循统一的国家标准,而且在设计数据系统的时候,应该加入反馈环节,便于检查数据来源。
创新科存储技术有限公司副总裁汪锡圣提出,标示数据的来源和类型并不是一件简单的事情,因为同一个数据,从不同角度看,有不同用处和定义,所以在对数据的理解上,存在多元化的倾向。他强调:“在实际应用中,对数据的理解不能只是进行简单的标示,一定要与计算机和技能结合起来,建立起数据类型服务的观念。”
中国电信集团公司副总工程师靳东滨认为,对数据的理解存在着标准化和非标准化两种情况,已被理解数据往往容易形成一个固定的标准,所有的应用比如数据的格式、传输的协议等,只要按照这个标准去做,别人就能理解;而在新的应用中,数据则没有标准,在这种非标准的情况下,更需要大家去不断创新,而创新时应该遵循的一个基本原则就是,创造一个大家都比较容易理解的数据标准。
中国工程院院士徐扬生认为,数据的理解是一个长期的过程,要从两个方面来进行数据的理解,一是学习,把智能做成一个分布式的点;二是协调,主要是协调数据的所有权。“只有做到了分布和协调共存,才能把小智能化成大智能,给老百姓提供方便高效的服务。”
关于如何处理大数据的问题,相关专家学者也有自己的看法。
国网信息通信有限公司总经理刘建明介绍,国家电网的数据分两种,一种是实时的数据,一种是用户的数据。对于前者,国家电网一般采用虚拟数据的处理方式进行解决,而对于后者的处理,国家电网现在正在利用云计算和相关科研机构共同研究处理。
中关村物联网联盟秘书长张建宁指出,在物联网的平台上,数据出现两个极端,一个是海量数据,一个是极其离散的数据,他认为在大数据的处理上,要采用集中化的手段,同时要结合个性化和实际应用来做。
中国工程院院士李德毅说:“在大数据时代,我们一方面要重视对海量数据的挖掘,同时又不能惧怕大数据。”
日本德岛大学教授任福继认为,要对大数据进行归类、智能化,不能让有用的数据被无用的数据所淹没。