中国社会科学网陕西讯(记者陆航)“大数据带来的变革已经深切地影响着世界,大数据的发展不仅催生了数据服务的意识和能力,也促进了各行各业的巨大变革。大数据在众多行业有着巨大的价值,但这个价值建立在准确、全面、及时的高质量数据的基础之上”。中国工程院院士、西安交大管理学院名誉院长汪应洛说。随着大数据时代的到来,关于信息质量和数据科学的研究必将发挥越来越重要的作用。8月2日至3日,第十九届国际大数据与信息质量会议在西安交通大学管理学院举办。来自全球十多个国家近百位大数据领域方面的专家学者研讨大数据和数据科学领域的前沿和发展趋势,聚焦大数据时代信息质量的新问题和新发展,促进全球学者在该领域的交流和合作。
大数据目前是国内外热门的研究领域,是我国基础研究发展“十二五”专项规划信息科学领域的重要研究方向。大数据基本科学问题的解决将极大地推动信息及相关交叉学科发展。本届会议的主题为“大数据、数据管理和数据质量”。大会设立6个分会场,与会专家围绕“数据挖掘和数据质量”、“信息质量评估及提升”、“数据质量和信息质量管理”、“数据质量和信息质量应用”、“大数据及商业管理”等主题展开研讨。
什么是大数据,跟海量数据有什么区别?中国科学院院士、西安交通大学副校长徐宗本从数学、信息、数据、计算交叉融合的角高度提出大数据研究的若干科学问题,他认为大数据就是对事实的抽样,大数据不能按GB,TB,PB,EB这些数量进行量化衡量,而应该根据大数据的特点,注重数据质量。大数据主要特点表现为不能在单个计算机上集中存储,一般需要用到分布式/云计算模式等;难以在可接受的时间内进行分析处理;单个数据可能价值不大,但是数据整体蕴含高价值(比如一个班级学生发的微博可能没有特别大的意义,但是纵览全国高校大学生的微博就可以了解当代大学生思想理念);海量的复杂结构的数据集。因此,聚类分析、判别分析、回归分析、隐变量分析、因果分析、时间序列分析等数据挖掘方法应得到普遍重视。徐宗本认为虽然大数据受热捧,但是目前大数据研究还在初始阶段,切忌一哄而上,继而一哄而散。
陕西省产业投资集团徐晋提出,大数据本质上是社会经济的离散化解构与全息化重构,表现为行业间海量数据的跨界融合,行业内数据的深度挖掘。蒸汽机改变人类历史,是因为它对生产力的释放,我们研究大数据,必须从社会化大生产的角度、从生产力的高度,定义大数据、分析大数据。数据是对信息的数字化解构,大数据指存在价值关联的海量数据,信息来源于数据,包含了自然属性和社会属性,加上价值判断,特别是社会价值判断的数据构成信息。数据是未来社会经济发展的三大重要方向之一,这就需要深度研究数据挖掘技术,保证信息质量。
据阿肯色大学教授、大数据领域专家John Talburt教授介绍,国际大数据与信息质量会议是国际上该领域最权威的国际会议,由麻省理工学院于1992年创办,旨在促进信息质量和数据科学领域在研究、技术、实践等方面的发展和交流。会议已在全球范围内成功举办18届,历届会议吸引了包括美国、加拿大、澳大利亚、中国、英国、爱尔兰、德国、法国、芬兰、西班牙、意大利、印度、巴西、阿根廷等世界各国的知名学者和企业代表参与。本届会议是国际大数据与信息质量权威会议首次在亚洲召开。