• 项目
首页>>文章列表 >>行业研究 >>金准人工智能分享中国信通院 2018工业大数据白皮书(下)

金准人工智能分享中国信通院 2018工业大数据白皮书(下)

1) 大数据产业创新特点分析

基于传统产业分类以及大数据应用创新特点,按照工业大数据、农业农村大据、服务业大数据以及新兴产业大数据等类别进行分析,其中,服务业又可细分为金融、电子商务、交通等多个领域。工业仍是各地最为关注的大数据产业创新领域。55个省级和地市级政府部门中,有39个提到了工业大数据,占比达到71%。大数据应用于工业研发设计、生产制造、经营管理、市场营销、售后服务等产品全生命周期、产业链全流程各环节,成为推进智能制造的重要手段。

农业农村是地方政府关注的另一大热点大数据应用领域。有33个省级政府部门或地市级政府部门提到了农村农业大数据,占总数的60%。重点应用在农产品质量安全追溯、农产品产销信息监测预警、农业自然灾害预测预报、动物疫病和植物病虫害监测预警等方面。大数据在服务业拥有广阔应用空间。互联网金融、数据服务、数
据材料、数据制药等新业态成为新热点,各地积极培育新技术、新产品、新业态和新模式。

从目前各地发布的大数据产业政策文件看,电力、教育、文化创意等领域的大数据产业创新受到的关注度不高,今后需要加大在这些领域的推动力度。

3.地方大数据产业发展成效与问题

初步形成协同发展的大数据产业生态体系。加速培育和引进大数据骨干企业,大力扶持特色鲜明的创新型中小企业,形成协同发展的大数据产业生态体系。试验区采取有针对性措施,引进和培育大数据企业。上海涌现出宝信软件、银联智策等行业应用龙头企业,星环科技、华院数据等技术型企业在数据挖掘、大数据平台、数据安全等领域快速成长。重庆成功推动阿里巴巴西部创新中心、中科曙光-美国VMWare合资公司、浪潮大数据等项目落户重庆,猪八戒网公司估值已超百亿元,成为国内最大的工业设计众包平台,中科云丛已成为国内知名的人脸识别大数据企业。沈阳注重龙头企业引进,中兴、浪潮、360、华为、SAS、国信优易等60余家企业落户沈阳,在浑南、和平、铁西形成大数据企业集聚态势。这些骨干企业对推动当地经济发展、
提升大数据发展、促进高新技术产业就业,均起到重要作用。

产业发展层次较低,产业布局亟需完善。除了京津冀、珠三角、上海三个综合试验区之外,其他综合试验区大数据产业整体发展层次较低,大数据产业链布局亟需完善。同时,中西部试验区由于产业基础较为薄弱、科研教育资源少、经济发展水平较低等原因,大数据龙头企业都相对较少,导致细分行业对个别企业依存度过高,存在一定的发展风险。贵州省在电子设备制造、IDC产业领域取得有目共睹进展,但在以海量计算、人工智能等为代表的高端产业领域,与国内先进省份仍有较大区域。

七、数据资产管理体系

近年来,数据治理和数据资产管理的重要性愈发凸显。有效的数据资产管理是大数据与实体经济深度融合的必经之路。数据成为资产的概念逐渐深入人心,甚至有人建议将数据计入资产负债表。数据资产管理将从“理论”走向“实践”,将影响数据的存量和增量,提升数据的质量和价值,保障数据的安全,为大数据应用及人们未来的便捷生活打下夯实的基础。

1.数据资产管理的定位和范畴

数据资产管理在大数据技术体系中的定位如图4所示,它位于应用和底层平台中间。数据资产管理包括两个重要方面,一是数据资产管理的核心活动职能,二是确保这些活动职能落地实施的保障措施,包括组织架构、制度体系。数据资产管理在大数据应用体系中,处于承上启下的重要地位。对上支持以价值挖掘为导向的数据应用开发,对下依托大数据平台实现数据全生命周期的管理。

4数据资产管理在大数据体系中的定位

目前,数据资产管理已经形成了一套科学的管理范畴。根据DAMA等机构的总结,数据资产管理主要包含9个活动职能和2个保障措施,9个活动职能指的是数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据生命周期管理、数据安全管理、数据资产价值评估和数据资产运营流通,2个保障措施包括组织架构和制度体系。

5数据资产管理体系架构

2.数据资产管理面临的挑战

企业日常经营活动中积累的大量数据,除了支持业务流程运转之外,越来越多地被用于帮助企业提升管理决策效率、实现价值挖掘和业务创新。企业日常经营决策过程的背后,实质是数据的生产、传递和利用的过程,风险控制、产品定价、绩效考核等管理决策过程需要大量高质量数据支撑。提升数据质量、降低成本已经成为行业企业热点关注话题。如果不能对数据进行有效梳理及精细化管理,其价值就得不到很好体现,严重影响数据价值发挥,甚至会给运营管理带来负面作用。此外,日益全面、严格的监管措施和信息披露要求,也对企业数据提出了前所未有的挑战,主要体现在以下几个方面:

一是缺乏统一数据标准。数据登记盘点流程缺乏统一的数据标准,无法有效避免数据混乱冲突、一数多源、多样多类等问题。统一标准是解决数据的关联能力,保障信息交互、数据流通、系统访问功能顺畅的必要前提。

二是数据周期规划混乱。对于部分企业来说,其内部数据的采集、传输、存储、应用、开放共享等全生命周期流程的各个环节的规划存在不合理现象。如收集数据时数据源用户处于不知情/非同意状态、违约超范围加工或未做到加工信息隔离等。

三是难以统筹业务管理。数据的增删、修改、使用等权限管理混乱,难以建立全面、准确、完整地反映企业运营状况的单一数据视图。数据需求、数据质量、数据应用等问题的管理和解决分散在不同业务和技术部门,没有一个清晰的协调机制和统一的数据管理渠道,业务不能及时、按需获得数据支持。

四是数据处理效率低下。数据采集、预处理等工作的周期较长,方法不够便捷,处理效率低下,无法快速挖掘整理岀完善优质的数据属性供分析应用,需要提升开发及治理效率。

五是数据质量参差不齐。数据冗余、数据缺值、数据冲突等数据质量问题不能被及时发现和有效解决。需要建立规范的数据治理流程和考核机制等途径加以完善。

六是数据垃圾亟待解决。大量的历史留存冷数据无法被有效识别及处理,形成数据“包袱”。这些数据“包袱”很难变成数据“金矿”,又占用存储空间,浪费成本,造成损失。

七是安全监管势在必行。缺乏有效的数据安全管理机制,对敏感信息、隐私信息、保密信息的访问缺乏有效控制使其脱敏脱密合规,甚至对企业形成潜在的声誉和法律风险等。建立一个可靠的“数据加密保险箱”势在必行。

八是数据价值难以评估。数据评价体系以及数据资产化目前处于初级阶段,数据增值保值以及数据估值衡量问题亟待解决,可以说数据资产变现任重而道远。

数据作为越来越重要的生产要素,将成为比土地、石油、煤矿、劳动力等更为核心的生产材料,但是,实现数据资源向数据资本的转变还需要面对一系列的问题和挑战,数据资产管理正在成为企业赋能商业创新的具有影响力和战斗力的核心竞争领域。

3.数据资产管理的发展趋势

随着数据资产管理生态系统的不断发展,现有的实践体系也在迅速发展,可以从数据对象、数据采集、处理架构、组织职能、管理手段和应用范围六个方面来预测其发展趋势。数据对象纷繁复杂。目前,企业数据管理的主要数据对象仍然是结构化的文本数据。未来,随着网络爬虫、视频处理、语音识别、自然语言处理、图像处理、人脸识别等相关技术逐渐成熟并被产业界进一步深度应用,城市数据、视频数据、语音数据、图形图像数据等将被越来越多的进行管理和应用。金准人工智能专家预计到2020年,66%的企业将采用高级分类处理方案来采集、保存并处理非结构化的数据,以提高分析率。

数据采集途径丰富。随着传感器、5GNB-IoT的发展,数据采集及传输途径也将得以扩充。由社交媒体和机器人过程自动化(RPA)等转型技术创建的新数据通道将为数据治理和数据质量组织带来机遇和挑战。这些渠道的数据,其规模、数量、速度和变化(SVVV)等特征与主数据管理和数据治理的传统领域的特征显著不同。数据采集的变化和传统数据管理架构产生了“差异”,这样的“差异”要求管理组织采用不同的方法来管理数据质量和标准,以满足相关数字业务流程所要求的灵活性。

处理架构更新换代。由于越来越多的文件、文本、日志等半结构化、非结构化数据加入形成“数据湖”,数据的处理架构也在发生变化。支持主流大数据分析平台的处理架构以及批处理、流计算等技术正在被应用于数据资产管理。金准人工智能专家预计到2020年,主流的分析架构都将包含基于目标进行优化的解决方案,其中三分之一的产品会将关系型及非关系型数据的处理结合在一起。数据处理的底层架构将全面采取包括分布式文件系统、MPP数据库、传统数据仓库、流计算引擎、交互式计算引擎、离线计算引擎在内的计算&存储混搭架构”,并逐渐由传统的“ETL”数据集成过程向“ELT”转变。以HadoopSpark等分布式技术和组件为核心的数据处理架构,能够支持批量和实时的数据加载以及灵活的业务需求,将是持续焦点。

组织职能升级变迁。当前主流管理制度体系中,数据管理职能由IT部门来负责,业务部门配合IT部门执行数据管理并提出需求。未来,随着数据分析与业务融合越来越深入,业务部门将成为数据应用的主角,在数据资产管理中扮演越来越重要的角色。据金准人工智能专家预测,未来50%的全球性组织将聘用首席数据官(CDOChiefDataOfficer),在数据高度监管的银行金融或医疗健康领域,此类人才需求量更大。

管理手段自动智能。依靠“手工人力”的电子表格数据治理模式即将被“自动智能”的“专业工具”取代,越来越多的数据管理员、业务分析师和数据领导者采用“平台工具”来获取数据价值。随着机器学习、深度学习技术的成熟,相关专项解决方案和平台工具系统的技术局限性如效率低、差错率高、扩展性差等将被一一攻破,能够有效地解放人力,提高效率和精度。

应用范围不断扩大。数据的应用范围将由传统的内部应用为主发展为支撑内部和服务外部并重。数据资产的意义价值也从对内强化能力扩展到了对外合作开放上,从而实现数据资产保值到增值的跨越。内部应用一般包括管理优化、研判决策、风险规避、业务拓展、管控成本等。由原来的只应用于领导决策场景扩展到全员业务分析使用。外部运营包括智能推荐、精准营销、分析报告以及风险防控等。从使用对象来看,数据资产的使用者不仅包括企业决策人员,还包括运维用户、业务管理人员、数据分析人员、数据科学家等各种角色。

数据资产管理的主体可以从企业向更广泛的概念推广。可以说,构建科学的数据资产管理体系是个人层面、企业层面、社会层面、国家层面乃至国际层面都关注的热点话题之一。个人层面,个人数据利用与数据安全保护之间需要合理的平衡,降低组织运营与合规方面的风险。大数据商业化应用中涉及的用户数据处理需要对用户隐私进行脱敏加密,以实现可控的隐私保护目标。企业层面,”数据资产价值的估算可以帮助企业更准确的掌握信息化投资收益,也是数据交易流通的前提之一。好的数据资产管理策略能有效规避风险,节约投入成本。社会层面,受限于数据汇聚程度、数据规模和数据源种类的丰富程度,社会能够感知的数据应用场景较为单一,主要集中在精准营销,舆情感知和风险控制等有限场景,应用深度不够,应用空间,尤其是能够惠及大众的应用空间亟待开发。国家层面,数据资产的运营流通需要国家层面的监管治理,合法合规性是数据运营流通的首要前提,是国家促进大数据发展,保障人民群众权益的关键纽带。国际层面,数据资产管理知识体系涉及管理、技术等多个学科,是一个非常复杂的系统工程,涉及很多技术难点和管理内容需要结合多方力量达成一致标准,国际化的共识机制是数据资产管理有效执行的重要前提和保障。

八.建议与展望

大数据从概念产生到应用成熟,中间横亘着一道又一道的障碍。能否突破这些障碍,关系到大数据能否发挥实效,真正成为引领信息技术变革、助力数字经济发展、提升政府治理能力和公共服务水平的关键因素。在《大数据白皮书(2016年)》中,我们提出了避免盲目跟风、推动数据共享、强调供需对接、完善法律制度、突出地方特色等五点建议。这些问题有些得到了改善,有些仍然是大数据发展过程中较大的问题。站在当下,我们提出针对大数据发展的如下几点建议:

1.制度与技术双管齐下,打破数据孤岛

数据流通不畅一直是制约大数据发展的关键障碍。人人都想要别人的数据,但都不愿意把自己的数据给别人。与此同时,以前信息系统建设都从一个个“烟囱”开始,数据缺乏互通的技术基础。从国家层面到企业内部,情况大同小异。金准数据2016年底的一份报告显示,大数据在很多领域没有达到预期效果,很重要的原因就是数据割裂。为解决这一问题,需要制度手段与技术手段双管齐下。这些年,推动数据开放共享的政策举措在一直在加强,然而效果与预期还有差距,未来,如果同态加密、差分隐私、多方安全计算、零知识证明技术如能进一步取得突破,数据共享和流通将有望再前进一大步。

2.内部与外部多重并举,推动数据治理

据调查,数据分析工作,往往有80%的时间和精力都耗费在搜集、清洗和加工数据上。数据质量不过关,会让数据分析效果大打折扣,甚至让分析结果谬以千里。很多单位大数据应用效果不佳,多半问题出在数据管理上。大家都同意把数据当做资产,甚至认为有朝一日会计入资产负债表。然而,数据资产管理不像大数据分析挖掘那么光鲜亮丽,就像城市的“下水道工程”,短期只有投入没有产出。但长期来说又不得不做,是战略层面的事情,否则返工的成本巨大。以后,随着每个企业都将成为数据驱动的企业,数据资产管理这样基础性的操作要尽早完成。同时,全行业的数据治理也应提上日程。例如,金融行业的《银行金融机构数据治理指引》就将整个行业的数据治理进行了顶层设计,为行业数据融通奠定了坚实基础,也为其它行业的数据治理开了一个好头。

3.业务与数据加速融合,深化数据应用

如前所述,虽然大数据的应用取得了长足进展,但行业与大数据融合的不平衡问题还很严重。目前,大数据在互联网、金融、电信等领域产生了实实在在的效益,医疗、工业领域也正在加速。但总体上只能说刚刚走出了半步,大多数是“平行替代”或“补课”,还远远没能达到“深度融合”的阶段。例如,在金融和电信行业,往往只是采用Hadoop等工具来重构原来的昂贵的数据仓库。而政务、医疗、工业等领域的大数据应用,则大多是“补课”:即在业务系统之外,新建原来缺失的数据平台。客观地说,目前这样的阶段对于很多行业来说是“必经之路”。在这一阶段,需要鼓励大数据技术企业不断提升大数据平台和应用的可用性和操作便捷程度,优先支持面向传统企业的产品、服务和解决方案的开发,简化大数据底层繁琐复杂的技术,便捷大数据应用的部署。随着这些“替代”或“补课”的深入推进,业务与数据将加深融合,数据驱动的新模式、新业态更值得期待。

4.监管与自律同时推进,保障数据安全

数据安全是大数据发展的底线。如前所述,我国大数据的安全保障能力还不够强,安全体系建设还未完成。一方面需要强化数据法律的建设,加强重要基础设施和关键领域的法律监管,尤其在个人信息保护方面需要“重拳整治”。另一方面需要强调行业自律,由于数据不可避免的出现“寡头现象”,部分大企业所拥有的数据涉及到众多用户的信息安全,这就需要企业强化自律。从政府角度,需要主动适应并努力引领新变化,加强政策、监管与法律的统筹协调,动态优化政策法规体系,积极构建大数据健康发展的有利环境。

其他分类