• 项目
首页>>文章列表 >>行业研究
行业研究

金准产业研究 2019年全球创投风投行业解析报告 2019-11-19 19:37:48

前言

随着创投风投资金越来越多地流入亚太和欧洲地区,美国创投风投整体规模在全球的占比正逐年下降,而中国得益于创业生态系统的迅速升级,正成为非美国地区崛起最快的国家。在过去三年中,中国已经占据了全球创投风投总额的近四分之一。在全球前五大独角兽中,中国企业占据四席,在前十大独角兽中占据七席。

据最新数据观察,过去五年中国创投行业整体呈现稳步向上发展态势,截至2019年5月底,已备案创业投资基金7,055只,基金规模1.01万亿元,中国创投基金规模已超过美国。金准产业研究团队分析,资本与技术的高效结合,将推动中国供给侧改革的深化和经济结构的转型升级,在此过程中,中国的创投行业将显示出前所未有的增长潜力。

一、全球创投风投总投资金额在持续攀升,资金在向中后期优质项目聚集

据统计,2018年全球创投市场累计发生投资案例1.7万起,投资总金额约2966亿美元,约2万亿人民币,较2017年同比增长34%,全球创投风投市场投融资活动持续活跃。

另外,由于优质项目的稀缺性,加上资本又有追求稳定回报,渴望尽快退出的特性,资金正向少数且优质的头部项目项目聚集,2018年中后期项目,平均投资金额上升最为明显,从2017年的7,940万美元上升至1.5亿美元,同比上升89%。我们预计,未来全球创投资金会更倾向于向中后期方向去发展,从而对更早期阶段的项目融资造成挤压,这在未来可能也会成为一个比较持续的现象。

二、在行业上,医疗健康和人工智能成为2018年创投的风口

不仅是在中国,在全球来看,人工智能、自动驾驶、智慧出行、生物技术等,是绝大多数创投领域关注的方向之一。尤其在大健康领域,2018年,全球医疗产业总融资金额高达418亿美元,远高于2017年310亿美元的高点,增长34.8%。长期以来,生物技术和医疗健康一直是最活跃的领域之一,随着人口老龄化、高端医疗的需求增加,医疗消费市场将持续快速增长。人工智能领域因为有巨大的想象空间,融资金额仍持续增加,2018年人工智能领域投融资总额为198亿美元,较2017年的120亿美元增长78亿美元,同比增长65%。中美属于第一梯队,领跑优势明显。

整体来看,美国的技术领先性在短期内依旧不容挑战,中国因为人口红利和场景的开放,为各类应用落地,迅速走向市场提供便利。金准产业研究团队认为2019年将是中国创投行业的转折之年,机构的投资重心将从模式创新转向技术创新。

三、美国风投占比持续下滑,全球创投中心正从美国转移

创投的概念起源于美国,在20世纪90年代初,美国创投风投市场占全球的95%以上。因为2000年的互联网泡沫,这一比例随后缓慢下降到80%左右,到2012年逐渐下降到三分之二左右。自此以后,美国在全球创投风投市场中所占的份额出现了更大幅度的下降,到2017年已降至略高于50%的水平。

随着创投风投的资金越来越多的流入亚太和欧洲地区,美国创投风投占比下降的趋势已经很难逆转,而中国创业生态系统的迅速升级,尤其是在“大众创业、万众创新”的推动下,中国创投行业取得了长足的进步,成为崛起最快的国家,在过去三年中,中国已经占据了创投风投总额的近四分之一。

四、中国独角兽数量首次超越美国,成为全球第一

独角兽企业代表着新经济的活力,行业的大趋势,国家的竞争力,也是推动新旧动能转换的重要力量,逐渐成为衡量一个国家和地区新经济活跃程度的指标。据统计,2018年全球超过10亿美元估值的独角兽企业达到空前的429家,中国突破200家,达到205家,首次超过美国,排名第一,占比高达48%,美国为149家,占比35%,排名第二;随后为英国、印度、德国、韩国等国家。

在全球前五大独角兽中,中国占据4席,前十大独角兽中占据7席。以100亿美元估值为限的超级独角兽中,中国共有13家,美国12家。其中,蚂蚁金服以1500亿美元的估值遥遥领先,中国超级独角兽估值之和超过5500亿美元,是美国的近2倍。五、中国创新正从数量扩张转向质量飞跃,创投规模超越美国成为全球第一。近几年,国家把创新驱动确定为发展战略,对创新、创业、创投的重视程度前所未有,金准产业研究团队分析,国内创新、创业的生态环境日益优化,市场主体活力不断增强,创新创业成果大量涌现,为创业投资的爆发式发展拉开序幕。

根据统计,改革开放40年来,中国市场主体数量从改革开放初期的49万户,增长到2018年年底的1.1亿户,增长了222倍,2013年以来,中国新设企业数量平均每年超20%左右的增速增长,2018年,中国日均新设企业数达到1.84万户。创投作为促进双创的天然引擎,过去五年,中国创投行业发展非常迅速,根据协会统计,截至2019年5月底,已备案创业投资基金7055只,基金规模1.01万亿元。根据美国证券交易委员会发布的2018年第三季度数据,在美国备案的创投基金达816只,管理资本量810亿美元,约合人民币5569.2亿元,中国创投基金规模已超过美国,成为全球第一。

五、国内创投区域发展不均衡,一线省市优势依旧,新一线城市增速明显

国内创投市场分布具有较为明显的区域特征,北京、上海、广东、江苏、浙江等省在内的经济发达地区,一直是创投最为聚集的地区,集中了全国四分之三的创投资源,不论在投资案例数上,还是投资金额上,这些区域都具备明显优势,其中北京以绝对优势稳居第一。北京、上海、广东、江苏、浙江备案的基金数量占全国总额的80%,基金规模占全国的74%。

近年来,随着一线城市随人口流动和产业布局的变化,溢出效应增加明显,包含青岛以内的新一线城市赶上新机遇,有望打造出新一线创投中心。

结语

总体来说,中国创投行业的快速发展,对促进中国高新技术产业的发展,推动产业结构调整、优化资本配置等方面都起到了重要的作用。金准产业研究团队分析,与成熟的市场经济国家相比,中国的创投行业起步较晚,发展历程较短,行业仍处于粗放发展阶段,还存在着一些需要完善和提高的地方。中国经济转型发展与对外开放提速以及企业科技升级步伐加快,赋予了创投产业新一轮广阔发展空间。随着科创板和注册制的推出,中国本土创投将迎来重大发展机遇。

金准产业研究 2019年创投行业研究报告 2019-11-18 21:29:36

前言

2019年的创投行业,一半在寒冬,一半在春天。

募资、投资、投后管理、退出,是创投行业的一个完整生命周期。

然而到了2019年,创投行业的一头一尾:募资、退出,正在被拉扯到2个极端,一边身处寒冬,另一边沐浴政策春风。

一、资本寒冬

1.1资金募集、项目投资双双遇冷

Wind数据库显示,截止到11月13日,2019年中国创业投资机构的新募基金只有388支,募资总额只有1798亿元,这几乎是断崖式的下跌。

2018年,新募基金多达2182支,募资总额高达11513.84亿元;2017年,为3114支、10946.5亿元。甚至2010年,这一数字都是710支,3142.93亿元。意味着,2019年募资总额同比下降幅度超84%,新募基金数量亦大降82%。

另外,据清科数据显示,创投机构普遍出手谨慎,投资金额同比下降超过五成,高达58.5%。

而创投行业的最后一端:退出,却在2019年迎来了史上最大的利好:科创板试点注册制。据Wind数据显示,2019年数据统计口径(截至到2019年11月5日)中146个退出案例(以基金数计)中,非IPO的只有26个,IPO退出的占比超过82%。其中,通过科创板IPO的退出案例为78个,占全部退出案例的53%。

2019年,募资难已经是创投行业共识。

深圳市创新投资集团董事长倪泽望在2019第二十一届创业投资高峰论坛上表示,资金募集、项目投资双双遇冷,2014年以后设立的新基金大多数陷入募资难的困境中,即使是头部创投,新基金的募集难度也在增加。同时,倪泽望呼吁,希望能出台有利创投基金发展的鼓励政策,尤其是鼓励银行、保险、社保基金、大型国有企业等长线资本进入创投领域,形成以机构为主的长线资本新格局,从而较好解决创投基金募资难问题。

深圳市引导基金投资公司总经理蒋玉才认为,整个创投行业依然面临着非常严重的危机。深刻体会到了所有的基金管理人去募资时候的艰难。

近期,经纬中国创始管理合伙人张颖在自己的微博上称,这段时间,外部融资环境比较恶劣,融资难度无限加大。希望各位(CEO、创始人)都能拿捏好节奏,高效用好帐上的每一分钱,不要因为大意,错判而断粮。

身处寒冬的不仅仅是中小创投机构,头部创投企业同样也在共度时艰。但是,金准产业研究团队分析认为,现在创投行业正在回归到一个正常、理性的状态。并指出,以前的行业状态,很不正常。数万家机构都能融到钱,任何一个人都可以出去投资,现在募资只是回到了一个正常、理性的状态。

1.2资本寒潮的内外部原因

2017年以来,股权投资行业在整体规模迅速膨胀的发展状况之下,遇到了近20年来最严重的募资难、退出难、一二级市场估值倒挂的瓶颈。

寒潮之下,我们清醒的审视自身:外部直接原因是金融去杠杆、资管新规等政策和法规的影响,外部间接原因是经济下行周期加之前几年的投资热潮到了集中退出期,投资人集体接受了现实的洗礼使其投资风险偏好降低。但内部原因而言,行业信息不透明,退出方式单一,创投生态圈诚信不够等问题使得行业流动性问题突出,进而形成了约7万亿的一级市场堰塞湖。

全行业即将产生分化,头部与非头部可能不仅仅是2/8的比例,而更有可能是5%和95%的比例,形成头部通吃的局面。在这种格局之下,居于95%的那部分投资机构如何走出堰塞湖的困境,如何兑现投资人的收益回报,如何能够继续赢得投资人信任,满足监管合规要求和提升投资收益得以继续生存?

与寒冬中的GP相对视的,是在2018年达到顶峰然而同时面临尴尬的政府引导基金。截至2018年底,我国设立政府引导基金2065只,目标规模已达12.27万亿人民币。各级政府积极设立政府引导基金的初衷无不是为地方新经济产业助力,引导创投支持创新经济发展,然而引导基金的管理团队专业性问题、反投限制以及同样面临的退出问题,让“不差钱”的引导基金一上位就面临失语的尴尬。

再向上升高视角,不难看到政府和投资机构还要同样面对市场周期的转变——自2016年以来行业走向越来越成熟和规范,监管也越来越严格和规范,在过去十多年所形成的一、二级市场套利的私募股权盈利模式逐渐式微的趋势之下,创投企业及上下游产业如何适应变化创造新的增长空间?

二、注册制下的科创板带来的机遇

2019年,与募资难形成鲜明反差的是,创投项目退出的盈利回报率正在回升。而给身处寒冬的创投行业送来星星之火的正是,2019年推出的科创板。

2.1科创板IPO企业表现强劲

Wind数据统计,截至到11月6日,科创板累计受理企业已达176家,已上市企业达51家,已上市或者拟上科创板的企业背后,有约80%得到过创投机构的投资。

今日参加2019第二十一届创业投资高峰论坛的深圳市松禾资本管理有限公司,便是最大的受益者之一。据松禾资本创始合伙人厉伟透露,2019年科创板推出以后,松禾资本已经6家投资的企业完成科创板IPO,其中4家更是在第一批完成上市。

值得一提的是,科创板前几批企业在上市之初的表现非常强劲,给予早期投资人的回报极高。据Wind数据统计,2019年下半年以来,创投基金退出的项目全部实现盈利,亏损案例数为0。

2.2科创板成为创投机构的退出赛道

金准产业研究团队认为,注册制下的科创板,正在逐渐成为所有创投机构不容忽视的退出通道。

深创投董事长倪泽望在2019第二十一届创业投资高峰论坛上表示,以映科技企业为主的科创板的成功开设,为我们开辟了一条新的退出工作,也为我们的投资方向指明了道路。值得一提的是,注册制的试点经验,即将复制到创业板,未来A股或将是全面推广注册制。

金准产业研究团队预测,2020年,将是创投项目退出的历史高峰期,在科创板、创业板注册制的良性竞争下,2020年的IPO项目数量加速会非常快。对于手中项目储备充足的创投机构而言,将是一个非常大的利好。

三、注册制下,创投机构的危与机

但在业内人士看来,注册制的全面推广,并不意味着所有创投机构都能过上好日子。达晨创投总裁肖冰表示,注册制以后,二级市场的估值体系会发生巨大的变化,将会有大量的企业上市,IPO不一定投资成功,当前科创板已经有5家上市公司跌破发行价,我觉得很快可能会有发行失败的公司,甚至会有一、二级市场倒挂的现象出现!

同时,肖冰进一步认为,注册制两三年以后,上市的家数不是大大的会少于现在,而不是说会是海量的去上市。因为二级市场的要求的标准比证监会的标准更高,价格会倒逼的很多企业没办法上市,直接导致发行失败。同时,还会有大量平庸的企业退市。

其实,以港、美股为例,在注册制之下,企业在上市首月破发率高居50%,如果资质不好的创投项目退出难度非常大。

根据bloomberg数据,2010年以来,纽交所的首日破发率平均在32%左右,破发率虽时间轴延长而增加,30日破发率、90日破发率分别为58%/62%。

对此,肖冰在论坛上进一步指出,创投机构必须意识到,注册制以后,简单地投资一个平庸的公司去上市,不一定赚到钱,而现在的挑战是,必须投质量更高的项目,而不是简单考虑能否上市,这个是很高的挑战。

金准产业研究团队认为,基金行业的合伙人打铁先要自身硬,在这种紧张困难的情况下,苦练内功,在未来3-5年,中国的基金行业肯定得比现在的困难形势还要艰巨,因为当2009年、2010年那一拨成立的基金面临大规模清算的时候,会来对整个行业更大的负面的冲击。

可见,随着注册制时代的来临,创投机构竞争的下半场可能才刚刚开始。在这一轮的迭代洗牌中,平庸的投资机构注定会被甩得更远,甚至是被淘汰。

四、金融科技新时代创投机构的嬗变

中国创投高速发展的近20年,也是全球新一轮科技革命和产业变革加速的20年。信息技术、人工智能、智能制造、生物医药、新材料、新能源等为核心的新兴科技产业蓬勃中兴,逐步形成中国创新发展的硬实力。

生产力的不断提高对生产方式提出了更高的要求,不仅是我们消费、生活和工业、制造的方式正处在日新月异的变革当中,支持创新的金融本身的手段和方式也需要创新和改变。

金融科技大潮在过去十多年的时间里,已在中国乃至全球燃起如火如荼之势,美国和中国成为世界最大的两个金融科技市场,在金融诸多细分领域都取得了长足的发展。但在VC/PE的私募股权投资这个相对年轻的金融领域,极大一部分投资人还在使用“刀耕火种”的生产方式。

在创新引领的新经济形势之下,科技创新企业是国家经济发展的尖兵和炮手,创投企业发展的每一步都离不开创投的支持和辅助,创投通过直接融资的方式来支持创新经济发展,但创投行业本身的运作和发展模式却几十年都没有新的变革。创投行业在一方面推动企业拥抱创新引领变革的同时,自身也需要转变运营方式,迭代和完善自身以实现嬗变。

根据工信部的相关数据,在借贷、支付、保险等金融科技应用领域,信息技术手段的覆盖率已达到近60%。在这其中,部分包含大数据技术、AI技术以及区块链技术驱动的底层科技都已相对较为成熟。但是股权投资以及财富管理等其它细分领域,技术手段的发展相对落后。

上述问题的核心,是以技术来解决市场的问题,而解决的方案和工具就是日益发展的金融科技。成都创投与股权投资协会依托会员单位应用新一代价值互联网和人工智能金融科技,在协会平台上推出了交子创投智慧管理系统供会员单位选用,并计划为政府监管提供行业自律和状态报告服务。基于我们的研究和实践,对于创投领域金融科技的发展和进化,金准产业研究团队认为可以划分为5个阶段:

1.0时代,显著的特点是金融信息化,IT和互联网为创投机构提供信息化的工具以简化业务流程,提高部分管理效率,其标志是创投企业的MIS系统,创投行业开始向信息化道路发展;

2.0时代,主要特点是生态圈建设。创投机构横坐标向投前和投后延伸,纵坐标向财富管理和资产配置延伸,金准产业研究团队认为,创投要从GP向LP融资成立基金投资的简单运作形式变成建立LP、GP、被投企业、中介机构以及政府监管机构协同发展互动的生态圈。创投要成为创业企业的服务中心、创投资金的聚集中心、创投行业的知识中心、创投人才的培育中心。从商业本质上来看,创投通过资金将资源聚集,以机构为中心在被投企业之间、以及LP之间形成聚合效应,实现资源和效益的最大化;

3.0时代,创投生态圈建立以后需要建立圈内的互信机制。以主权区块链技术作为生态圈的支撑,将圈内各主要运作实体相关信息及事件形成主权区块链上数据,通过分布式账本解决信任成本,使LP能通过GP授权穿透管理,GP能够实时直观地了解被投企业信息,更好地解决了投后管理与个性化服务,让被投企业以诚信换投资,以创新求发展,更方便的获取投资机会,也让行业自律与政府监管奠定了基础;

4.0时代,创投生态圈建立互信的基础上达成共识机制。通过区块链汇集行业真实可靠数据的基础上,依据人工智能的专家系统和知识学习模型可以学习各创投的宝贵的实际运作的行业经验,汇聚行业共识,对创投创新企业的价值予以动态表达,可以还原企业增值过程,全面而真实定义创新企业发展过程中的估值,而不是仅仅基于企业提供的财务数据进行的后验式估值。

5.0时代,在创投生态圈建立的互信共识基础上,生态圈内的非上市股权交易及转让甚至数字化股权投资成为可能,进而产生新的投资形态。

结语

综上,随着注册制时代的来临,创投机构竞争的下半场可能才刚刚开始。在这一轮的迭代洗牌中,平庸的投资机构注定会被甩得更远,甚至是被淘汰。利用技术创新影响模式创新来提升资源配置效率,转变创投行业的生产方式,通过提供创造性的解决方案从底层技术提升创投服务效率,降低降低创投运营和交易成本,缩减信息鸿沟,打破原有产业边界,最大限度发挥金融本质作用,实现资源供需双方的分配优化,是创投行业自身升级跨越式发展的不二之路。

中国制造业升级发展趋势研究报告 2019-11-15 18:57:42

前言

随着中国制造稳定发展,消费支出对GDP拉动作用明显,中美贸易一定程度影响出口环境,中国制造业进入了以内需消费为主要动力的发展阶段。但目前中国仍面临劳动力成本上升、制造业附加值较低、多样化市场需求无法有效满足等问题,以消费品制造业为代表的中国工业正在进行新一轮转型升级。

因此亿欧智库撰写并发布了《2019-2020中国制造业转型趋势研究报告》,基于对中国制造业发展历程及国际竞争力的梳理分析,从劳动力、技术、市场角度剖析中国制造业面临的重要挑战,针对挑战提出中国制造企业进行转型升级的发展趋势,并分析案例阐述中国制造业转型升级的实践道路上的有效渠道和方法,希望可以为中国制造企业提供参考。

中国制造业的发展现状

2014-2018年制造业增加值稳步增长,对GDP的贡献比例维持在30%左右,制造业对中国经济增长依然起到重要支撑作用,2016年国家开始推行供给侧结构性改革,中国制造业进入新的发展阶段。消费品制造业总规模在20万亿以上,利润率水平位于制造业整体均值以上,在中国制造业中占据重要地位。

 

消费品制造业总收入及占比

消费支出近年来对经济增长拉动态势明显:2014年至2018年间,最终消费支出对中国GDP的增长贡献率从48.8%上升到76.2%,消费成为拉动经济增长的主要力量。

•消费品制造业与国民生活息息相关,将是本报告研究重点:消费品制造业是消费品的生产和制造端,与国民生活息息相关,具有明显的市场依赖性和大众服务性特征,主要包括食品、饮料、纺服、家具等制造子行业。

 

中国最终消费支出对GDP增长贡献率

 

消费品制造业利润总额及利润率

中美贸易摩擦的影响正逐渐向消费品领域蔓延,出口导向型的消费品制造业企业面临相对严峻的外部环境。中美贸易战向消费品领域蔓延:截止目前美国公布三次对华加征关税清单,最终消费品所占比例逐步增加。

中美贸易战对消费品制造业的出口型企业影响较大:从中国出口额度来看,电机电气产品、机械设备两类占比最大,其次是家具、服装等劳动密集型消费品;美国设置关税壁垒导致中对美出口自2018年末始出现大幅震荡;中美贸易战将在短期内对消费品制造业领域的出口型企业影响较大。

 

中国对美国进出口金额

中国制造业面临的三大挑战

基于中国制造业的发展现状,亿欧智库认为中国制造业升级面临的挑战包括:劳动力成本上升,产品附加值提升困难,消费多样化需求无法被有效满足。

1. 劳动力成本上升:中国制造业企业用工成本逐步上升,2008-2018十年间增长近两倍。在全球市场竞争中,中国制造业的劳动力成本优势减弱,劳动密集型企业面临严峻竞争。不仅如此,中国的老龄化趋势导致劳动力总供给正逐年减少,而制造业劳动力存在外流趋势,劳动力供给压力进一步增强。

2. 产品附加值提升困难:中国制造业产能利用率低,主要消费品制造业处于产能过剩状态,企业存货周转率水平整体较美国存在差距,流动性较差。近年来,中国在技术研发方面虽然取得显著成就,但是R&D强度与发达国家相比仍显薄弱,这就导致提升产品附加值的动力不足。纵观消费品制造业的全球价值链,中国制造企业嵌入中低端环节,缺乏定价权和获利空间,面临“低端锁定”的困局。

 

低端锁定现状对价值链升级的影响

3. 消费需求多样化无法被有效满足:零售渠道变革,线上线下消费渠道趋向高度整合,海量信息与选择使得消费者在供需市场中更具主动权。同时,消费者乐于尝新,不同消费群体呈现需求多样化。中国制造企业在产品创新,增加用户粘性等方面面临巨大挑战。

中国制造业升级发展趋势

针对中国制造业面临的三大挑战,亿欧智库提出制造业升级的发展趋势:

 

3.1 更高效:智能制造提高生产效率 

新技术的发展正在推动工业向新时代迈进。美国的工业互联网、德国工业4.0、中国制造2025等战略的发布说明制造业转型升级的新机遇已经到来。制造企业在通过智能制造提高生产效率时,必须以智能工厂为目标同时重视硬件与软件建设。

智能工厂是智能制造的核心载体,以全生命周期相关数据为基础,将生产过程扩展至生命周期。工业软件是智能制造的软件基础,是连接智能制造不同环节及板块的关键。

在生产制造与质量管控环节,智能工厂利用数据优化生产计划与生产实践,灵活应对订单变化与故障,显著提高生产效率;同时利用机器视觉与传感器等手段进行质量检测,及时处理故障,高效完成质检,提升产品质量。

通过技术应用提高生产效率:新技术的发展推动中国制造业企业从传统制造向智能制造转型,核心载体为由ICT企业、大数据及软件企业和装备自动化企业助力并衍生出的智能工厂。

 

智能工厂提升生产制造与品控环节表现

在生产制造、质量管控、决策管理和研发设计等环节优化流程,提升效率和品质。在智能化趋势下,制造企业必须根据其技术应用的实际情况选择相应策略,逐渐提升工厂的数字化与智能化水平。

中国制造向资本与技术密集型制造业转型,向数字化与智能化发力是未来中国制造发展的重要趋势。在实际转型过程中,工厂的数字化与智能化改造可以分为四个阶段。处于技术应用不同阶段的制造企业可采取不同的渐进策略,逐步降低劳动力成本在总成本中的比重,最终提升中国制造企业的国际竞争力。

 

3.2 更自主:提升制造业产品附加值

中国制造业已开始向两端转移,从自主研发和自主品牌寻求突破:中国制造业企业近年来更加注重自主品牌的打造,OEM模式表现出产品可替代性强、产品附加值低等问题,因此,传统以代工厂为主的制造业模式通过自主研发设计、打造自主品牌和营销渠道来提升工业附加值水平。

以家电品牌为例,如今中国家电品牌已基本脱离单纯的代工模式,自主设计开发成为行业主流。瑞士信贷报告指出:年轻的中国消费者越来越多地表现出对中国自主品牌的青睐,90%以上的中国年轻消费者更愿意购买国产家电品牌。

中国自主研发投入增加,不断出现新型产品种类:2019中国制造业企业500强共有专利91.74万件,同比增长18.06%;自主研发带来产品突破和创新,不断出现如植观、钟薛高、泉林本色等新型爆款品牌,新品牌通过差异化、新体验构筑企业壁垒。

中国代工厂通过加强研发,提升产品口碑和竞争力:中国部分代工厂通过在研发、设计创新方面的投入,提升了品牌知名度和竞争力。例如,松腾实业通过研发扫地机器人产品,目前已成为国际主流品牌的代工供应商;申洲国际通过每年4%的研发投入获得优衣库、耐克、阿里达斯等全球知名服装品牌的青睐。

自主品牌较代工模式毛利更高,具有较强盈利优势:以服装和化妆品制造业为例,建立自主品牌的企业具有更高毛利率,纯代工模式厂商毛利率普遍低于自主品牌制造厂商20%以上,有效的自主品牌将大幅提高产业附加值。

国产品牌接受程度随营销模式创新不断提高:随着新型消费群体的出现,国内出现了数字化营销、内容营销等众多针对新消费群体的营销模式,国产品牌借助新型营销渠道不断提升知名度,如李宁、百雀羚等老牌企业开始复兴,同时不断涌现钟薛高、玛丽黛佳、完美日记等各类新锐品牌。

3.3 更精准:互联网赋能制造业 

个性化与多样化的消费需求可以通过电商平台向消费制造企业传递,驱动制造企业改造生产模式。电商平台的快速扩张为消费大数据的积累创造了空间。互联网电商平台利用消费大数据为制造端的生产决策赋能,使消费者需求与生产端的对接成为可能。

消费者的需求与消费偏好首先在电商渠道转化为消费大数据,消费大数据被接入企业的生产管理和库存管理系统,用来指导企业的产品设计、生产计划与排期,并通过工厂的柔性生产线配合生产。

 

消费者大数据应用下的数据系统改造 

柔性生产的理想状态是“按需求生产”,即先有订单,再按订单个性化设计并生产。但由于生产始终存在滞后性,目前主要的销售模式仍然是“先生产、后销售”,在此基础上尽量降低库存、增加生产弹性。

不同品类的制造业企业实现弹性生产的方式比较多样,通常包括改造小规模生产线、零部件模块化、库存实时管理等方式。

中国制造业升级代表案例

根据报告提出的发展趋势,筛选具有代表性和实践性的企业及模式进行分析。

1. 网易严选:网易严选通过直连消费者与生产商,一方面减少中间环节,为消费者提供高性价比的商品,另一方面与生产商共享对消费者的需求洞察,促使生产商调整产品和生产计划,以更好地应对市场需求。亿欧智库选取与网易严选展开深度合作的代表性制造企业,以访谈的形式深入了解合作模式和成效。

 

网易严选与制造企业分工与合作模型

2. 酷特智能:酷特智能隶属于红岭服装集团,成立之初是传统OEM服装代工厂,在发展过程中积极探索大数据驱动的定制化生产模式,成功转型为大数据驱动的C2M企业,并搭建智能服务平台,助力其他制造企业转型升级。

 

酷特智能发展战略

3. 杰克缝纫机股份公司:主营缝纫机的缝前和缝中设备,专注缝制设备研发制造,已经成为中国缝制机械龙头企业。其自动化缝纫机设备在硬件方面对制造企业进行赋能,提高工厂的生产能力,为柔性生产提供基础。

结语

在劳动力成本上升、产品价值链中附加值较低、无法满足个性化消费需求等问题的压力下,通过智能化生产线改造提高生产效率,通过柔性生产提高生产灵活性,在互联网大数据的帮助下积极寻求合作和市场突破,是中国制造转型升级的必由之路。

 

金准产业研究 2019年中国大数据行业研究(下) 2019-11-14 18:57:21

金准产业研究 2019年中国大数据行业研究(上) 2019-11-14 18:56:27

前言

目前,大数据已从概念落到实地,在精准营销、智慧医疗、影视娱乐、金融、教育、体育、安防等领域均有大量应用,随着云计算、物联网、移动互联网等支撑行业快速发展,未来大数据将拥有更为广阔的应用市场空间。

一、大数据行业发展现状

1.1大数据产业概况

1.1.1大数据的定义

大数据(bigdata),是指需要通过快速获取、处理、分析以从中提取价值的海量、多样化的交易数据、交互数据与传感数据,其规模往往达到了PB(1024TB)级。不同机构对大数据也有不同的定义。

麦肯锡对大数据的定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

移动信息化研究中心对大数据的定义:大数据是帮助企业利用海量数据资产,实时、精确地洞察未知逻辑领域的动态变化,并快速重塑业务流程、组织和行业的新兴数据管理技术。

金准产业研究团队认为大数据具备海量(volume)、异构(Variety)、高速(Velocity)和价值(Value)四大特性。

1.1.2大数据的价值

随着移动互联网、云计算、物联网等信息技术产业发展日新月异,信息传输、存储、处理能力快速上升,导致数据量的指数型递增。

传统简单抽样调查分析已无法满足当下对数据时效性、海量性、精确性的需求。大数据的出现改变了传统数据收集、存储、处理挖掘的方式,数据采集方式更加多样化,数据来源更加广泛、多样化,数据处理方式也由简单因果关系转向发现丰富联系的相关关系,同时,大数据还能基于历史数据分析,提供市场预测,促成决策。

目前,大数据已从概念落到实地,在精准营销、智慧医疗、影视娱乐、金融、教育、体育、安防等领域均有大量应用,金准产业研究团队认为,随着云计算、物联网、移动互联网等支撑行业快速发展,未来大数据将拥有更为广阔的应用市场空间。

1.1.3大数据产业构建

大数据产业构建可分为6个层次,分别为:硬件设施、基础服务、数据来源、技术开发、融合应用及产业支撑。

1、硬件设施包括采集设备、传输设备、计算存储、设计集成4个方面;

2、基础服务包括网络服务、云平台服务、系统开发3个方面;

3、数据来源包括政府数据、行业数据、企业数据、物联网数据、通信数据、互联网数据、第三方数据7个方面;

4、技术开发包括数据管理、技术研究、信息安全3个方面;

5、融合应用包括工业、农业、政府、医疗、金融、电信、电商等行业需求相关的整体解决方案;

6、产业支撑包括数据评估中心、数据交易中心、科研机构、行业联盟、咨询机构、论坛会展、融资平台、孵化机构等。


1.2全球大数据行业发展现状

随着物联网、电子商务、社会化网络的快速发展,全球大数据储量迅猛增长,成为大数据产业发展的基础。根据国际数据公司(IDC)的监测数据显示,2013年全球大数据储量为4.3ZB(相当于47.24亿个1TB容量的移动硬盘),2018年全球大数据储量达到33.0ZB,同比增长52.8%。

从大数据储量分布情况来看,美国大数据储量占比为21%,EMEA(欧洲、中东、非洲)占比为30%,中国地区占比为23%。

基于大数据对各个行业的深入影响,2012年以来,美国、欧盟、日本等主要发达经济体积极推进大数据发展战略。

根据Wikibon研究数据,全球大数据市场规模将从2018年的420亿美元增长至2024年的840亿美元,年复合增长率为12.3%。

从细分市场来看,大数据软件市场份额占比将呈逐渐上升趋势,2018年,大数据软件市场份额占比为33.3%,到2024年,大数据软件市场份额占比将上升至41.0%;大数据硬件市场比重则呈下降趋势,2018年大数据硬件市场规模约为120亿美元,占比为28.6%,到2024年硬件所占比重预计将下降至24.1%。

全球排名靠前大数据企业主要包括IBM、SAP、HPE、Teradata、Oracle、Amazon、Microsoft、Google、Palantir、Splunk等。根据Wikibon数据,2017年,IBM全球大数据市场的10%份额,SAP占4%,Oracle、HPE和Splunk各占据3%市场份额。

根据市场分析和调查,2017年全球有53%的公司采用大数据分析,2019年,这比例上升至64%。2019年大数据分析在任务优化及业务自动化领域使用将更加普及。根据Frost&Sullivan数据,大数据分析市场规模正以29.7%的年复合增长率增长,金准产业研究团队预计到2023年增长至406亿美元。

2015年来,国家出台了一系列大数据政策,覆盖生态环境大数据、农业大数据、水利大数据、城市大数据、医疗大数据、交通旅游服务大数据等多层次下游应用市场。2016-2017年为大数据相关政策出台高峰期,根据赛迪不完全统计数据,2016年国家层面出台大数据政策12个,省级层面出台大数据55个;2017年国家层面出台大数据政策10个,省级层面则达到75个。同时伴随地方大数据政策出台,各地政府相继成立了大数据管理机构,促进大数据产业发展。

1.3中国大数据产业规模

2015年8月,国务院颁布《促进大数据发展行动纲要》,大数据正式上升为国家发展战略。2016年,工信部印发了《大数据产业发展规划(2016-2020年)》,全国引来大数据产业建设高峰,目前已形成八大大数据综合试验区,建成100多个大数据产业园。伴随新一代信息技术、智慧城市、数字中国等发展战略逐步推动社会经济数字化转型,大数据的产业支撑得到强化,应用范围加速拓展,产业规模实现快速增长。根据赛迪数据显示,2018年中国大数据产业规模为4384.5亿元,同比增长23.5%;到2021年,中国大数据产业规模将超过8000亿元。从企业业务布局来看,大数据产业主要集中在华北、华东及中南地区。

大数据产业园成为集聚大数据资源重要载体。

2016年2月,国家发改委、工信部和网信办同意贵州建设全国首个大数据综合试验区,2016年10月,第二批大数据综合试验区获得批复,包括两个跨区类综试区(京津冀、珠江三角洲),四个区域示范类综试区(上海、河南、重庆、沈阳),一个大数据基础设施统筹发展类综试区(内蒙古)。国家大数据综合试验区的成立,对国家大数据开放共享、大数据应用创新、大数据产业集聚等方面起到重要促进作用。

八大国家大数据综合试验区成立后,各地政府和企业也在积极推进大数据产业的发展,陆续设立大数据产业园区。截至2018年底,国内建成的大数据产业园超过100个,金准产业研究团队认为,大数据产业园成为集聚大数据产业资源的重要载体。

1.4大数据硬件市场概况

大数据硬件是指数据的产生、传输、存储、计算处理等所需的相关硬件设备,包括传感器、采集器、读写器、信息传输设备、芯片、服务器、存储设备、网络安全防护设备等。

当前中国正加速从数据大国向着数据强国迈进。根据IDC和数据存储公司希捷的一份报告显示,到2025年,随着中国物联网等新技术的持续推进,其产生的数据将超过美国,中国产生的数据量将从2018年的7.6ZB增至2025年的48.6ZB。数据量的快速增长将继续推动数据存储、数据处理等相关硬件市场需求。根据赛迪数据显示,2018年,中国大数据硬件市场规模为2541.7亿元,同比增长13.2%,到2020年,中国大数据硬件市场规模将达到2850.1亿元。

大数据软件是指用于实现数据采集、存储、分析挖掘和展示的各类软件,包括大数据计算软件、大数据存储软件、数据查询检索软件、基础平台软件、平台管理软件、系统工具软件和大数据应用软件等。根据赛迪数据,近年来中国大数据软件市场规模实现较快增长,2018年中国大数据软件市场规模为822.5亿元,同比增长30.5%,到2020年大数据软件市场规模将达到1362.6亿元。

大数据服务的内容涵盖范围较广,主要包括了大数据查询服务、大数据分析服务、大数据交易服务、大数据安全等。大数据查询服务是指大数据拥有者对数据进行封装,为客户提供按需的数据查询服务,典型案例包括阿里数据超市、数据魔方;大数据分析服务是指大数据服务提供商为企业提供大数据分析能力和大数据价值挖掘服务。

此外,大数据服务又可分为在线大数据分析服务和离线大数据分析服务,在线大数据分析服务主要依托SaaS或PaaS云服务形式,为客户提供在线分析服务。

根据金准数据,2018年,中国大数据服务市场规模为1317.3亿元,同比增长36.6%,到2020年,中国大数据服务市场规模将达到2393.1亿元。

二、大数据应用场景分析

2.1医疗大数据

目前,大数据医疗的应用场景主要包括临床决策支持、健康及慢病管理、支付和定价、医药研収、医疗管理,服务对象涵盖居民、医疗服务机构、科研机构、医疗保险机构、公共健康管理部门等,其应用有助于提高医疗服务质量、减少资源浪费、优化资源配置、控制骗保行为、改善自我健康管理,具有巨大潜在价值。

金准产业研究团队认为,大数据医疗行业市场规模快速增长。

近年来,健康医疗大数据应用市场规模快速增长,2014-2018年大数据医疗行业市场规模年复合增长率达到74.6%,2018年大数据医疗行业市场规模为56.3元,同比增长36.8%,其中数据整合管理市场规模为29.7亿元,数据分析应用市场规模为17.1亿元。

2016年10月和2017年12月,国家卫计委分别确定两批健康医疗大数据中心试点省份及城市,第一批为福建省、江苏省及福州、常州、厦门、南京;第二批为山东省、安徽省、贵州省。此前规划的“1+7+X”即1个国家数据中心、7个区域数据中心、X个应用发展中心,被调整为了“1+5+X”。中国的五大健康医疗大数据区域中心已基本确定,从地域来看,除了贵州拥有领先的大数据优势,而被确定为健康医疗大数据中心建设试点省份外,其余全部集中在华东地区。

金准产业研究团队认为,当前,虽然各地医疗大数据中心建设侧重点有所不同,但大体上形成了“一个中心多个产业园区或基地”建设共识。

2.2营销大数据

大数据服务商主要为企业提供大数据技术工具、大数据应用服务以及技术开发服务。

技术开发服务主要针对企业客户的个性化需求,为其定制开发大数据应用系统及其他相关技术产品服务,主要包括数据采集工具、数据分析系统、运营平台、会员管理系统等。

大数据应用服务主要为客户提供大数据在各个商业应用场景的解决方案,主要包括大数据营销和运营、数字媒体投放、电商运营等种类,其中大数据营销主要为客户提供数据采集、数据分析、潜在市场挖掘、会员管理、资产构建等服务;数字媒体投放服务利用大数据算法和技术实现精准投放,同时实现投放前中后数量及效果监测,优化投放方案。

程序化广告是指通过改造广告主、代理公司、媒体平台,将其与程序化对接,从而实现目标人群匹配、竞价购买,广告投放,投放监测反馈等一系列自动化过程的广告投放技术。程序化广告主要基于大数据的用户画像来定位目标客户群体,从而实现广告的精准投放,同时广告位的选择、竞价投放全部依赖机器完成。

相对于传统广告,程序化广告投放更加准确高效,同时节约资源成本。2012开始,程序化广告进入了高速发展期,2018年我国程序化广告市场规模达到471.9亿元,同比增长35.9%。

目前专注于程序化广告的上市企业包括亿玛在线、蓝色光标、汇量科技、爱点击、木瓜移动、新数网络等。

2.3公安大数据

大数据带来了数据处理方式变革,基于大数据的挖掘分析,将有助于公共安全治理机制由“事后处理”转变为“事前预测”。传统公共安全治理方式为应对式决策,体现为“事件突发—逻辑分析—寻找因果关系—进行突发事件应急决策”的流程;而预测式决策则是一种“正向”思维,体现为“挖掘数据—量化分析—寻找相互关系—进行突发事件预测决策”的流程。

大数据技术支撑下,由“(客观)事实驱动”的决策取代“(主观)经验驱动”的决策,将成为大数据时代智慧治理过程的关键特征。

在传统的公共安全应对中,政府部分几乎是唯一的治理主体,而在大数据时代,企业成为公共安全治理的重要参与主体。特别是一些互联网、信息技术行业领先企业,可以凭借其所拥有的大数据处理技术,协助政府管理者从海量数据中挖掘有益信息。

目前国内公安大数据的主要参与主体大致可以分为五类:第一类是以中国电信、中国移动为代表的通信企业;第二类是以浪潮软件、美亚柏科为代表的大数据、云计算等技术与服务提供商,该类企业数量较多,占主流地位;第三类是以华为、海康威视等为代表的设备供应商;第四类是以阿里、腾讯等为代表的互联网企业,具有强大数据获取能力;第五类是公安部的直属科研单位。


根据中国政府采购网披露招标项目信息,2016-2019年上半年,我国公安大数据成功建设项目共246项。2018年成功建设项目共为77项,同比增长14.93%,为历年最高值。

2016-2019年上半年,全国公安大数据项目建设金额为16.51亿元,其中全国83个警务云大数据项目建设金额共达8.91亿元,占总建设金额的54.0%;技侦大数据建设金额为1亿元,占比为6.1%;公安信息资源服务项目和网警综合平台建设金额分别为0.32和0.34亿元,占比分别为1.9%、2.1%。

2.4工业大数据

工业大数据的产生贯穿与整个生产制造过程,包括了设计、研发、订单、采购、制造、供应、库存、发货、交付、售后、运维、报废回收等整个产品生命周期所产生的各类数据及相关技术和应用。

工业大数据主要分为三类:第一类为生产经营相关数据,包括企业资源管理(ERP)、产品生命周期管理(PLM)、供应链管理(SCM)、客户关系管理等;第二类为设备物联数据,主要包括工业生产设备的操作和运行情况、工况状况、环境参数等,狭义的工业大数据主要指该类数据;第三类为外部数据,是指与工业企业生产活动和产品相关的企业外部互联网来源数据。

工业大数据是实现制造业数字化、网络化、智能化发展的战略基础资源,正在对制造业生产方式、运行模式、生态体系产生重大而深远的影响。工业大数据在制造业的作用主要体现在智能化设计、智能化生产、网络化协同制造、智能化服务、个性化定制等方面。

2019年9月4日,工信部发布了《工业大数据发展指导意见(征求意见稿)》,重点推进九项任务建设,到2025年,基本建成工业大数据资源体系、融合体系、产业体系和治理体系。

根据贵阳大数据交易所发布数据显示,2017年我国工业大数据市场规模约为212元,同比增长41.3%,结合国内工业发展及数字经济发展情况,预测2018年国内工业大数据的规模为292亿元左右,同比增长37.7%。

三、大数据行业典型企业案例分析

3.1零氪科技医疗大数据领域的首个独角兽企业

2018年上半年,零氪科技完成由“国家队”资本——中国投资有限责任公司参与的10亿元D轮融资之后,零氪科技估值程国内医疗大数据和人工智能领域的首个“独角兽”企业。

零氪科技成立于2014年,从肿瘤大数据入手,搭建了医疗数据服务平台,为医疗机构、制药企业、保险机构等提供医疗大数据解决方案,移机人工智能辅助决策系统、患者全流程管理、医院舆情监控及品牌建设、药械研发、保险控费等已提回服务。

零氪科技主要医疗大数据产品线包括:

人工智能辅助决策平台Hubble——通过数据可视化模块,为医院管理决策提供数据依据,场景化、流程化完成科研课题。

数据采集管理平台LinkLad——提供符合医生习惯的医学科研数据采集、管理、及应用的一站式服务。

智能辅助治疗平台——集成诊疗方案及相似病例推荐、医学影像智能诊断、风险预警等功能。

3.2木瓜移动——海外营销领军企业

北京木瓜移动科技股份有限公司是一家专注于大数据营销技术的科技型企业,由清华、斯坦福、谷歌北京的海归精英团队创立于2008年,总部设在北京,并在美国和中国香港等地设立了子公司。

木瓜移动的主营业务是利用全球大数据资源和大数据处理分析技术为广大国内企业提供海外营销服务,为中国数以万计的开发者、新经济企业和媒体提供低成本、便捷、快速、精准的出海业务和宣传服务。企业营销网络遍布北美、东南亚、南亚、中东、东欧等地区,业务覆盖一带一路65个国家和地区。

木瓜移动为企业提供海外营销服务,其商业模式一边对接全球媒体流量资源,另一边对接具有出海需求的企业、开发者和媒体,通过大数据分析技术为广告主提供最优投放方案,在节约广告主投放支出前提下获得广告收益。

在全球媒体对接方面,木瓜移动与Facebook、Google、网盟、Twitter、Bing、Linkedln、Snapchat等顶级流量平台合作,通过Papaya智能营销平台,为广告主提供广告自动投放、内容优化、数据分析并生成投放效果报告功能。目前平台数据库已覆盖全球20亿人,拥有上千个维度的实时时刻画建模,实现千人千面精准营销。

木瓜移动是国内最早开展全球程序化投放的企业之一,通过多年全球互联网营销业务积累了大量实践数据,并始终坚持核心技术自主研发,建立了全套拥有自主知识产权的大数据营销业务系统。在营销领域,公司积极推动大数据与人工智能技术融合,研发用户画像人工智能引擎(UME),实现对用户超1000个维度建模,提升营销效率;在数据层面,公司积累了200多个国家,20多亿人的目标受众数据,数据规模达到PB级别。





金准产业研究 2019年中国人工智能基础数据服务行业研究报告 2019-11-14 13:27:46

前言

在经历了一段时期的野蛮生长之后,人工智能基础数据服务行业进入成长期,行业格局逐渐清晰。

人工智能基础数据服务方的上游是数据生产和外包提供者,下游是AI算法研发单位,人工智能基础数据服务方通过数据处理能力和项目管理能力为其提供整体的数据资源服务,不过AI算法研发单位和AI中台也可提供一些数据处理工具,产业上下游普遍存在交叉。

2018年中国人工智能基础数据服务市场规模为25.86亿元,其中数据资源定制服务占比86%,预计2025年市场规模将突破113亿元。市场供给方主要由人工智能基础数据服务供应商和算法研发单位自建或直接获取外包标注团队的形式组成,其中供应商是行业主要支撑力量。

数据安全、采标能力、数据质量、管理能力、服务能力等仍是需求方的痛点,需要人工智能基础服务商有明确具体的安全管理流程、能够深入理解算法标注需求、可提供精力集中且高质量的服务、能够积极配合、快速响应需求方的要求。

随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注能力对人工的替代率将成趋势。远期,越来越多的长尾、小概率事件所产生的数据需求增强,机器模拟或机器生成数据会是解决这一问题的良好途径,及早研发相应技术也将成为AI基础数据服务商未来的护城河。

一、人工智能基础数据服务行业概述

1.1人工智能基础数据服务定义

意指为AI算法训练及优化提供数据采集和标注等形式的服务

人工智能基础数据服务指为AI算法训练及优化提供的数据采集、清洗、信息抽取、标注等服务,以采集和标注为主。人工智能概念爆发伊始,算法、算力、数据就作为最重要的三要素被人们乐道,进入落地阶段,智能交互、人脸识别、无人驾驶等应用成为了最大的热门,AI公司开始比拼技术与产业的结合能力,而数据作为AI算法的“燃料”,是实现这一能力的必要条件,因此,为机器学习算法训练、优化提供数据采集、标注等服务的人工智能基础数据服务成为了这一人工智能热潮中必不可少的一环。如果说计算机工程师是AI的老师,那基础数据服务就是老师手中的教材。

1.2人工智能基础数据服务的行业价值

目前有监督的深度学习是主流,标注数据是其学习根本

伴随国内人工智能热潮爆发,大量的AI公司拿到融资,为了不断提高算法精度,数据采标需求也空前爆发,一度催生了行业的繁荣。但早期的AI基础数据服务门槛较低,玩家鱼龙混杂,使行业标准模糊、服务质量参差不齐。随着竞争加快,AI公司对训练数据的质量要求也不断提高,并且当产业落地成为主旋律,需求方对垂直场景的定制化数据采标需求成为主流,众多小型AI基础数据服务公司从数据质量和采标能力上达不到要求,或被淘汰,或依附大平台,行业格局逐渐清晰,头部公司实力逐渐凸显。随着算法需求越来越旺盛,目前机器辅助标注、人工主要标注的手段需要改进提升,增强数据处理平台持续学习和自学习能力,增加机器能够标注维度、提升机器处理数据的精度,由机器承担主要标注工作将成为下一阶段的行业重心。未来,越来越多的长尾、小概率事件所产生的数据需求增强,人机协作标注的模式性价比不足,机器模拟或机器生成数据会是解决这一问题的良好途径,及早研发相应技术也将成为AI基础数据服务商未来的护城河。

目前有监督的深度学习是主流,标注数据是其学习根本

人工智能是研究如何通过机器来模拟人类认知能力的科学,机器学习是现阶段实现人工智能的主要手段。机器学习方法通常是从已知数据中学习规律或者判断规则,建立预测模型,其中,深度学习可以通过对低层特征的组合,形成更加抽象的高层属性类别,自动从信息中学习有效的特征并进行分类,而无需人为选取特征。凭借自动提取特征、神经网络结构、端到端学习等优势,深度学习在图像和语音领域学习效果最佳,是当今最热门的算法架构。在实际应用中,深度学习算法多采用有监督学习模式,即需要标注数据对学习结果进行反馈,在大量数据训练下,算法错误率能大大降低。现在的人脸识别、自动驾驶、语音交互等应用都采用这类方法训练,对于各类标注数据有着海量需求,可以说数据资源决定了当今人工智能的高度。由于应用有监督学习的AI算法对于标注数据的需求远大于现有的标注效率和投入预算,无监督或仅需要少量标注数据的弱监督学习、小样本学习成为了科学家探索的方向,但目前无论从学习效果和使用边界来看,均不能有效替代有监督学习,人工智能基础数据服务将持续释放其对于人工智能的基础支撑价值。

1.3人工智能基础数据服务的主要产品形式

定制服务为主要服务形式,数据集产品集中于语音类赛道

目前,国内AI基础数据服务主要为数据集产品和数据资源定制服务,数据集产品往往是AI基础数据服务商根据自身积累产出的标准数据集,以语音数据集为主,主体偏普通话语音、英文语音、方言语音等;为保证算法优势,客户更多采用定制化服务,由客户提出具体需求,数据服务商或直接对客户提供的数据进行标注、或对数据进行采集并标注。大型的需求方,为保障数据的安全,往往提供Web形式的自有标注平台给执行方,以此对整体项目进行把控,也有一些AI基础数据服务商向客户提供私有化平台建设服务,或将自身平台与甲方系统兼容;除以上两种形式外,部分AI基础数据服务商还向算法服务进行拓展,提供算法训练、模型搭建等服务。

1.4人工智能基础数据服务的发展背景

人工智能经济崛起为基础数据服务提供长期向好的基本面

2010年语音识别和计算机视觉领域产生重大突破,国内开始萌生AI概念。到2015年,国内迎来人工智能创业热潮,独角兽不断涌现,融资记录被不断打破。2012年-2019年8月人工智能领域共发生2787件投融资事件,总融资额达4740亿元,人工智能成为最炙手可热的融资热点,百度、阿里、腾讯、京东、华为等科技企业也纷纷加注。2017年至今,产业落地成为AI行业的主流,人工智能赋能实体经济保持高速发展态势,涉及行业包括安防、金融、零售、交通、教育、医疗、营销、工业、农业、企服等众多领域。下游的爆发式增长为人工智能基础数据服务的发展提供了长期向好的基本面。

数据量呈指数式增长,非结构化数据的应用依赖于清洗标注

PC、互联网、消费级移动设备的兴起宣告了数据时代的来临,物联网的发展更使线下业务产生的大量数据被采集起来,数据量呈指数式增长,据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%-90%是非结构化数据。过去计算机主要处理结构化数据,人工智能模型却以处理非结构化数据见长,但“玉不琢不成器”,数据经过清洗与标注才能被唤醒价值,这就产生了源源不断的清洗与标注需求。在我国,每年需要进行标注的语音数据超过200万小时,图片则有数亿张。

二、人工智能基础数据服务市场现状

2.1人工智能基础数据服务产业链

AI基础数据服务方是行业核心环节

2.2人工智能基础数据服务产业图谱

产业上下游普遍存在交叉

AI基础数据服务方的上游是数据生产和外包提供者,下游是AI算法研发单位,AI基础数据服务方通过数据处理能力和项目管理能力为其提供整体的数据资源服务。AI基础数据服务方整体有两大类,一种是具备自有的标注基地或全职标注团队,这类企业也参与产业上游部分直接提供产能资源,另一种是依靠众包或外包模式,专注于数据产品的开发与项目执行。下游部分AI公司拥有自己的标注工具,也可通过AI中台获取一些通用标注工具,同时一些数据需求大的企业还孵化了自己的数据服务团队。整体而言,产业上下游普遍存在交叉关系。

2.3人工智能基础数据服务行业投融资

融资规模集中于千万量级,早期融资项目居多

从融资规模来看,人工智能基础数据服务市场的融资多集中在千万级别。从时间维度来看,2015年人工智能基础数据服务商获得的融资金额相对较高,标志着行业初露头角,受到资本的认可。从获得融资的企业数量来看,目前获得融资的玩家并不多,资本市场表现的活跃度不高。从融资轮次来看,大部分融资仍然集中于早期融资,目前上市的企业仅挂牌新三板的数据堂一家(不考虑科技公司内部孵化的基础数据服务商)。人工智能基础数据服务毛利率普遍较高,但为保持与人工智能市场前沿算法的匹配,需要投入大量研发成本进行数据处理平台与工具的研发升级,因此对融资仍有较强依赖。

2.4人工智能基础数据服务行业商业模式

生产、获客、部署合力驱动发展

人工智能基础数据服务行业是典型的To B型业务,商业模式较为稳定。在生产方面,主要通过自建标注基地或标注团队、搭建众包平台、采购供应商外包服务(BPO)等模式实现生产运营,大多企业主要采取众包与外包模式,百度数据众包、倍赛等企业自建标注基地或全职标注团队,对于培训较高素质工作人员、完善团队管理有积极意义;在获客方面,主要通过口碑传播、学术会议与展会及代理渠道等模式进入市场,对销售人员熟悉市场趋势、客户需求的要求较高;在实施交付方面,有私有化部署和公有部署两类,能够较为灵活地应对客户对数据安全、交付周期与成本的个性化需求。

2.5人工智能基础数据服务市场规模

2025年市场规模将突破百亿,行业年复合增长率为23.5%

2018年中国人工智能基础数据服务市场规模为25.86亿元,其中数据资源定制服务占比86.2%,数据集产品占比12.9%,其他数据资源应用服务占比0.9%;行业年复合增长率为23.5%,预计2025年市场规模将突破110亿元。从整体增速来看,行业发展较为稳健,下游人工智能行业持续发力将形成长期利好。

2.6人工智能基础数据服务细分结构

纯标注服务为主体,由供应商提供服务占79%

2018年中国人工智能基础数据服务市场以语音、视觉、NLP领域的标注服务为主,同时提供采集与标注服务占比较少,这是由于生数据由需求方提供的情况较多,但这并不意味着市场中数据采集需求弱,相反,人工智能技术落地后产生了大量新兴垂直领域的数据需求,然而这些数据采集难度大,能够提供相关采集工具和服务的供应商将获取竞争优势。市场供给方主要由企业自建或直接获取外包团队的形式以及供应商组成,又以供应商为行业主要支撑力量,占比79%。

2.7人工智能基础数据服务市场格局

行业将提升至较高集中度,CR5占26%市场份额

目前人工智能基础数据服务行业CR5占26%市场份额,行业集中度较为适中,既非寡占型市场也非充分竞争市场,这一方面是由于百度数据众包、海天瑞声、数据堂等企业进入市场较早,积累了较多客户资源,另一方面则是由于下游企业之前多采用公开数据集训练模型,对数据的高精度要求由来尚短,受生态传导效应滞后影响,市场门槛还不显著,资金与研发实力较为薄弱的中小企业还有较强的发展土壤。然而未来,随着下游企业发展壮大,直接使用外包团队成本低廉、数据安全可控性强,一些基础性需求将由下游企业自给自足,外部的数据服务商现有的存量市场面临下降,因此必须承担高难度、前沿独特性任务,这就要求其自身投入高精度、专业化数据处理工具的研发和人工智能算法基础研究,以把握客户需求,开拓增量市场,因此资金与研发实力成为较高行业门槛,同时受近年资本市场冷却影响,一批中小型厂商面临业务收缩,再者部分厂商如倍赛开始在业内并购,参考海外数据服务市场发展情况(海外行业巨头Appen多次并购其他企业),并购也将成为市场趋势,多种因素叠加影响下,行业集中度将提升。


三、人工智能基础数据服务场景分析

3.1视图基础数据服务市场现状

人像与OCR数据是视图基础数据服务的主流

在不考虑自动驾驶的前提下,2018年视图基础数据服务市场达到6.6亿元,人像与OCR数据是视图基础数据服务的主流,尤其人像数据占市场的42.9%。OCR占27%,其他的人体识别数据、商品识别数据、工业质检数据、医学影像数据及其他新场景数据等较为分散,合计占市场30.1%。

视图基础数据服务技术趋势

针对算法研发方向判断数据需求,挖掘增量市场

按照数据使用方向,可以划分为新算法模型搭建与研发、在已有算法基础上增加新模块、解决方案交付过程中定制优化等三类,其中新算法模型搭建与研发和在已有算法基础上增加新模块类型的数据需求是可以根据相应机器视觉算法的前沿研发方向来判断预测的。例如,就智慧城市场景而言,针对汉族的人脸识别和视频结构化已较为成熟,在实际应用场景中还需针对少数民族和其他人种进行优化以提升整体算法准确率,此外,跨镜追踪成为场景研发热点,相应的跨摄像头数据如何标注对算法训练也会产生较大影响,再及,深度相机可以帮计算机读懂三维立体的监控视频,还能够较好地解决复杂光照条件下视图数据采集的问题,也将在未来成为重要的研发方向,综上,多民族、多人种数据、跨摄像头数据、3D数据的采集与标注服务将为视图基础数据服务市场的发展带来增量空间,OCR、手机、零售等其他领域也同理可针对算法研发方向挖掘增量市场。

3.2自动驾驶基础数据服务应用场景

算法尚未成熟,对数据有长期需求,且缺口仍在

L3级别以上的自动驾驶系统主要有感知、定位、预测、决策和控制五部分,其对于计算机视觉技术的需求度远高于ADAS,系统需要对雷达、摄像头等传感器采集的点云和图像数据进行抽取、处理和融合,构建车辆行驶环境,为预测和决策做依据,这对于算法的准确性和实时性有极大考验。目前自动驾驶的视觉技术主要应用有监督的深度学习,是基于已知变量和因变量推导函数关系的算法模型,需要大量的标注数据对模型进行训练和调优。在世界级无人驾驶大赛中,主办方往往提供近亿张图片、数十万张标注图片供参赛团队训练使用;在路测或真实道路驾驶时,如人车混杂、分布稠密、行为多变等复杂环境问题更需要海量的真实路况数据不断对算法进行优化,才能保障无人驾驶车辆正常可用。如今国内自动驾驶飞速发展,AI公司、科技公司、高精地图厂商、车厂等参与者众多,该领域的数据采集和标注需求已经成为AI基础数据服务的主要项目之一,且自动驾驶算法应用仍待优化,数据需求缺口仍在,市场远未饱和。


自动驾驶基础数据服务市场现状

2025年采标规模将超24亿,科技公司和车厂是主要需求方

自动驾驶基础数据主要是道路交通图像、障碍物图像、车辆行驶环境图像等,需求方以科技公司、汽车厂商和高精地图厂商为主,2018年自动驾驶行业基础数据服务规模为5.76亿元,预计2025年将超24亿元,三方规模占比分别为49%、47.2%和3.8%,行业数据总任务量超一亿张,2D图像标注与3D点云标注任务量基本为2:1。其中高精地图厂商算法较为成熟,数据自动化标注程度可达90%左右,外包需求较少;以百度、图森未来为代表的自动驾驶科技公司一直是该领域基础数据服务的主要买方,平均各家算法训练图像数据累积需求在千万级以上,随着落地项目进程加快,将会有更多细分场景的需求产生;近几年,汽车厂商在ADAS和自动驾驶方向的投入明显,上汽、吉利等厂商年投入均可达数亿元,对于数据的采集和标注需求也逐年增加,预计未来3年中,汽车厂商将成为需求主力。


3.3智能交互基础数据服务市场现状

远场语音交互成为主流需求,中文类数据仍占据市场核心

2018年语音交互相关数据服务市场规模达到13.5亿元。语音交互主要分为近场交互、中场交互和远场交互,以智能影音家居、可交互机器人和车机为代表的中远场交互类数据服务需求合计占到智能交互基础数据服务的68%,成为当前智能交互基础数据服务的主流需求,因此针对远场语音交互的低噪声环境服务具有较强发展潜力和议价能力。在服务语种上,中文(含方言)服务占据71%的市场份额,外语种资源相对稀缺,采集和标注难度较大,成本相对更高,目前占29%的市场份额。

智能交互基础数据服务技术趋势

实现跨语音识别、语义理解的复合数据标注

目前企业在智能交互系统的建设中,对单纯的语音识别或合成方面技术能力相对较完善,而在上下文理解、多轮对话、情绪识别、模糊语义识别、意图判断等方面的研发痛点更强,根据智能交互系统算法的发展,迭代并设计符合算法需求的NLP数据产品,有助于从数据层面推动智能交互系统的发展。特别的,对话系统的效果对标注数据的质量和规模依赖性很强,但目前受标注数据和模型能力的双重制约,对话流程还无法对语音、语义整个交互流程打通,而实现跨语音识别、语义理解的复合数据标注可以帮助减轻语音信息与文本信息之间的信息误传导,对整个对话流程效果增强能够产生积极影响,将增加智能交互基础数据服务探索的可能性。

四、人工智能基础数据服务需求分析

4.1人工智能基础数据服务客户定位

客户分为AI公司、科技公司、科研机构、行业企业四类

从需求方来看,AI公司和科技公司占主要份额,AI公司更聚焦于视觉、语音等某一类型的基础数据服务,而科技公司结合集团优势,向人工智能整体发力,不同部门会产生多类型数据需求,科研机构需求占比较小。此外传统意义上的行业企业,如汽车厂商、手机品牌商、安防厂商等传统企业围绕自身业务进行技术拓展,也开始产生AI基础数据需求,并且量级逐渐增大,未来将释放更多市场空间。

4.2人工智能基础数据服务核心需求类型

AI应用三大阶段,对基础数据服务产生差异化需求

企业应用人工智能算法要经历研发、训练和落地三个阶段,不同阶段对于AI基础数据服务也有差异化需求。研发需求是新算法研发拓展时产生的数据需求,一般量级较大,初期多采用标准数据集产品训练,中后期则需要专业的数据定制采标服务;训练需求是通过标注数据对已有算法的准确率、鲁棒性等能力进行优化,是市场中的主要需求,以定制化服务为主,对算法的准确性有较高要求;落地场景的业务需求中算法较为成熟,涉及的数据采集和标注更贴合具体业务,如飞机保养中的涂料识别数据等,对于标注能力和供应商主动提出优化意见的服务意识有较强要求。

4.3人工智能基础数据服务需求痛点

五大需求痛点决定AI基础数据服务商的服务标准

目前需求方在选择数据服务时往往会遇到数据安全、采标能力、数据质量、管理能力、服务能力等痛点。对于数据安全,需求方希望基础数据服务商有明确具体的安全管理流程,对数据传输、存储,以及结项后的数据销毁等环节比较重视。在采标能力方面,需求方算法越来越贴近业务,希望数据服务商对于自动驾驶、工业等有一定门槛的领域有采集能力,并且能理解客户意图,配合标注,甚至可以提出标注建议;根据市场反应,大多数数据服务公司首次交付项目时,数据的准确率普遍偏低,都需要一到两次的返工,故需求方对无效数据少、准确率高的公司更加青睐。对于执行效率,一般AI基础数据服务商都能在项目周期内完成,但管理能力较弱的公司很难在兼顾多个项目时做到精力集中、高质量地服务客户,同时执行团队的素养与信誉也是重要影响因素。服务意识是一项软实力,需要AI基础数据服务商能够积极配合、快速响应需求方要求。

结语

人工智能基础数据服务发展建议

企业由被动执行向主动服务的意识跃迁

单纯依据客户各个项目的诉求进行数据采集和标注属于被动执行,主观能动性低、行业边界有限,各家公司的产品和服务趋于同质化、竞争呈胶着状态,制约着AI基础数据服务的发展。通过对需求方的研究,发现除安全性、质量、效率等核心关注点之外,越来越多的需求方对数据服务公司产生了主动服务的需求,希望数据公司能够更懂算法技术、更懂需求场景,甚至能参与到算法的研发中来,给出数据采标方面的优化建议,这也为数据服务商形成差异化竞争带来了契机,尤其是在AI落地阶段,在垂直场景中能够形成一套集调研、咨询、设计、采集、标注为一体的AI基础数据整体解决办法,将在收入和业务边界上实现突破。



金准产业研究 AI与机器人的42个大问题(下) 2019-11-12 17:00:07

31AI会给人类文化带来怎样的转变?

AI和机器人概念已经成为了现代文化的重要组成部分,你能在文字或影视的故事里看到它们,也能看到它们被用于商家宣传的广告中,现在你甚至还能直接看到机器人表演的节目(比如《机器人擂台》 )以及AI生成的音乐等作品。

毫无疑问, AI和机器人已经成为了人类文化的重要组成部分,它们不仅仅是我们的娱乐方式,而且也在启迪着人类对自身的思索以及关于整个宇宙的哲学思辨。

举几个例子, 在《2001太空漫游》 中, AIHAL9 0 0 0 成 为 了一个经典的邪恶AI形象,也在很大程度上影响了人类对AI的认知。在《黑客帝国》 所描述的故事中, AI甚至将人类包裹进了一个虚拟世界之中,这也激励着观众去思考和探究现实和真实本身。而在电影《她》中,智能系统Samantha展示了超级 AI解救人于孤独之中的潜力,同时也描述了 AI最终超越并抛弃人类的可能性。

32AI将如何影响艺术创作?

2018年 , 一副AI创作的画作拍出了432500美元的高价,成为了 AI艺术史的一个里程碑事件。但AI实际上早就已经进入了艺术创作领域一它们已被用来渲染图像、 创作音乐、 生成游戏场景和创作诗篇,甚至还已被用来生成小说和电影剧本。

举个例子, Continuator可以在学习了音乐家的风格后表演类似风格的音乐,其表现能力让一位爵士乐音乐家也颇为吃惊:“ 我听到的一切我都能理解。那是我的音乐世界。它的演奏就像我的演奏方式,只是它演奏出了我之前的音乐声响世界中从没想到过的东西。”

毫无疑问, AI还必将在艺术创作中发挥更重要的价值。AI对艺术的影响也得到了很多人的关注和探讨一 作品的著作权属于谁?AI的设计者算是艺术家吗?如果机器没有意识,那么它的艺术是要表达什么?因此,也有一些观点质疑AI创造的东西能否被称为“艺术” 。

33AI是否有助于提升人类的创造力?

AI的一大好处是能让人免受繁冗的任务之苦。借助AI,创造者可以将更多精力和时间投入到策略和创造性思考上。不仅如此, AI还能为创造者提供有关市场需求的见解以及对未来前景的预测。

比如在音乐方面, AI可以成为音乐家的力助手,甚至可以直接参与音乐创作。在视觉艺术方面 , AI 有得天独厚的优势 。比 如 AI可 被 用 于 帮 助 作 者 理 解 内容,进而帮助他们获取进一步设计的素材。Adobe 开发的 Concept Canvas 就是其中一例。这个工具可以学习“看懂”图像、识别显著的元素和布局并自动标注和描述它们,然后让用户可以基于不同概念之间的空间关系搜索图像。

AI也可以帮助书写文章 , 比 如2016年《华盛顿邮报》 实验了使用自动故事生成来帮助报道里约奥运会。据介绍,机器学习可被用于收集相关的事实,并将它们融合为一份草稿。这能为写作者提供一个写作起点,并帮助他们理解他们写作的主题和重点。然后写作者可以在此基础上将其完善为能吸引读者的内容。可以说,这能消除写作者工作中的繁琐部分,并为写作者提供更多数据,帮助他们获得更大的创造力。

34AI将如何改变法律?

AI的发展与应用不仅会深刻地影响我们的生活和生产,催生出一种数据和算法驱动的全新的智能经济与社会形式,而且会带来法律的演进。

BradSmith所言,未来可能出现“ AI法律”这一全新的领域,正如互联网过去20多年的发展使得隐私和个人信息保护法律成为一门显学一样。虽然AI法律尚在起步阶段,侵权、隐私等法律已经适用于AI,在自动驾驶等领域开始出现新的法律。

因此未来可能诞生AI法律职业共同体,出现专门从事AI法律的学者、律师、法官等。

另一方面, AI也会让当前和未来法律人的工作内容和方式发生极大变化。当前AI已经开始起草合同、起诉书、判决书等法律文件,可以对法律文章、判决书等进行自动摘要,被用于辅助司法审判等。可以有把握地预测,未来所有法律人都将依赖AI来辅助其从事法律职业。这要求现在和将来的法律人掌握新的技能和思维。

35AI系统能否内置道德伦理规则

我们创造AI的目的是为了给人类创造更美好的生活,因此有必要让AI懂得遵守人类的道德伦理规范。那么我们究竟能否做到这一点?

人类的道德规范往往可以用自然语言描述,但却难以编写成计算机代码或其它任何能被机器理解的方式,因此,让AI具备理解人类自然语言的能力可能对这一任务具有极其重要的价值。幸运的是,近年来自然语言处理( NLP) 技术突飞猛进,取得了非常重要的进展,让我们离AI真正理解人类语言的目标又更近了一步。

但这个问题远不止涉及自然语言处理,一个更加核心的问题是我们人类自身尚且还没有在道德方面形成完全一致的看法,更何况现实生活中还往往存在着两难的道德困境。而机器往往需要清晰明确的指标以实现优化和判断。

举个例子,我们该如何让机器学会克服其训练数据中的族群和性别偏见以实现公正?如果工程师无法为“公正”这一概念提供精准的定义和评估指标,那么机器也将很难学习到它,进而可能导致AI拒绝或无法为少数群体服务的后果。

牛津大学研究员Vyacheslav Polonski在一篇文章中总结了设计更道德的机器所应遵循的几个指导方针:

明确定义合乎道德的行为;

让大众参与到人类道德的定义之中;

AI系统更加透明。

目前来看这几点都还很难真正在实际生活中实现,光是第一条就很难办到,毕竟我们连怎样确定人类是否道德都还没有一致的看法,更勿论创造道德的机器了。

36、需要创造现代版本的阿西莫夫机器人定律吗?

阿西莫夫机器人定律:

第一定律:机器人不得伤害人类,或坐视人类受到伤害。

第二定律:除非违背第一法则,否则机器人必须服从人类命令。

第三定律:除非违背第一或第二法则,否则机器人必须保护自己。

第零定律:机器人不得伤害整体人类,或坐视整体人类受到伤害。

阿西莫夫机器人定律是一个科幻设定,具体实践起来可能非常困难甚至完全不可能。这主要涉及到一些实际操作上的难题,比如如何将这些定律转换成机器能够解读的语言、如何保证机器确实能够理解这些定律、如何确保机器理解这些定律的方式符合我们的意图。毕竟,使在阿西莫夫自己写的科幻故事里,机器人在解读这些定律上也出现了一些逻辑困难。因此,我们很可能需要开发一种可以实现的现代版本的“阿西莫夫机器人定律”。

一些研究者正在为实现阿西莫夫机器人定律的目标而努力,比如机器人安全研究 SamiHaddadin的博士论文《实现安全机器人:向阿西莫夫第一定律前进》就研究了这样一个重要问题:如何确保人类与机器人共存时的安全?具体内容涉及人与机器人交互中的伤害评估、效果评估以及影响伤害情况的因素。另一些研究者则试图更新阿西莫夫机器人定律,比如维也纳应用艺术博物馆负责人 Christoph Thun-Hohenstein 提出了三条定律:

1、 智能机器人必须为人类的共同利益服务,并帮助我们人类实现生态、社会、文化和经济上可持续的生活。

2、 智能机器人只能在与人类相容的程度上替代人类工作者,从而帮助人类创造有尊严、文化和创造性的自我实现的有意义的生活一除非该规则与规则1冲突。

3、智能机器人必须被设计为合作型的自学习机器并且始终会协同式运作一除非该规则与规则1和2冲突。

AI所可能遇到的问题,比如谷歌的一项研究就找到了五个安全应用AI所应注意的问题:

避免负面影响 : 我们如何确保 AI系 统在实现自己的目标时不会为其环境带来负面影响?

避免奖励被攻击:我们如何避免AI系统的奖励函数被攻击或利用?

可扩展的监督:我们如何有效确保给定的AI系统做种目标的各个方面,即使当在训练期间频繁评估这些方面时具有过局的成本?

安全探索:如何确保AI系统的探索行为不会造成负面影响?

在分布变化时保持稳健:我们如何确保 AI系统在使用环境非常不同于其训练环境时也能够稳健地识别和采取行动?

在确保未来AI和机器人的行为符合人类的利益方面还有很长的路要走,这不仅需要技术上的攻坚克难,还需要我们在语言以及伦理道德方面做更多探索。

37AI的行为可能偏离人类的目的和利益吗?

当前的 AI已经能够表现出一些设计者计划和意料之外的行为,比如利用游戏漏洞刷分、 在遇到人眼无法识别的对抗攻击时出错。所以AI的行为有可能发生偏移,尤其是当我们无法解读AI决策的原因时,也就很难预测它在不同环境下的实际表现,进而产生意料之外甚至有违设计者设计初衷的行为。

更进一步,已有研究者表达了对AI偏离人类整体利益的担忧,这种偏移可能是有意的,也可能完全是人类自身的无心之 失 或 在 设 计 逻 辑 上 的 缺 陷 。哲 学 家Nick Bostrom提出过有关于此的思想实验 : 如果将一个强大AI的任务目标设置成“最大化的生产回形针”, AI就可能会为了这个目标而偏离人类原本的目的和利益,比如为了维持生产拒绝被人类关闭、为了获取生产回形针的原料而抢夺资源甚至猎捕人类。

当前的AI就像是人类诞生的婴儿,基本上还处在人类的控制之下。但随着技术的进一步发展,系统的复杂度的进一步提升,我们可能未来将越来越需要借助AI系 统 设 计 迭 代 新 一 代 AI系 统 。AI将可能借助自己的力量实现未来的进一步成长,到那时候,人类还能确保AI与自己的利益一致吗 ?

38、如何解决AI可能具有的歧视与偏见问题?

歧视已经是AI领域内一个老生常谈的问题了。AI的歧视主要可分为以下几类:

数据偏见。如果训练深度学习模型的数据存在某些群体代表性不足的问题,那么训练好的模型可能难以处理来自这些群体的新数据。比如如果人脸识别训练数据集中的主要使用白人的数据进行开发,那么在黑人群体使用该模型时就可能出现显著更多的错误, 从而表现出歧视。

人本身的偏见。在训练数据时,我们往往需要对数据进行标注,如果我们依照自己的偏见将某些数据标记为“正确”,将另一些标注为“错误”,那么模型就会从这些标注后的数据中学习到人的偏见。此外,设计者在设计新模型时,可能会刻意调整模型的参数以便拟合已知存在缺陷的数据,这样也可能为实际应用引入偏见。

刻意歧视。“ 大数据杀熟”已经成为了一个网络热词。这是指电商企业通过分析用户的消费习惯、决策心理、个人画像,从而对用户越来越“熟悉”,从而为自己创造杀熟条件。和通常的歧视新用户的案例不同,“大数据杀熟”的歧视针对的是忠诚的老用户,也因此更难察觉。

解决AI的歧视问题既需要研究者通透完备地思考,也需要有相关的法律法规保证。

39、具有或不具有身体的AI是否应该被区别对待?

想象这样一个场景,一个是没有身体的超智能程序,一个是外观与人类别无二致的塑像,当它们遭受破坏时,我们更容易对哪一个产生同情?这个问题的答案并不显而易见。一项研究表明,如果机器人的身体形状不一样,我们就可能对其产生不同的情绪。在面对一个具有身体的智能机器人与一个没有可以控制的身体的智能软件,我们更可能对机器人产生同理心。

这个主题也涉及到一个被称为具身认知(embodied cognition)的研究领域;该领域希望能找到智能与身体之间的联系,以期揭示出智能的形成机制和本质。根据斯坦福的定义,具身认知是将认知建模为神经和非神经过程的动态交互的产物,其中认知、智能体的身体体验和现实生活背景之间不存在割裂。具身认知的研究能为我们寻找这一问题的解提供参考。除此之外,我们也还需要在法律和伦理道德等方面探寻它的答案。

40、如何避免AI技术被恶意使用?

比起AI无故失控, AI被人类恶意滥用的可能性应该还会更高一些。实际上,近来的一些事件已经展现出了 AI被滥用的潜在危害:

加大社会分歧。人们基本上总是更喜欢与自己观点一致的新闻或评论,个性化智能推荐则会让人更沉浸于与自己观念一致的氛围中,这会让人更加确信自己的 观点是正确的,尽管那可能存在漏洞或过于片面。而更让人担忧的是,恶意者可能会利用个性化推荐的这种缺陷故意传播偏颇片面的内容,进而诱导不同群体之间产生更明显的分歧甚至敌意。

侵犯用户隐私。进入智能手机时代以后,软件过度收集用户数据早已不再是什么新鲜事了,甚至 现状。而随着AI应用的普及,这一问题可能还会进一步恶 化 , 比如语音助手或智能音箱可能被用于偷听和分析用户日常生活对话,并基于此投放广告。随着AI的到来,“没人知道你是条狗”的互联网早期故事已成往事,现在人们不仅知道你是条狗,而是还知道你的品种、爱好、毛色甚至性取向。

41AI事故如何追责?

AI在自动驾驶、机器人等领域已经出现了一些事故,造成了人身财产的损害,使得追究AI的法律责任成为一个各界争议颇多的话题,国外开始出现一些新的立法趋势。

当然, AI还不是法律主体,不能像人或公司那样为其行为独立承担法律责任。因此,对于AI造成的事故,应当考虑追究个人、公司等相关法律主体的责任。我们的法律责任体系当前有过错责任、严格责任、产品责任等,因此必须在既有的法律框架之内考虑AI事故的责任承担。比如对于无人驾驶汽车,在不存在司机或司机无过错的情况下,就可以基于产品责任让系统设计者、研发者、硬件提供者等承担责任。

然而, AI所具有的自主性、不可预测性等特征可能给责任承担提出挑战,使得受害人的损害无法获得弥补。因此,欧盟、英国等开始考虑出台新的责任规则,如通过保险、赔偿基金等方式来分担事故的损害。未来随着AI应用的普及,我们必须能够以明确的规则和方式来追究AI事故的责任,以培养消费者和生产者的信心。

42、如何更为公平公正地分配AI所创造的价值?

我们的经济体系基于对经济所做的贡献的补偿,而这又通常是通过工资来衡量的。目前大多数公司仍然是通过人力劳动来创造经济价值 但一旦进入AI时代,公司对人力的依赖将减少,这就意味着享受公司收入的人会变少。由此可能导 致 拥 有 这 些 AI驱动的公司的人将赚取大量财富,而没有所有权的人却一无所获。

事实上,技术加大贫富差距的问题已经开始显现了 据世界经济论坛报道 2014年底特律前三大公司和硅谷前三大公司所产生的收入基本相当,但后者的员工数量却不到前者的十分之一。这样显著的差距必然会给价值分配造成严重的不均衡。随着AI技术的应用,这样的差距还会进一步拉大。正如《 AI及其对收入分配和失业的影响》中写道的那样:“如果智能变成了支付的能力,那么可以想见最富有(经过增强的)人类的生产力(智能能力)将远远超过未有增强的人类,从而让绝大多数人更进一步落后。”

如何为之创造公平的分配机制将具有非常重要的意义。目前人们正在探讨的政策可能性包括全民基本收入与机器人税。

全民基本收入。全民基本收入的概念很简单,也就是无条件地向每个合法居民发放足够其正常生活的财物。据联合国教科文组织,全民基本收入有望给不平等问题带来极大影响。贫困将被消除,劳动将更尊重意愿;而且由于工作者可以选择退出,工作者与雇主之间的权力关系也将更加平等。人们将更有可能合作起来为市场之外的人提供产品和服务,因为这样的活动再也无需为参与者的生活提供基本的标准。全民基本收入自然也存在反对意见,包括降低人们工作的动力从而导致劳动力减少、支持全民基本收入需要很高的税率。

机器人税。即向机器人产生的财富的征收更高的税,以此限制企业过快地用机器替代人力 (social safety net)所需的资金。

AI和机器人的发展必然将给人类社会带来天翻地覆的变化。在这场正在实现的巨大变革中,如何能够更为公平公正地分 配 AI所 创 造 的 价 值 将 是 一 个 值 得 所有人思考的问题。

金准人工智能专家认为,人工智能以及机器人学属于前沿科学的范畴,相对于已经发展了几百年的成熟的基础科学和应用科学,人工智能仅有几十年历史,尚处于起步阶段,远未形成坚实的基础和完整的架构。研究人工智能,技术是个难题,但相比技术,更深层次的哲学问题尤为重要,而且在几乎任何领域,提出正确问题可能比找到最终答案更加重要。腾讯AI Lab这份AI42个问题正是AI探索道路上最基本、最重要的问题,值得所有人的思考。