掘金大数据产业
⑴ 马云做大数据怎么赚钱
随着大数据时代的来临,大数据早已不再神秘。带给我们众多的冲击,每个人都应当与时俱进、不断提升,放弃残缺的守旧思想,大胆接受新的挑战。
任何一家有EXCEL表格的公司,都敢说自己是大数据公司;任何一个地方政府公开有数字的PDF文档,就敢说是政府大数据公开。以至于业界人士担忧,某天大家再听这个概念都麻木了,然而行业还是没有做出多少事情。
区域数字鸿沟巨大
说起掘金大数据,一定绕不开政府数据。地方政府掌握着80%以上的数据。每隔一段时间,从中央到地方,都会发布关于大数据开放的政策。高层谈新经济,言必称大数据。
而在执行层面,目前地方政府大多处于观望状态。关注政务数据领域的清华大学数据科学研究院执行副院长韩亦舜表示,政府数据开放并没有那么复杂,需要有地方能真正去实践和摸索,做一些事情,当下所有的人都在谈数据开放,但做实事的不多。
韩亦舜曾建议西部一些地方政府借大数据发展的机会,率先开放数据获得先发优势,另外同步做好信息化补课。
6月份,笔者见到一位来北京寻求合作的西部省份地理信息测绘局局长,他长期在部委工作,前些年调到地方当部门一把手,发展大数据思路清晰,不过让他苦恼的是,当地信息化水平不高,很多地方没有数据,有的数据还在纸上。
他酝酿出台一个规定,以后所有的图都不准画在纸上,必须上网,以电子化的形式存储。当下他最想解决的问题是信息化,先收取数据,然后通过建立地方数据中心的形式,与企业合作,做地理信息垂直领域的数据开放和挖掘。
走在前沿的贵州省,希望以发展大数据弯道超车,实现新经济的腾飞。然而从数据开放的程度来看,当地一些职能部门,所谓的公开数据还停留在提供PDF文件阶段,远非结构化的数据,按照国际数据公开标准来说,并不能算政府数据公开。
单从数据开放来看,思路最清晰规划更具体的,还是广东、上海等发达地区。对于地方政府的大数据园区来说,发达地区好比“富二代”,一出生就含着金汤匙,但大部分地区还是“穷二代”,需要更大力度的数据挖掘与开放。由于各地在大数据方面存在差距,不同区域的数字鸿沟会继续深化。
饥渴的大数据创业公司
在掘金大数据的背景下,企业早已经等不及了。早些年,部分企业通过各种交易手段,获得政府数据。在数据开放的背景下,部分企业还在依托不规范交易,已经有政府部门被巡视组查出了因数据交易衍生腐败。
一部分企业希望参与政府数据公开进程,帮助政府做数据公开。比如数据堂公司与贵阳市政府共建数据生态城市。还有一批公司,则是急速扩张,跟各地政府成立相关的合资公司。
当然,还有转型大数据二次创业的公司。在贵阳数博会上,笔者见到很多大数据公司,就是以前卖电脑和软件开发的IT公司,转型做大数据,业务范围无所不在,包括智慧城市、软件开发、智慧农业、医疗等。
除上述归类外,企业为了获取政府数据,采取各种“曲线救国”的招式。前不久,笔者熟悉的一家南方大数据创业公司,为了获取某西部城市政府部门数据,报名参加当地的创业大赛,希望通过得奖,引起当地政府重视,达成数据合作。
这家公司的CEO在参赛间隙,拖着行李箱与当地国企联络,希望能够以合资的形式成立公司,共同挖掘当地数据。
这位CEO还通过各种方式,找到该市分管大数据的负责人,希望能够谈成合作。他勾画的蓝图很美好:获取一个城市的数据,做成样板,然后在全国复制,迅速从0到1成为该行业的“寡头”企业。
不过,目前还没有关于这家公司取得实质进展的消息,但这家公司寻求政府大数据开放的决心和路径,颇具有典型性。
政府资源导向,仍是目前很多数据公司努力的方向。很多大数据公司在融资过程中,强调一定要有国有资本进入,而且坚决远离境外资本。
从2015年国内最大的几笔大数据创业公司的融资情况来看,几乎都有国有资本进入,即便只占很小的比重。在某大数据公司融资发布会上,笔者随机问了几家投资机构选择投资这家公司的原因,答案惊人一致:有政府数据资源。
而在一些专家和专业投资人看来,从价值投资的角度,一是真正有技术优势的公司,二是有自己数据源的公司。依托政府资源的公司,从长远来说,并没有太大的投资价值。
乐观者认为,政府数据开放最终会走向规范化,有科技含量的公司最终会在泡沫破灭后存活下来。
BAT能否领军?
BAT中的某一家,会成为全球最大的数据公司么?
在专业人士看来,媒体喜欢造概念,这个说法很不专业。因为数据就像石油一样,每个地理区间都有,谁储存了多少,很难量化和比较。
马化腾和张小龙都说,他们很焦虑,因为用户花在微信上的时间太多了。不过马化腾又说,微信公众号是腾讯前三年最伟大的发明,因为可以把人留在微信上,大家就离不开了。
BAT三家公司一方面通过自身的数据,做出反映数字中国的图谱,甚至把脉经济走向;另外也在建立自身的数据生态体系;以网络为代表,则认为大数据的最终应用是人工智能。
京东CTO张晨告诉笔者,因为京东有自己的物流体系,其电商数据包括详细的消费者画像。张晨说,如果通过电商大数据分析,提高精准服务水平,能提高销售一个百分点,对京东来说都是很大的大数据价值变现。
互联网企业的数据,在整个大数据生态中,能够起到多大作用,各方都在摸索。很多人认为,互联网企业的数据价值被高估了。
比如韩亦舜认为,相对实体经济来说,互联网企业的数据,更多是第三产业,是对消费者端的,相对整个实体经济,比如说制造业体系产生的数据,互联网数据并不算多。
“互联网只是个工具。”国家统计局一位原副局长在一次数据研讨会上直言。他认为,互联网是传递现代数据的工具,不能唱得比实体经济还高。
至于BAT如何从大数据掘金,笔者聊了很多业内人,听得都不太明白,仍不得解。一家企业CEO表示,现在大家的思路其实都不清晰。
6月份,马云在一次活动上说,阿里是一家大数据公司,不过我们也不知道怎么用数据挣钱。
⑵ 如何在大数据分析中“掘金”
因此,行之有效的企业级信息优化战略变得空前重要。由于预计2015年产生的数字内容中有90%将是非结构化数据,如短信和微博生成的信息,以及视频和音频,情况将变得越来越复杂。无论身处哪个行业,围绕大数据及管理这些信息的挑战都无处不在。·金融服务行业必须满足客户对数字银行服务的期望,并处理风险和监管需求等问题;·在医疗和生命科学领域,患者隐私及药物开发问题使合规成为了关键的投资动因;·了解客户需求以提高服务和参与模式是旅游和交通行业必不可少的;·在政府和公共事业领域,政府正在提高其智能及安全能力,以期更好地保护公众;·实时的数据可视化、汇总和诠释对于能源行业至关重要。毫无准备的企业可能会在应对现有原始信息的数量、种类和速度时手足无措。如果企业缺乏管理并处理多来源海量信息的能力,将会导致涉及整个企业层面的各类问题:·具有更先进的信息系统的竞争对手将能很好地利用数据并争夺客户;·尽管有更大量和来源,实现数据价值将越来越困难;·浪费大量时间过滤海量不相关的数据,而这些数据不能支持决策或推动其执行;·缺乏灵活性、分离的信息基础设施成本将逐步增加。政府和企业迫切需要从无关的数据中获取洞察,并有能力对其有效利用。那些能从战略上迅速响应,并从海量信息中提取真正价值的企业将能获得关键的市场领先地位。发挥信息的力量根据ColemanParkesResearch的研究[3]表明,亚太和日本地区62%的私有企业认为有效的信息优化战略能帮助其获得竞争优势。但是仅有不到一半的企业采用了合适的解决方案并从大数据中获得洞察,而目前仅有15%的企业将非结构化数据纳入了其企业洞察、流程和战略。企业的终极目标应是充分利用100%的信息来推动更快、更明智的业务决策。企业应能衡量信息战略在新增收入、节约成本以及加速上市等方面所带来的价值。要想在以信息为驱动力的新时代获得成功,企业需要信息优化战略以及可理解抽象概念的解决方案。企业的目标是通过涵盖所有数据形式的信息管理和分析系统实现互联性智能。这意味着他们必须:·建立一个敏捷的智能环境,并有合适的基础设施来捕获和存储海量信息,进行实时分析并迅速适应不断变化的优先事项;·对企业生态系统中的信息和智能战略进行整合,以获得对业务数据的完整视图;·通过将洞察和理念转化为行动而实现信息资产的全部价值。提升客户体验实现更好的客户体验是所有信息优化战略的主要目标。改进企业搜索和分析信息的方式,以更好地了解客户行为和需求,从而支持快速、明智的业务决策。这将有助于实现更好的客户体验和更高的忠诚度。信息洞察应整合所有客户信息,无论客户如何与企业进行互动,包括通过社交媒体、微博、移动应用,以及通过电话等其它方式。信息必须在不同的业务范围内进行收集,同时还要解决潜在的隐私和安全问题。先进的信息技术能够帮助企业增强其识别客户喜好、问题和趋势的能力。而这些情报可被用来更好地与客户进行互动,同时提供超越竞争对手的洞察。这些新情报可在应用开发以及将应用迁移至云的过程中发挥作用,而云能让客户轻松、快速地获得新服务。优化业务绩效不仅是企业需要应对海量结构化和非结构化数据,数据也分布于多个可能互不相关的业务范围,也存在于许多不同的应用中。现代数据中心的另一个关键能力是能够处理大量的无关信息,从而获得能提高业务绩效的洞察。通过整合、迁移并汇总数据存储,企业可以改进信息访问,并降低IT运营成本。这能带来简单、灵活、迅速、低成本高收益的信息基础设施,而此类基础设施同时还具有可扩展性、模块化特性,及可靠性。用智能信息基础设施替换复杂的孤立数据库,企业能够在需要时捕捉、存储并提供信息,无论采用哪种应用、规模有多大。充分利用100%的相关职能和运营数据能够帮助客户提高运营业绩和经营利润,并对信息生命周期管理进行自动化处理。信息优化的目标为构建一个服务于整个企业,从数据安全及合规,到分析和敏捷性的统一基础设施。而由此带来的快速、轻松分析信息的能力能够帮助企业获得更可靠的视图,从而做出准确、有效的决策。管理安全和风险将能够端到端管理100%大数据作为新目标,企业应研究更好的监管和安全措施来应对与日俱增的风险和复杂性。这些问题包括:不能充分利用目前所有可用数据进行及时、正确的决策所带来的财务和法律风险,以及获取数据并保证其是最新、最正确的。智能信息生态系统可管理安全环境中的数据,从而管理日常业务并降低风险。它还能利用洞察来引导企业投资和定价,并充分利用新的业务机会。将数据转化为资产不能周密部署并迅速采取行动的企业有可能面临被剧增的大数据淹没的风险。另一方面,那些能够实施全面的企业级信息优化战略的企业所获得的回报将是非常巨大的。这一战略有助于缩小潜在的和最终实现的业务成果之间的差距。总之,它可以分为三大要素:·能捕获、存储、复制并扩展数据的信息基础设施;·管理、保护、治理并充分利用数据的信息管理;·搜索、分析、理解数据并对其采取行动的信息洞察工具。能够从自身数据资产中获得深入洞察和价值的企业将开始收获其实质性的信息回报。文章更新提醒功能已上线,帮助您及时了解本频道动态。
⑶ 互联网创业者如何掘金大数据
近年来,在国家政策支持和各方面的共同努力下,我国大数据产业迅速发展,应用不断深化,形势喜人。国际数据公司(IDC)预计,未来全球数据总量增长率将维持50%左右,到2020年全球数据总量将达到40ZB,其中,我国将达到8.6ZB,占全球的21%。
据前瞻产业研究院发布的《大数据产业发展前景与投资战略规划分析报告》统计数据显示,2017年中国大数据产业市场规模达到4700亿元,同比增长30.6%。预计到2018年中国大数据产业市场规模将达到6200亿元,未来五年(2018-2022)年均复合增长率约为25.13%,2022年中国大数据产业市场规模将达到15200亿元。
目前我国大数据产业也面临很多挑战,首先技术创新与支撑能力还有欠缺,在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在着较大的差距,对开元技术和相关生态系统的影响力还比较弱;其次,大数据支撑体系不完善,数据所有权、信息安全、开放共享等相关法律法规标准规范尚不健全,尚未建立起安全发展的数据开放管理的体系;最好,人才队伍建设急需加强,既熟悉业务需求又可以进行管理的大数据综合人在还很缺乏,远不能满足发展的需要。
⑷ 大数据掘金之中的数据分析方法不哪些
数据挖掘最常见的十种方法:
1、基于历史的MBR分析(Memory-Based Reasoning;MBR)
基于历史的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。
2、购物篮分析(Market Basket Analysis)
购物篮分析最主要的目的在于找出什么样的东西应该放在一起?商业上的应用在藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品,找出相 关的联想(association)规则,企业藉由这些规则的挖掘获得利益与建立竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计 吸引客户的商业套餐等等。
3、决策树(Decision Trees)
决策树在解决归类与预测上有着极强的能力,它以法则的方式表达,而这些法则则以一连串的问题表示出来,经由不断询问问题最终能导出所需的结果。典型的决策 树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能都包含一个简单的法则。此外,决策树可能有着不同的外型,例如二元 树、三元树或混和的决策树型态。
4、遗传算法(Genetic Algorithm)
遗传算法学习细胞演化的过程,细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似,它必须预先建立好一个模式,再经 由一连串类似产生新细胞过程的运作,利用适合函数(fitness function)决定所产生的后代是否与这个模式吻合,最后仅有最吻合的结果能够存活,这个程序一直运作直到此函数收敛到最佳解。基因算法在群集 (cluster)问题上有不错的表现,一般可用来辅助记忆基础推理法与类神经网络的应用。
5、聚类分析(Cluster Detection)
这个技术涵盖范围相当广泛,包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体,在许许多多的分析中,刚开始都运用到群集侦测技术,以作为研究的开端。
6、连接分析(Link Analysis)
连接分析是以数学中之图形理论(graph theory)为基础,藉由记录之间的关系发展出一个模式,它是以关系为主体,由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉 连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案。除了电信业之外,愈来愈多的营销业者亦利用连结分析做有利于 企业的研究。
7、OLAP分析(On-Line Analytic Processing;OLAP)
严格说起来,OLAP分析并不算特别的一个数据挖掘技术,但是透过在线分析处理工具,使用者能更清楚的了解数据所隐藏的潜在意涵。如同一些视觉处理技术一般,透过图表或图形等方式显现,对一般人而言,感觉会更友善。这样的工具亦能辅助将数据转变成信息的目标。
8、神经网络(Neural Networks)
神经网络是以重复学习的方法,将一串例子交与学习,使其归纳出一足以区分的样式。若面对新的例证,神经网络即可根据其过去学习的成果归纳后,推导出新的结果,乃属于机器学习的一种。数据挖掘的相关问题也可采类神经学习的方式,其学习效果十分正确并可做预测功能。
9、判别分析(Discriminant Analysis)
当所遭遇问题它的因变量为定性(categorical),而自变量(预测变量)为定量(metric)时,判别分析为一非常适当之技术,通常应用在解决 分类的问题上面。若因变量由两个群体所构成,称之为双群体 —判别分析 (Two-Group Discriminant Analysis);若由多个群体构成,则称之为多元判别分析(Multiple Discriminant Analysis;MDA)。
10、罗吉斯回归分析(Logistic Analysis)
当判别分析中群体不符合正态分布假设时,罗吉斯回归分析是一个很好的替代方法。罗吉斯回归分析并非预测事件(event)是否发生,而是预测该事件的机 率。它将自变量与因变量的关系假定是S行的形状,当自变量很小时,机率值接近为零;当自变量值慢慢增加时,机率值沿着曲线增加,增加到一定程度时,曲线协 率开始减小,故机率值介于0与1之间。
⑸ 随着大数据掘金现象的不断涌现越来越多的企业意识到了什么人才的重要性
随着大数据掘金现象的不断涌现
越来越多的企业意识到了
数据分析人才的重要性
⑹ 掘金大数据 “贵漂”正当时
掘金大数据 “贵漂”正当时_数据分析师考试
昨日,《贵阳市大数据产业人才队伍建设调研报告》出炉。报告显示,截至2014年底,该市人才总量60.4万人、每万人人才资源数1331人,分别比2012年增长11.2万人和217人;企业经营管理人才、专业技术人才、技能人才与2012年相比分别增长4.24万人、1.53万人、6.2万人;非公有制企业人才总量从2012年的21.5万人增加到25.7万人。
与此同时,上半年新增大数据产业注册企业1270家,集聚人才超过2万人。目前,贵阳市大数据及关联企业已超过2000户,人才近13万人,约占人才总量的22%。
政策:领军人才创办大数据企业,可获500万元经费
贵阳市在全省率先制定实施《关于加快大数据产业人才队伍建设的实施意见》、《服务外包及呼叫中心产业人才培养规划》等专项政策文件,明确大数据产业人才发展的目标任务和创新举措,提出4个方面19条培养储备、引进集聚大数据人才的具体措施。
对创办大数据企业的领军人才、核心技术人才,免费提供人才公寓、工作场所,最高给予500万元创业启动资金和200万元项目开发经费;对获得省级以上科技进步奖、制定行业标准、获得发明专利的团队和个人,最高给予100万元奖励;对引进领军人才、核心技术人才、高技能人才和招聘基础人才的大数据企业,给予奖励和补贴;对做出突出贡献的领军人才、创新创业人才,给予物质奖励和精神激励。
建设:多个“国”字号落户贵阳
贵阳市深化京筑创新驱动区域合作,强力推进中关村贵阳科技园建设,依托高新技术开发区、经济技术开发区及重点产业园区,搭建大数据科技创新、项目研发、人才创业承载平台,成功组建中科院软件所贵阳分部、北京贵阳大数据研究院、首都科技条件平台贵阳合作站、“千人计划”大数据研究院等。
建成全国首家大数据交易所、首个全域公共免费WiFi城市、首个块上集聚大数据公共平台、首个政府数据开放示范城市和首个大数据战略实验室。同时,开展贵阳大数据7系列基础平台项目建设,从北京引进项目260个。
目前,贵阳市国家级研发机构16家,省级以上企业技术中心、人才基地87家,国家级、省级科技企业孵化器8家,创客空间17家,创业孵化器和投资机构近20家。7月,该市获国家科技部批准创建“大数据产业创新试验区”。
培养:政、校、企联动,订单式培养大数据人才
贵阳市实施大数据人才培养计划,鼓励在筑高校(职业院校)开设大数据相关专业,支持校企合作建立教育培训基地,资助大数据企业在职人员提升学历学位和专业技能,打造“一基地、两中心、三示范、多点辐射”的呼叫中心人才培养体系,政、校、企联动,订单式培养大数据人才。
贵阳市级财政安排2000多万元专项经费,在贵阳幼儿师范高等专科学校、贵阳市经济贸易中等专业学校挂牌建立呼叫中心服务外包学院及示范教学基地,建设坐席1300多个。依托互联网+现代农业,与电商巨头、职业院校、网络公司合作,采取“理论+实践”方式培养电商能人。今年以来,全市培养呼叫中心专业人才4000多名、电商能人400多名。
引智:大数据产业成为贵阳引才聚才重要载体
以大数据人才为重点,贵阳市建立招商引资与招才引智融合互动机制,大力实施“筑巢引凤计划”、“黔归人才计划”等,大力集聚产业发展急需人才。
近两年来,贵阳市开展的大型招才引智活动中,大数据人才、项目引进比例占40%以上,2014年引进大数据相关专业人才535名,今年以来大数据龙头企业贵阳朗玛信息公司引进人才174名,大数据产业已经成为贵阳市引才聚才的重要载体。
据统计,2013年至2015年上半年,该市直接引进各类高层次人才1882名,相当于前八年引才的总和,其中博士241名、硕士1380名、高级职称261名。高层次人才引进流出比从2012年的36∶1提高到2014年的49∶1,引才数量及层次呈逐年提升态势。
创业:已集聚创客团队230多支
利用创建国家级大数据产业发展集聚示范区的机遇优势,贵阳市深入推进人才改革管理试验区建设,全力打造“政策+基地+资金+服务+平台”模式的创新创业全生态链。
如今,越来越多的黔籍人才和“创客”选择贵阳创业兴业。3月14日,“‘北漂’已过时、‘贵漂’是时尚”节目在腾讯网播出,关注人数1000多万,评论逾7800条。据近日阿里巴巴集团旗下蚂蚁金服发布的《大学生就业流向报告》和经济学人智库发布的《2015年中国新兴城市报告》显示,贵州进入了大学毕业生净流入排行榜前列,贵阳在全国新兴城市的综合排名、经济增长及外商直接投资三个方面均列第一。
2013年以来,高校毕业生到贵阳创业就业人数年均增长30%以上,全市新增创业实体11.6万户,带动就业41万人。目前全市集聚创客团队230多支、创客1800多人。2014年,全市新增高新技术企业40家、增长23.1%,大数据产业总量650亿元,同比增长68%,科技进步贡献率、人才贡献率分别达到56.4%和28.13%,高于全国、全省平均水平。
目标:创新创业人才“筑梦”首选地
如何才能打造创新创业人才“筑梦”首选地?
贵阳市将深化与发达地区人才交流合作机制,通过调动、聘用、挂职、兼职和项目合作、技术入股等形式合理配置大数据人才资源。采取支持高校、科研院所、企业培养和“人才+项目”的模式,依托国家、省、市重大科研项目、产业项目和工程项目,在实践中培养聚集大数据产业骨干人才。
研究提出具有创新性和引领性的大数据人才评价认定和职称评聘办法,开辟大数据人才职称评审“绿色通道”,建立以能力为导向,以业绩为依托,以品德、知识、能力等为主要内容的大数据人才评价指标新体系,力争将大数据人才认定评定标准纳入国家大数据标准委员会标准立项范畴,成为大数据人才标准起草城市和试验城市。
以上是小编为大家分享的关于掘金大数据 “贵漂”正当时的相关内容,更多信息可以关注环球青藤分享更多干货