大数据物联网方案
A. 物联网解决方案中的大数据处
作者 | 网络大数据
来源 | raincent_com
随着物联网的演变和发展,所有可以想象到的东西(或事物)和产业都将变得更加智能:智能家居和智慧城市、智能制造机械、智能汽车、智能健康等等。无数被授权收集和交换数据的东西正在形成一个全新的网络——物联网——一个可以在云中收集数据、传输数据和完成用户任务的物理对象网络。
物联网和大数据正在走向胜利之路。不过,要想从这一创新中获益,还需要解决一些挑战和问题。在本文中,我们很高兴与大家分享多年来在物联网咨询领域积累的知识。
物联网大数据如何应用
首先,有多种方法可以从物联网大数据中获益:在某些情况下,通过快速分析就足够了,而一些有价值的见解只有在经过深入的数据处理之后才能获得。
实时监测。通过连网设备收集的数据可以用于实时操作:测量家中或办公室的温度、跟踪身体活动(计算步数、监测运动)等;实时监测在医疗保健中被广泛应用(例如,获取心率、测量血压、糖分等);它还成功地应用于制造业(用于控制生产设备)、农业(用于监测牛和作物)和其他行业。
数据分析。在处理物联网生成的大数据时,我们有机会超越监测,并从这些数据中获得有价值的见解:识别趋势,揭示看不见的模式并找到隐藏的信息和相关性。
流程控制和优化。来自传感器的数据提供了额外的上下文情境信息,以揭示影响性能和优化流程的重要问题。
▲交通管理:跟踪不同日期和时间的交通负荷,以制定出针对交通优化的建议,例如,在特定时间段增加公共汽车的数量,看看是否有改观,以及建议引入新的交通信号灯方案和修建新的道路,以减少街道的交通拥堵状况。
▲零售:跟踪超市货架中商品的销售情况,并在商品快卖完之前及时通知工作人员补货。
▲农业:根据传感器的数据,在必要时给作物浇水。
预测性维护。通过连网设备收集的数据可以成为预测风险、主动识别潜在危险状况的可靠来源,例如:
▲医疗保健:监测患者健康状态并识别风险(例如,哪些患者有糖尿病、心脏病发作的风险),以便及时采取措施。
▲制造业:预测设备故障,以便在故障发生之前及时解决。
还应注意的是,并非所有的物联网解决方案都需要大数据(例如,如果智能家居拥有者要借助智能手机来关灯,则可以在没有大数据的情况下执行此操作)。重要的是要考虑减少处理动态数据的工作量,并避免存储将来没有用处的大量数据。
物联网中的大数据挑战
除非处理大量数据以获取有价值的见解,否则这些数据完全没用。此外,在数据收集、处理和存储方面还有各种挑战。
▲数据可靠性。虽然大数据永远不会100%准确,但在分析数据之前,请务必确保传感器工作正常,并且用于分析的数据质量可靠,且不会因各种因素(例如,机器运行的不利环境、传感器故障)而损坏。
▲要存储哪些数据。连网设备会产生万亿字节的数据,选择存储哪些数据和删除哪些数据是一项艰巨的任务。更重要的是,一些数据的价值还远远没有显现出来,但将来您可能需要这些数据。如果您决定为将来存储数据,那么面临的挑战就是以最小的成本做到这一点。
▲分析深度。一旦并非所有大数据都很重要,就会出现另一个挑战:什么时候快速分析就足够了,什么时候需要进行更深入的分析以带来更多价值。
▲安全。毫无疑问,各个领域的连网事物可以让我们的生活变得更加美好,但与此同时,数据安全也成一个非常重要的问题。网络罪犯可以侵入数据中心和设备,连接到交通系统、发电厂、工厂,并从电信运营商那里窃取个人数据。物联网大数据对于安全专家来说还是一个相对较新的现象,相关经验的缺失会增加安全风险。
物联网解决方案中的大数据处理
在物联网系统中,物联网体系架构的数据处理组件因输入数据的特性、预期结果等而不同。我们已经制定了一些方法来处理物联网解决方案中的大数据。
数据来自与事物相连的传感器。“事物”可以是任何物体:烤箱、汽车、飞机、建筑、工业机器、康复设备等。数据可以是周期性的,也可以是流式的。后者对于实时数据处理和迅速管理事物至关重要。
事物将数据发送到网关,以进行初始数据过滤和预处理,从而减少了传输到下一个物联网系统中的数据量。
边缘分析。在进行深入数据分析之前,有必要进行数据过滤和预处理,以选择某些任务所需的最相关数据。此外,此阶段还可以确保实时分析,以快速识别之前在云中通过深度分析所发现的有用模式。
对于基本协议转换和不同数据协议之间的通信,云网关是必需的。它还支持现场网关和中央物联网服务器之间的数据压缩和安全数据传输。
连网设备生成的数据以其自然格式存储在数据湖中。原始数据通过“流”进入数据湖。数据保存在数据湖中,直到可以用于业务目的。清理过的结构化数据存储在数据仓库中。
机器学习模块根据之前积累的历史数据生成模型。这些模型定期(例如,一个月一次)用新数据流更新。输入的数据被累积并应用于训练和创建新模型。当这些模型经过专家的测试和批准后,控制应用程序就可以使用它们,以响应新的传感器数据发送命令或警报。
总结
物联网产生大量数据,可用于实时监控、分析、流程优化和预测性维护等。然而,应该记住,从各种格式的海量数据中获得有价值的见解并不是一件容易事情:您需要确保传感器工作正常,数据得到安全传输和有效处理。此外,始终存在一个问题:哪些数据值得存储和处理。
尽管存在一些挑战和问题,但应记住,物联网的发展势头强劲,并可以帮助多个行业的企业开辟新的数字机遇。
B. 如何发展大数据与物联网
大数据时代的出现确切的说是移动互联网、物联网产生了海量的数据,大数据计专算技术完美地解决属了海量数据的收集、存储、计算、分析的问题。大数据时代开启人类社会利用数据价值的另一个时代。
但是中国目前的大数据应用环境和技术相对于美国而言,在整体技术水平、应用环境、国民意识、商业环境、技术厂商、技术平台上面相差超过5年左右。在大数据应用的国家战略层面落后的也较多。
需要通过政府自身投资来建立大数据平台,吸引中小企业将信息系统及数据放到政府主导的数据平台上,政府将利用此平台来挖掘数据信息,提供数据信息报告。另外一个大数据应用是地方政府请一些大数据公司来开发舆情检测系统,及时了解社会舆论。无论是大数据产业园还是舆情监控。没有抓住大数据优势的核心,大数据产业园的管理机制和创新动力不足,无法发挥大数据计算的优势,反而浪费了大量的投资,效率较低。舆情监控本身就无法发挥大数据的商业应用优势,反而阻碍大数据产业的商业应用。我们应该提供大数据产业优惠政策,在资金、场地、税收、科研方面提供外部支持,让企业自身投入到大数据产业建设之中,从企业自身商业需求出发,投入资金来发展大数据产业。
C. 物联网时代的大数据策略
物联网时代的大数据策略
互联网时代,PC、Pad、智能手机等设备无处不在,数以亿计的用户通过微博、微信、SNS、博客等途径产生大量的自媒体数据,电商、新闻类网站、搜索引擎每时每刻都在记录着丰富的用户行为信息,海量的数据促进了云计算,分布式技术的发展,而这些技术反过来不仅推动了Web和移动互联网的革新,也推动了物联网的飞速前进。现在,我们正逐渐迈入物联网时代,实现万物互联的愿景,如果说之前人是信息生产的主体,那么或许不久的将来设备将成为主角,它们将源源不断地产生与人相关的衣食住行信息,这些信息会通过云计算、数据挖掘等技术实现价值的升华从而为用户提供更优质、贴心的服务。那么物联网时代会产生什么样的数据,应该采用什么样的大数据策略呢?
THINKstrategies 的总经理 Jeff Kaplan 在自己的博文《 当物联网遇见大数据 》中写道:
“你不能使用现在的策略,因为可以被捕获、管理并利用的数据将更加多样化,同时用例也会更加丰富。附加到各种设备和对象上的传感器会产生各种类型的数据。这些数据将会用于各种响应式的、主动的或者 创造性的目的 。IT部门的任务就是与业务部门一起工作,完全理解物联网方面的用例,然后寻找满足业务需求的技术。特别是,IT部门必须识别出最优的分析平台和工具,让业务用户能够获取到需要的数据,分析数据的含义并快速地做出响应。”
Gartner公司的副总裁、著名分析师 Joe Skorupa 认为:
“分布在世界各地的物联网设备将产生大量的输入数据,将所有的数据传送到一个位置进行处理无论从技术上还是从经济上都是无法实现的。最近的趋势——将应用程序集中起来以便于降低成本并增强安全性——并不适合物联网。组织必须将数据集中到多个分布式的小型数据中心中,在此对数据进行初步的处理并发送到一个中心站点进行额外的处理。数据中心管理员需要在这些区域部署更加具有前瞻性的容量以满足业务发展的需要。”
Patrick McFadin则在自己的博文《 物联网:数据都去了哪里? 》中阐述了一个具体的数据策略解决方案。他认为整个过程可以分为三个阶段:产生数据并通过Internet传递、中央系统收集并组织数据、持续的数据分析与使用。
第一阶段需要决定数据创建的标准以及如何通过网络进行传递。Patrick McFadin认为可以通过HTTP、MQTT和CoAP三种常用的标准协议传递数据。HTTP通用程度高,但是它的头中包含大量冗余信息,不太适合带宽比较低的场景。MQTT基于发布/订阅模型,新的设备或者服务能够非常容易地连到中央系统上消费消息。另外,它在消息大小上比HTTP更轻量,但是缺点是不包含加密标准。CoAP适合于低功耗、低带宽的场景,与MQTT的订阅模式相比它更侧重于一对一的连接。
第二阶段则需要根据设备、网络以及功耗的限制决定是实时地收集数据还是在某个时间批量收集,同时还需要决定如何存储数据。如果是实时收集,那么必须要考虑数据库的写入速度,这对于传统的数据库而言可能是一个挑战,但是像 Cassandra 这样的NoSQL数据库却能够轻松应对。
一旦完成了数据的收集与存储,接下来就是分析了,这才是整个过程最核心的部分。此时需要考虑需要何时使用分析结果,是否需要立即或近乎实时的分析,还是仅仅需要对历史数据进行处理。越来越多的人在使用Apache Spark分析大数据,使用Spark Streaming满足近乎实时的要求,如果将这些技术与Cassandra这样的NoSQL数据库结合在一起使用,那么开发者就能够处理并分析大规模、快速移动的数据集。
那么是不是所有的物联网厂商都需要自己去构建相关的数据解决方案呢?也不尽然,在云计算的时代大可以利用云服务提供商的资源,以降低相关的成本,对小公司或初创公司更是如此。
Mike Kavis最近在自己的博文《 物联网将彻底改变你的大数据策略 》中阐述了自己的方案,他认为:
“在物联网时代,面对PB级的数据,企业将难以以一己之力完成基础设施的建设。物联网所产生的大量数据不仅会驱动现在的数据中心发生根本性的变化,同时也会驱动相关企业采用新的大数据策略。由于缺乏相关技能以及持续增长的数据对基础设施采购的需求,企业将逐步放弃DIY模式,转而使用PaaS和托管的解决方案,借助于数据库即服务(例如Amazon的Redshift、Hortonworks和Cloudera的企业级Hadoop)、托管的大数据服务(例如Treasure Data)以及矩阵式的数据中心服务(例如GoGrid)实现自己的物联网数据分析方案。
总之,物联网的价值在于数据。企业对数据的分析工作启动地越快,挖掘出的业务价值就越多。而云服务提供商的目的就是通过加大相关的投入,消除数据收集、管理的风险以及复杂性,让客户能够专注于分析。”
以上是小编为大家分享的关于物联网时代的大数据策略的相关内容,更多信息可以关注环球青藤分享更多干货