大家好,我是Frank,一个爱学习,爱折腾,什么都懂点的万能PM。 这是软考第3章 信息系统集成专业技术知识的第三篇笔记,也是第三章最后一篇。过了第三章,后续就相对容易了,大部分知识都和已学习过的PMP项目管理的知识,没太大的差异,坚持就是胜利。
学习书籍:系统集成项目管理工程师(第2版)
学习方式:自学
章节:第3章 信息系统集成专业技术知识(下)
笔记撰写:Frank
本章主要学习内容如下:
1、云计算(见书3.8.1节 )
1.1 云计算的概念和特点
云计算(Cloud Computing)是指基于互联网的超级计算模式,通过互联网来提供大型计算能力和动态易扩展的虚拟化资源。
云是网络、互联网的一种比喻说法。云计算是一种大集中的服务模式。
用一句话概括云计算就是通过网络提供可动态伸缩的廉价计算能力,其通常具有下列特点:
(1)超大规模云”具有相当的规模,一般拥有数百上千台服务器。
(2)虚拟化
云计算支持用户在任意位置、使用各种终端获取应用服务。用户无需了解、也不用担心应用运行的具体位置。只需要一台笔记本或者一部手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。
(3)高可靠性
“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性, 使用云计算比使用本地计算机可靠。
(4)通用性
在“云”的支撑下可以构造出千变万化的应用,同一个 “云”可以同时支撑不同的应用运行。
(5)高可扩展性
“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。
(6)按需服务
“云"是一个庞大的资源池,用户按需购买;云可以像自来水、电、煤气那样计费。
展开全文
(7)极其廉价
“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。
(8)潜在的危险性
云计算服务当前垄断在私人机构(企业)手中,而他们仅仅能够提供商业信用。政府机构、商业机构(特别像银行这样持有敏感数据的商业机构 )在选择云计算服务、特别是国外机构提供的云计算服务时,务必考虑其潜在的危险性。
1.2 云计算的架构
从对外提供的服务能力来看,云计算的架构可以分为3个层次:基础设施即服务 IaaS)、平台即服务(PaaS)和软件即服务(SaaS)(详见本书1.6.2节)。
(1)基础设施即服务(laaS)
英文为Infrastructure as a Service,指消费者通过Internet可以从云计算中心获得完善 的计算机基础设施服务,例如虚拟主机、存储服务等,典型厂家有Amazon、阿里云等。如果把云计算比作一台计算机,laaS就相当于计算机的主机等硬件。
(2)平台即服务(PaaS)
英文为Platform as a Service,指为云计算上各种应用软件提供服务的平台应用,其作用 类似于个人计算机的操作系统,也包括一些增强应用开发的“开发包”,典型厂家有Google App Engine、 Microsoft Azure、阿里 Aliyun Cloud Enginee、百度 Baidu App Enginee 等。
(3)软件即服务(SaaS)
英文为Software as a Service,是一种通过Internet提供软件的模式,用户无需购买 软件,而是向提供商租用基于Web的软件,来管理企业经营活动。类似于个人计算机中各种各样的应用软件。提供SaaS服务的厂家越来越多,典型的如国外的Salesforce、国内的淘宝等。
1.3 云计算应用的分类
从应用范围来看,云计算又可分为公有云、私有云和混合云。
公有云通常指第三方提供商用户能够使使用的云,公有云一般可通过Internet使用,可能是免费或成本低廉的。
私有云是为一个客户单独使用而构建的,因而提供对数据、安全性和服务质量 的最有效控制。该公司拥有基础设施,并可以控制在此基础设施上部署应用程序的方式。
混合云就是将公有、私有两种模式结合起来,根据需要提供统一服务的模式。
2、物联网(见书3.8.2)
2.1 物联网的概念
物联网(IoT: The Internet of Things)即“物物相联之网”,指通过射频识别(RFED)、 红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把物与物、 人与物进行智能化连接,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种新兴网络。
物联网不是一种物理上独立存在的完整网络,而是架构在现有互联网或下一代公网 或专网基础上的联网应用和通信能力,是具有整合感知识别、传输互联和计算处理等能力的智能型应用。
2.2 物联网架构:
(1)感知层:负责信息采集和物物之间的信息传输,信息采集的技术包括传感器、 条码和二维码、RFID射频技术、音视频等多媒体信息,信息传输包括远近距离数据传输技术、自组织组网技术、协同信息处理技术、信息采集中间件技术等传感器网络。感 知层是实现物联网全面感知的核心能力,是物联网中包括关键技术、标准化方面、产业 化方面亟待突破的部分,关键在于具备更精确、更全面的感知能力,并解决低功耗、小型化和低成本的问题。
(2)网络层:是利用无线和有线网络对采集的数据进行编码、认证和传输,广泛覆盖的移动通信网络是实现物联网的基础设施,是物联网三层中标准化程度最高、产业化 能力最强、最成熟的部分,关键在于为物联网应用特征进行优化和改进 ,形成协同感知的网络。
(3)应用层:提供丰富的基于物联网的应用,是物联网发展的根本目标,将物联网技术与行业信息化需求相结合,实现广泛智能化应用的解决方案集,关键在于行业融合、信息资源的开发利用、低成本高质量的解决方案、信息安全的保障以及有效的商业模式的开发 。
2.3 无联网关键技术
感知层作为物联网架构的基础层面,主要是达到信息采集并将采集到的数据上传的 目的,感知层的技术主要包括:产品和传感器(条码、RFID,传感器等)自动识别技术, 无线传输技术(WLAN、Bluetooth, ZigBee、UWB),自组织组网技术和中间件技术。
2.4 物联网的应用
(1)智能微尘
(2)智能电网
(3)智慧物流
(4 )智能家居
(5)智能交通
(6)智慧农业
(7)环境保护
(8)医疗健康
(9)城市管理
(10) 金融服务保险业
(11)公共安全
3、移动互联网(见书3.8.3节)
3.1 移动互联网的概念
移动互联网一般是指用户用手机等无线终端,通过3G (WCDMA、CDMA2000或者TD-SCDMA)或者WLAN等速率较高的移动网络接入互联网,可以在移动状态下( 在地铁、公交车上等)使用互联网的网络资源。
从技术层面的定义:以宽带IP为技术核心,可以同时提供语音、数据、多媒体等业 务的开放式基础电信网络。
从终端的定义:用户使用手机、上网本、笔记本电脑、平板电脑、智能本等移动终 端,通过移动网络获取移动通信网络服务和互联网服务。
移动互联网=移动通信网络+互联网内容和应用,它不仅是互联网的延伸,而且 是互联网的发展方向。
3.2 移动互联网关键技术
移动互联网的关键技术包括架构技术SOA、页面展示技术Web2.0和HTML5以及主流开发平台 Android、iOS 和 Windows Phone。
(1)SOA
Service Oriented Architecture,即面向服务的架构,SOA是一一种粗粒度、松耦合服务
架构,服务之间通过简单、精确定义接口进行通讯,不涉及底层编程接口和通讯模型。SOA可以看作是B/S模型、XML (标准通用标记语言的子集)/Web Service技术之后的延伸。
web Service 是目前实现SOA的主要技术。
(2)web2.0
是页面展示技术。严格来说不是一种技术,而是提倡众人参与的互联网思维模式。
(3)HTML5 :
在原有HTML基础上扩展了API ,使Web 应用成为RIA (Rich Internet Applications,具有高度互动性、 丰富用户体验以及强大的客户端。最大优势可以在网页上直接调试和修改。
(4)Android:
特点入门容易,因为Android的中间层多以Java 实现 ,指令相对较少、开发相对简单,而且开发社群活跃,开发资源丰富。
5)IOS: 一个非开源的操作系统,开发人员必须加入苹果开发者计划,需要付款以获得苹果的批准 ,开发语言是Objective-C 、C、和C++ ,开发难度大于Android.
(5)WindowsPhone:
微软手机操作系统,开发技术:C、 C++、C#等。
4、大数据(见书3.8.4节)
4.1 大数据的概念
大数据(bigdata) , 是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要采用新处理模式才能获得更多智 能的、深入的、有价值的信息,以期得到更强的决策力、洞察力和流程优化 能力的海量、高增长率的多样化的信息资源。
大数据是有五V特点 :大量 (Volume )、多样 (Variety) 、价值(value)、高速(Velocity)和真实性(Veracity)。
大数据是以容量大、 类型多、存取速度快、应用价值高为主要特征的数据集合。
4.2 大数据的技术框架
4.3 大数据关键技术
大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与 挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节 主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化(如图片、视频、doc文 件等)和半结构化数据一般通过分布式文件系统的 NoSQL (Not Only SQL)进行存储, 比较典型的 NoSQL 有 Google 的 Bigtable、Amazon 的 Dynamo 和 Apache 的 Hbase。大数据管理主要使用了分布式并行处理技术,比较常用的有MapReduce,编程人员借助 MapReduce可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
下面以最流行的开源大数据框架 Hadoop为例,说明大数据的关键技术。
1)HDFS
Hadoop分布式文件系统(HDFS)是适合运行在通用硬件上的分布式文件系统,是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问, 非常适合大规模数据集上的应用。
2)Hbase
分布式的、面向列的开源数据库 ,不同于一般的关系数据库, 是非结构化数据存储的数据库,适合于非结构化数据存储的数 据库,基于列的而不是基于行的模式。
3)MapReduce
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map (映射)”和“Reduce (归约)”。
4)Chukwa
Chukwa是一个开源的用于监控大型分布式系统的数据收集系统,可用于展示、监控和分析已收集的数据。
4.4 大数据应用