前言
蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的技术解决方案,提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。
目前,蓝鲸智云团队秉承着开放共赢的态度,正逐渐开放其自主研发的一套具有多项探索式创新的体系——蓝鲸智云软件体系。该套体系不仅提供了基础运维(发布变更、监控处理、数值调整、数据提取等)的无人值守服务,而且还给运维人员提供了解决方案(工具),并随时调整,避免重复性的操作服务。而运维人员则可以做些“用户体验优化”和“运营决策辅助”等运维增值工作,并且可以通过蓝鲸智云提供的集成平台,低成本的学习 DevOps 技能,进一步提升自己的能力,加速转型。此外,这套体系还可以运行轻应用、管理类、及职能类应用,是个全方位的运维、管理平台。
蓝鲸智云,运维领域的一张新名片,正在多个层次、多个领域崭露着头角,逐渐释放着自身特有的价值,引领着行业新标杆,开创了运维体系2.0的新局面。
体系介绍
蓝鲸智云体系由八大平台组成,即管控平台、配置平台、作业平台、数据平台、容器管理平台、AI平台、集成平台和移动平台,为各种云(公有云、私有云、混合云)的用户提供不同场景、不同需求的一站式技术运营解决方案。
蓝鲸智云体系依托企业级 SOA、PaaS 等理念,运用 Docker 等最先进的云技术构建起了全新的运维模式,致力于以“原子服务集成”和“低成本工具构建”的方式落地 DevOps,帮助运维快速实现“基础服务无人值守”及“增值服务”,并进一步通过 DevOps 的落地实现企业更全面和可持续的效率提升。
架构图
蓝鲸智云体系中八大平台之间的架构关系如下图所示:
管控平台
蓝鲸管控平台是蓝鲸体系的底层管控系统,是上层运维服务体系与底层 IaaS 的连接器,为上层提供指令、文件、数据的通道,支持直连模式、代理模式以及为达到最优连接指定级联路由的方的模式。管控平台是典型的两层分布式 C/S 结构,主要包含智能的蓝鲸 Agent、提供各种服务的 Server 以及 zookeeper、redis、MySQL 等周边保障模块。其中蓝鲸 Agent 是部署在业务机器上的程序,每台业务机器仅部署一个蓝鲸 Agent,其他模块部署无具体要求,用户可以单独部署,也可以混合部署。
在整个蓝鲸体系中,管控平台无需直面用户,但其在体系中却是不可或缺的,它为其他平台模块提供了人机交互的通道与能力。管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。
其功能详情见《蓝鲸智云管控平台产品白皮书》(待更新)。
配置平台
蓝鲸配置平台(CC)是一款面向应用的 CMDB,在 ITIL 体系里,配置管理数据库(CMDB)是构建其它流程的基础,配置平台作为面向业务层面的 CMDB,为蓝鲸体系的其它平台提供了各种运维场景的配置数据服务,存储与管理企业 IT 架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。配置平台提供的主要功能有主机管理、业务拓扑、业务管理、资源池管理、自定义属性管理、操作审计等。
其功能详情见《蓝鲸智云配置平台产品白皮书》。
作业平台
蓝鲸作业平台(Job)是一套底层基于管控之上的基础运维操作平台,并且具备海量的并发处理能力,除了支持脚本执行、文件拉取/分发、定时执行等一系列可实现的基础运维场景以外,还运用流程化的理念很好的将零碎的单个任务组装成一个作业流程。同时,可通过平台提供的 API 实现对任意作业的调用、查看等操作,与其它平台或系统联动,实现调度自动化。作业平台的主要功能有:快速传输文件、web化脚本管理、支持批量高效执行、流程式管理,一切皆“作业”等。
其功能详情见《蓝鲸智云作业平台产品白皮书》。
数据平台
蓝鲸数据平台是一个专注于运维领域的低门槛大数据平台,提供了数据接入、清洗、计算、存储、查询和分析的全流程自助化大数据服务,运维人员可以通过统一数据接入、可视化计算任务配置、可视化建模、统一查询等功能,快速的构建基于大数据的可视化、智能化运维支撑工具。数据平台的主要功能有:统一数据接入、可视化计算配置管理(Dataflow)、可视化建模(Modelflow)、数据存储查询等。
容器管理平台
蓝鲸容器管理平台是一个用于支撑业务容器化及微服务化的平台,是一种 DevOps 实践。蓝鲸容器管理平台提供了持续集成、持续构建、持续部署的具体实现,并在此基础上,构建了分布式配置管理、服务发现、仓库管理(兼容JFrog与docker hub)、安全健康检查、网络配置服务等主要功能。蓝鲸容器管理平台会以 SaaS 服务的形式提供交互,用户只需通过页面点击就能完成业务镜像的构建、发布等操作。
AI平台
蓝鲸AI平台主要提供数据分析挖掘服务,专注于运维领域,主要目标是降低运维领域数据分析挖掘的门槛。提供了拖拽式式建模、交互式测试调优、自动化模型评估、模型训练运行管理、场景模型(公共的通用的模型)等功能模块,包含了从模型构建评估到模型发布管理这一完整的功能链路,通过将各种基础的数据挖掘、机器学习算法节点化,将模型构建的过程标准化,使普通的业务运维人员通过简单的拖拽配置即可胜任数据分析挖掘的工作,解决算法工程师不懂业务、业务运维不懂算法这一难题。
集成平台
蓝鲸集成平台是一个开放的平台,又称蓝鲸 PaaS,让用户可以简单、快速地创建、部署和管理应用,他提供了完善的前后台开发框架、服务总线(ESB)、调度引擎、公共组件等模块,帮助用户快速、低成本、免运维地构建支撑工具和运营系统。集成平台为一个应用从创建到部署,再到后续的维护管理提供了完善的自助化和自动化服务,如日志查询、监控告警等,从而使用户可以将全部精力投入到应用的开发之中。集成平台的主要功能有:支持多语言的开发框架/样例、免运维托管、SaaS运营数据可视化、企业服务总线(API Gateway)、可拖拽的前端服务(MagicBox)等。 其功能详情见《蓝鲸智云集成平台产品白皮书》。
移动平台
蓝鲸移动平台借助微信公众号解决方案,整合蓝鲸的功能特性,助力运维最大化提高工作效率和便捷性,已支持用户在手机端管理/执行作业任务、创建/修改定时任务等操作,真正做到“工作 • 生活,弹指一瞬间”。
通用SaaS
1.故障自愈
故障自愈是一款实现服务器故障自动处理的解决方案,提升企业服务可用性和降低故障处理的人力投入。通过自动化处理来节省人力投入,通过预定的恢复流程让恢复过程更可靠,通过并行分析达到更快的故障定位和恢复,最终减少业务损失的风险。
该 SaaS 在蓝鲸社区版中暂未推出。
2.监控告警
蓝鲸监控是一款针对主机和互联网应用进行监控的产品,监控服务可用于收集主机资源(系统性能、组件服务、数据库、日志等)的监控指标,探测互联网应用服务的可用性,并对指标进行告警设置。
该 SaaS 已在蓝鲸社区版V3.0中推出。
3.标准运维
标准运维是通过一套成熟稳定的任务调度引擎,把在多系统间的工作整合到一个流程,助力运维实现跨系统调度自动化的 SaaS 应用。
该 SaaS 在蓝鲸社区版中暂未推出。
4.日志检索
蓝鲸智云日志检索是为了解决运维场景中查询日志难的问题而推出的一款 SaaS,基于业界主流的全文检索引擎,通过蓝鲸智云的专属 agent 进行日志采集,无需登录各台机器,集中管理所有日志。
该 SaaS 已在蓝鲸社区版V3.0中推出。
产品功能
产品种类
蓝鲸智云根据用户群体和版本特性的差异,目前为用户提供了3套产品:社区版、公有云版、企业版。
产品名称 | 面向对象 | 使用方法 | 描述 |
---|
社区版 | 个人或企业 | 官网下载,自行搭建 部署 | 由蓝鲸智云团队官方提供的一套基础的、基于 PaaS 的 技术解决方案,旨在提高行业运维技能。该版本终身 免费,已开放下载。其中配置平台已经开源,使用 过程中,请遵循《蓝鲸智云软件用户服务协议》。 |
企业版 | 企业 | 联系在线客服咨询 | 蓝鲸智云团队面向企业出售技术解决方案,为付费 企业定制的自动化运维平台。 |
公有云版 | 腾讯云用户 | 腾讯云注册用户,选择 “云产品”–“基础产品”– “监控与管理”–“蓝鲸平台” | 蓝鲸智云团队为服务腾讯云用户定制的版本,该版 本已推出了六大平台的基础功能,助力腾讯云用户 提高运维水准,提升运营能力,为业务的技术运营 保驾护航 |
版本差异
每个版本产品在平台和功能方面存在较大的差异,即每个版本包含的平台种类,以及各平台的所具有的功能是不一样的。具体差异点请看下表。
表一:各版本产品的平台/SaaS差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
管控平台 | √ | √ | √ |
配置平台 | √ | √ | √ |
作业平台 | √ | √ | √ |
集成平台 | √ | √ | √ |
数据平台 | × | × | √ |
容器管理平台 | × | × | × |
AI平台 | × | × | × |
移动平台 | × | × | √ |
故障自愈 | × | √ | √ |
标准运维 | × | √ | √ |
蓝鲸监控 | √ | √ | √ |
日志检索 | √ | √ | × |
表二:各版本产品的功能/服务差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
是否收费 | 免费 | License永久授权 | 免费 |
服务时间 | 5*8h在线客服 | 7*24h专属服务 | 5*8h在线客服 |
技术支持 | 通用技术支持 | 专家级定制 | 通用技术支持 |
培训服务 | 免费在线培训 | 企业内部培训 | 免费在线培训 |
通用SaaS | 基础功能SaaS | 高级功能SaaS | 高级功能SaaS |
高可用方案 | 无 | 支持 | 支持 |
API | 3000次/日 | 无限制 | 无限制 |
运营管理 | 无 | 企业运营管理方案 | 基础的运营管理方案 |
监控保障 | 基础监控服务 | 企业监控服务 | 通用的监控服务 |
备注: 在以下功能对比中,会出现“*”,“–”, 其代表的含义为: 1):表示相比于社区版(前一个版本),该功能加强了。 2)–:表示该功能被更好的方案替代了,如:“个人工作台”被“个人定制桌面”取代。
表三:管控平台功能/服务差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
文件传输/分发 | √ | √ | √ |
正则表达式 | √ | √ | √ |
命令批量执行 | √ | √ | √ |
脚本批量下发并执行 | √ | √ | √ |
指定用户权限执行 | √ | √ | √ |
用户环境变量继承 | √ | √ | √ |
基础数据采集 | √ | √ | √ |
自定义数据采集 | √ | √ | √ |
集群自动服务发现 | √ | √ | √ |
集群Agent状态查询 | √ | √ | √ |
集群负载均衡支持 | √ | √ | √ |
支持Windows/Linux等主流OS | √ | √ | √ |
区域链控制策略 | × | √ | √ |
跨区域穿透传输 | × | √ | √ |
用户机器密码校验 | × | √ | √ |
采集器插件化支持 | × | √ | √ |
实时数据快照支持 | × | √ | √ |
动态流量负载均衡技术 | × | √ | √ |
集群多区域负载均衡支持 | × | √ | √ |
支持AIX小型机 | × | √ | × |
表四:配置平台功能/服务差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
可视化拓扑 | √ | √ | √ |
基本的实时数据展示 | √ | √* | √* |
自定义属性 | √ | √* | √* |
主机动态分组 | √ | √* | √* |
主机批量导入 | √ | √ | √ |
主机自发现 | √ | √ | √ |
主机跨云管理 | √ | √ | √ |
业务角色管理 | √ | √* | √* |
资源池管理 | √ | √* | √* |
丰富的API | √ | √ | √ |
可扩展的实时数据展示 | × | √ | √ |
表五:作业平台功能/服务差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
无限制的管控节点 | √ | √ | √ |
可视化任务编排 | √ | √ | √ |
支持Windows/Linux等主流OS | √ | √ | √ |
敏感数据加密 | √ | √ | √ |
操作审计 | √ | √ | √ |
作业全局变量 | √ | √ | √ |
公共脚本库 | √ | √ | √ |
SQL执行 | × | √ | √ |
支持PowerShell | √ | √ | √ |
API访问次数无限制 | × | √ | √ |
支持AIX小型机 | × | √ | × |
企业级分布式高可用方案 | × | √ | √ |
表六:集成平台功能/服务差异
类别 | 社区版 | 企业版 | 公有云版 |
---|
三个环境(本地开发环境,测试环境,正式环境) | √ | √ | √ |
基本角色管理 | √ | √* | √* |
基本账号体系 | √ | √ | √ |
Web安全防护 | √ | √ | √ |
个人工作台 | √ | – | – |
个人定制桌面 | × | √ | √ |
可插拔式应用 | √ | √* | √* |
开发框架 | |