智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
智东西12月26日报道,亚马逊云科技自12月20日起正式开启2022 re:Invent中国巡展活动,展示2022 re:Invent全球大会的最新产品和技术、前沿趋势以及最佳实践。
今年是亚马逊云科技第11年举办re:Invent全球大会。来自全球5万多客户和合作伙伴参加了此次技术盛会,还有超过30万人线上参会。会上,亚马逊云科技发布了一系列涵盖底层基础架构、计算、数据库、数据分析、AI/ML、安全、行业应用等新的服务及功能。
面向底层技术创新,亚马逊云科技一连推出三类自研芯片,分别是第五代虚拟化芯片Amazon Nitro5、Amazon Graviton3E处理器、Amazon Inferentia2机器学习加速推理芯片。
在大数据层面,亚马逊云科技构建了云原生端到端的数据战略,让客户可以更便捷、安全地获取数据洞察。新服务及功能重点包括数据管理服务Amazon DataZone,帮助客户实现“Zero-ETL”的全新服务集成功能;5项数据库和分析服务全新功能;Amazon SageMaker以及Amazon QuickSight等的多项新功能。
此外,亚马逊云科技还推出了安全数据湖Amazon Security Lake,方便客户针对安全数据做出快速行动;并针对行业需求,推出帮助企业更好地管理供应链的Amazon Supply Chain,以及助力企业更高效地处理组合数据集的Amazon Clean Rooms等。
▲亚马逊云科技大中华区产品部总经理陈晓建
一、十年自研芯片持续迭代,加速底层技术创新
亚马逊云科技大中华区产品部总经理陈晓建说,2006年,在南非开普敦,一个仅10人的团队开发了第一款亚马逊云科技Amazon EC2实例,今天Amazon EC2实例已经超过600款,几乎覆盖了所有现有操作系统计算平台。
2017年前,整个Amazon EC2实例的增长还处于一个相对平缓的阶段。但到2017年后,Amazon EC2的实例增长突然提速。
Annapurna是一座在喜马拉雅群山中海拔8091米的极高峰,也是亚马逊云科技自研芯片团队的名字。经过10年的努力,亚马逊云科技芯片团队构建了3条自研芯片的产品线,包括5代定制化Nitro系统、3代基于Arm架构的CPU处理器Graviton、用于加速机器学习推理的2代Inferentia芯片、用于加速机器学习训练的Trainium芯片。
定制化的芯片设计,有助于帮客户运行要求更高的工作负载,包括更快的处理速度、更高的内存容量、更快的存储输入/输出(I/O)、更高的网络带宽。
在今年的re:Invent大会上,亚马逊云科技再次推出了一系列底层技术更新,包括第五代虚拟化芯片Nitro5、Gravition3E以及机器学习推理芯片Inferentia2,并推出了由三款自研芯片支持的Amazon Elastic Compute Cloud(Amazon EC2)最新实例。
其中,Amazon EC2 Hpc7g实例采用了Amazon Graviton3E芯片,与当前一代Amazon EC2 C6gn实例相比,浮点性能提高了2倍;与当前一代Amazon EC2 Hpc6a实例相比,性能提高了20%,为高性能计算工作负载提供了更高的性价比。
Amazon EC2 C7gn实例采用Amazon Nitro5,与当前一代网络优化型实例相比,为每个CPU提供了多达2倍的网络带宽,同时将每秒数据包转发性能提升50%,为网络密集型工作负载提供了超高的网络带宽、数据包转发性能和性价比。
Amazon EC2 Inf2实例采用Inferentia2,是专门为运行多达1750亿个参数的大型深度学习模型而构建的,与当前一代Amazon EC2 Inf1实例相比,可提供高达4倍的吞吐量,降低多达10倍的延迟,且成本更优,延迟更低。
亚马逊云科技还对核心的底层亚马逊云科技SRD网络协议(Scalable Reliable Datagram,可扩展的可靠数据报)进行了创新,推出了高速虚拟网卡ENA Express,提供一致的更低延迟和更高网络吞吐量。SRD协议是亚马逊云科技开发的一种网络协议,专为亚马逊云科技环境中实现一致且低延迟的网络而构建的,具备多路径传输、微秒级重传和Nitro芯片提供专用资源三大优势,能够显著降低网络延迟,提高网络吞吐量。
针对负载巨大且高度复杂的模拟应用场景,亚马逊云科技推出了Amazon SimSpace Weaver服务,帮助客户构建、操作和运行大规模的空间模拟仿真系统。客户使用该服务可模拟出100万个以上、实时交互的仿真对象,创建比以往更加复杂的环境,并且将模拟仿真系统部署的时间从数年缩短至数月。
二、三个关键因素,构建端到端的云原生数据战略
数据是企业业务决策流程的中心,是构建数字化转型的基石。
陈晓建在其演讲中分享说,亚马逊云科技提供了一个端到端的数据战略,帮助客户从数据的摄入、存储、查询、分析到可视化呈现以及人工智能,在各个方面以安全、合规的方式实现数据的共享和输出。
如何去构建一个端到端的云原生数据战略?亚马逊云科技认为有三个关键因素:
第一,构建极致性能。建立一个面向未来的数据底层基础设施。
第二,轻松和无处不在的连接。实现一个跨组织的数据一体化融合。数据不再是一个个烟囱式的孤岛,而是一个完整的打通的大的数据库。
第三,通过教育和工具实现数据的普惠化、智能化,运用各种培训及工具能力,降低数据的智能化服务门槛,让更多的人可以从中获益。
亚马逊云科技也总结了面向未来的云原生数据基础设施应包含的4个方面:
第一,应该具备适用于所有适合工作负载和任何数据类型的合适的工具,以及让你能够适应不同不断变化的需求和机会。
第二,应该能够持续优化,以跟得上用户业务的发展所带来更多的数据和业务规模,并能够保持高性能。
第三,应该能够面对客户日益复杂的业务逻辑,提供尽可能多的工具,帮助用户在整个数据使用过程中降低门槛、复杂性,提升使用效率。
第四,应该具备最高级别的可靠性,因为用户的数据对用户的业务来说是至关重要的。
据统计,亚马逊云科技前1000名客户中,有超过94%的客户使用了10种以上的数据库和分析服务,由此可见选择合适的针对场景的数据库和数据分析业务何其重要。
因此,亚马逊云科技致力于来构建云原生服务,为特定场景定制化开发一个最合理的工具。
亚马逊云科技在云原生能力开发方面历史悠久,2006年推出的Amazon SQS云原生服务至今仍被大量的业务和应用使用,2012年推出业界第一款真正的云原生数据库Amazon DynamoDB,2014年推出业界第一款无服务器计算服务Amazon Lambda,2017年推出适合容器的无服务器能力的新服务Amazon Fargate……
在2022 re:Invent全球大会期间,亚马逊云科技发布了全新的数据管理服务Amazon DataZone,帮助客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理,同时提供更精细的控制工具,管理和治理数据访问权限,确保数据安全。
过去业务数据往往需要通过ETL才能进行分析从而提供洞察,很耗时。针对ETL(数据的提取、转换和加载过程),亚马逊云科技在本次大会上发布了两项全新集成功能,帮助客户实现“Zero-ETL”(零ETL)。客户可使用Amazon Redshift近乎实时地分析Amazon Aurora中的数据,无需在不同服务之间进行ETL;还可以使用其分析和机器学习服务在Amazon Redshift的数据上轻松运行 Apache Spark应用程序。
此外,亚马逊云科技推出了5项数据库和分析服务全新功能,让客户能够更快、更轻松地管理和分析PB级数据:
(1)Amazon DocumentDB Elastic Clusters:可将客户的文档工作负载扩展到支持每秒数百万次请求,并支持PB级数据存储。
(2)Amazon OpenSearch:推出Serverless无服务器功能,可帮助客户在无需配置、扩展或管理底层基础设施的情况下运行搜索和分析工作负载。这也标志着亚马逊云科技补上了Serverless最后一块拼图,实现其数据分析服务的全面无服务器化。
(3)Amazon Athena for Apache Spark:能让客户开始使用Apache Spark进行交互式分析的时间从数分钟缩短到1秒内。
(4)Amazon Glue Data Quality:可以跨数据湖和数据管道自动管理数据质量。
(5)Amazon Redshift:支持跨多个亚马逊云科技可用区(AZ)的高可用配置。
除了拥有完整的关系型数据库和专用数据库,亚马逊云科技也提供有大量方便客户更轻松构建AI/ML的服务,并在本次大会上推出了机器学习服务Amazon SageMaker的8项新功能及Amazon QuickSight的5项全新功能。
其中,全新Amazon SageMaker治理功能可在整个机器学习生命周期中提供对模型性能的可见性;Amazon SageMaker Studio Notebook功能提供了增强的Notebook体验,客户只需点击几下即可检查和解决数据质量问题,将Notebook代码转变到自动化作业,加速机器学习实验到生产的过程;其他一些新功能可自动执行模型验证,并且让地理空间数据处理变得更容易。
Amazon QuickSight是一个基于机器学习的商业智能解决方案,能在几分钟之内建立一个交互式仪表板。其新功能可支持业务人员直接用自然语言提问各类预测问题,并能够给出预测依据,大大降低了企业从数据中获取业务洞察的门槛。
三、“安全是最高优先级”
“安全是亚马逊云科技最高优先级的工作,我们从未停止脚步,在云自身的安全和云中的安全上持续创新。”陈晓建谈道,“客户选择亚马逊云科技其中有一个非常重要的原因,就是在亚马逊云科技上它的应用程序和数据安全要明显优于他们自己在本地基础设施或其他的云。”
亚马逊云科技在本次大会上分享了安全的4大目标:快速帮助客户提升安全水平,降低安全成本,减少安全问题的处理时间,提高企业安全的效率。
围绕这四大目标,亚马逊云科技推出了一系列新的服务及功能。
例如,其新推出的第五代虚拟化芯片Amazon Nitro5在给客户带来性能提升之外,也提供了更高的安全性。
如何减少安全事件的处理时间?对此,亚马逊云科技推出了云托管服务安全数据湖Amazon Security Lake。Amazon Security Lake通过可定制的数据备份保留设置实现数据生命周期管理,可自动将客户在云端和本地的安全数据集中到客户在亚马逊云科技账户下专门构建的数据湖中,方便客户针对安全数据做出快速行动。
安全分析师和工程师可以使用Amazon Security Lake聚合、管理和优化大批量迥然不同的各类日志和事件数据,实现更快的威胁检测、调查和事件响应,高效、快速地解决潜在问题,同时继续使用他们熟悉的分析工具。
亚马逊云科技也进一步丰富了Amazon GuardDuty功能,使其能够为Amazon Aurora提供威胁检测,以识别对存储在Aurora数据库中的数据潜在威胁。Amazon GuardDuty RDS Protection可配置和监控客户账户中现有和新数据库的访问活动,并使用定制的机器学习模型来准确检测Aamon Aurora 数据库的可疑登录。
Amazon GuardDuty的好处还在于与Amazon Aurora集成,可直接访问数据库事件,无需修改数据库且不影响数据库性能。
为了提高安全效率,亚马逊云科技推出了Amazon KMS External Key Store (Amazon XKS)。该功能让客户能够在亚马逊云科技之外的外部密钥管理系统中使用加密密钥、独立授权和审核来加密或解密数据,可与100多项亚马逊云服务相集成,免去了客户繁琐的集成开发工作。
四、针对不同行业需求,推出开箱即用的行业应用
针对企业的行业应用,亚马逊云科技在2022 re:Invent全球大会推出了多项新的服务。
新推出的分析服务Amazon Clean Rooms,可帮助不同行业的公司轻松、安全地分析和协作处理组合数据集,无需共享或泄露原始的底层数据。借助Amazon Clean Rooms,客户可以在几分钟内创建一个安全的数据清洗空间,与亚马逊云科技之上的其它公司协作,生成与营销活动、投资决策、临床研究等相关的独特洞察。
Amazon Clean Rooms为保护敏感数据提供了一组内建的数据访问控制,包括查询控制、查询输出限制、查询日志和加密计算工具。
针对生物医疗行业,亚马逊云科技推出了Amazon Omics。这是一项用于存储、分析和阐述基因组学、转录组学和其他组学数据的托管服务,专为医疗保健和生命科学组织而设计,旨在加强患者护理并推进科学研究,它的推出将有助于靶向疾病的治疗。
基于Amazon.com近30年的物流网络经验,亚马逊云科技推出的新应用程序Amazon Supply Chain,可以帮助企业提高供应链的可见性,做出更快、更明智的决策,并降低风险、优化成本及改善客户体验。
Amazon Supply Chain可自动合并、分析多个供应链系统的数据,企业因此可以实时观察供应链运营的情况,更快地发现趋势,更准确的预测需求,确保充足的库存满足客户预期。该应用还通过提供统一的数据湖、机器学习驱动的洞察、行动建议和应用程序内协作功能,提高客户供应链的韧性。
结语:立足底层自研,力推云原生应用普及
Pitchbook的数据显示,全球有超过1千家独角兽,其中83%都在用亚马逊云科技;Cloud 100榜单上超过90%的初创企业都将他们的业务放在亚马逊云科技上运营。
作为全球公有云基础设施头部企业,亚马逊云科技的前瞻技术及战略布局、更多Serverless及数据相关服务、开箱即用的行业应用,都对云计算产业的发展、企业客户进一步走向数字化及实现降本增效的方向具有借鉴意义。
一方面,亚马逊云科技正不断加强云计算核心能力建设,更加自主可控地为其客户提供更高性价比的云服务;另一方面,通过紧密追踪客户的新需求,亚马逊将“数据”置于更重要的位置,推出大量有关数据的新服务并持续加强安全性,更加坚定地推进云原生数据战略的构建。
“数据是整个应用程序业务逻辑的核心,几乎是每个组织数字化转型的基石,但处理数据非常棘手,这也是亚马逊云科技一直致力于建设一个云原生的数据战略的原因。”陈晓建说,亚马逊云科技希望提供的所有工具,能够帮助客户在整个数据全生命周期每个环节将数据利益最大化,更安全、更高效地挖掘数据价值。