:【大咖来了 第12期】AI和大数据系统在电子竞技数据处理平台中的应用

作者: 俞圆圆 2020-02-14 16:27:05
本文来源:http://www.ssb69.com//

,

【 www.ssb69.com原创稿件】电子竞技作为近年来竞技体育项目中发展最迅猛的一个独特分支,正在引起大量的社会关注和重视。和其他竞技体育项目一样,电子竞技对于数据的分析和应用有着独特的要求。电子竞技项目中,由于职业玩家和业余玩家的距离更近、业余玩家对于项目的参与度更高,使得其比赛数据的体量和数据分析的技术要求较之传统体育有着几何级数的增长。

本期《大咖·来了》栏目邀请了VPGame CTO 俞圆圆(Y3),进行了主题为《从游戏到科学:AI和电子竞技》的分享,围绕如何利用前沿技术对海量电竞数据进行处理、存储与分析展开。

FunData大数据系统

电竞数据的量级远远大于传统竞技体育,所以VPGame是采用什么技术框架进行处理的呢?下面介绍一下FunData大数据系统以及其ETL层、接口层、数据处理层等部分的具体细节。如下图,为通用FunData大数据系统架构

FunData大数据系统分为四层:ETL层的作用是数据提取、清洗过滤和加载,接口层的作用是为前端产品应用提供服务,数据处理层的作用是运用流计算、批计算等方式、对原始数据进行提取,最终得到可用性较高的总结性、概览性数据,存储层作用是对数据进行分级,选取不同的技术方案进行存储。

FunData大数据系统之ETL范式

如下图,为FunData ETL整体范式。

从厂商数据接口、直播视频或录像文件等渠道获取到的数据源,通过外部消息队列推送到据上报模块,由内部消息列队通知不同的数据清洗和分析系统,将原始数据进行分门别类的归档和存储,再次通过内部消息队列一步步将这些数据加载或存入到不同的底层存储服务中。

FunData大数据系统之接口层

如下图,为基于Kubernetes的弹性API系统架构。

数据要如何运用呢?不管是服务于VPGame应用,还是第三方应用,都是通过基于Kubernetes搭建的API集群实现的。API系统架构不是一成不变的,当不断深入或拓展到其他游戏IP时,会同步进行很多优化,同一个游戏在不同阶段会提供丰富度不同的API,当然整个扩容的过程一定是平滑的。API系统架构一定要具备弹性扩容能力,以便可以很好的应对比赛过程中出现的API请求激增的情况。

FunData大数据系统之数据处理层

数据处理层的挑战在于不同游戏,甚至同一个游戏的不同场景,数据逻辑都是不一样的,所以如果是采用基于虚拟机的单体程序设计的话,对于弹性流量的适应会存在很大困难。如下图,为数据处理层的工作逻辑。

VPGame的数据处理逻辑构建基于Serverless的弹性框架,对实时激增的数据进行处理和计算。于整个框架而言,对业务方的要求仅仅是编写好业务逻辑即可,不必操心容量规划方面的问题。

如下为VM系统与Serverless架构对比图。

VM系统与Serverless架构存在明显差异,主要体现在资源利用率、资源的虚拟化和计算能力等方面。对于VM系统,当访问量增加时需要联系运维新增机器,恢复正常访问量再联系运维减少机器。对于Serverless架构,可以依据实际请求量和机器状况动态分布,统一由Vfunctions管理,不需要运维和业务方的介入。还有就是随时间推移,游戏数据量会存在突刺,热门时间(大赛/节假日)比赛数量激增的情况,原来基于VM的方式处理数据会导致大量数据处理任务堆积,系统压力飙升,部分处理任务超时,不得不人工接入进行扩容。改为Serverless架构,收到新的数据后,由Serverless调度器随机分配一个Worker启动对应的算法容器进行数据处理与提取。

数据处理层还要面对的问题是,不同维度和层面的数据,对于实时性的要求不同,对于资源和时间的计算、处理,其要求也是不同的。这里就需要把处理模块大致分为Hadoop (数据批处理)和Flink (数据流处理)。

批处理的数据一般是全局性的统计数据,如这场比赛出现多少英雄,他们的装备、技能选择等数据,这些数据相对深入,访问频次相对较低,故对及时性的相对要求也不高。但像单局比赛的基础数据,就属于热点数据,需要比赛结束后第一时间进行处理,这里就需要采用流处理框架,保障收到数据后,秒级产出数据结果。以DOTA2单局比赛个人数据处理为例,详见下图。

通过消息队列进来的数据信号会知道这些ID有新的比赛产生,接着Filter会把无效的比赛ID过滤掉之后,进一步对数据结构做部分转化,清理不需要的字段,将这些处理流写入不同维度的算子,最后用Reduce算子做一些聚合。

综上所述关于大数据系统的内容为本次分享的第一部分,后面还有对FunData海量存储和基于OCR与机器学习的数据识别和挖掘两部分精彩内容,请戳视频:/aix_51cto_com/activity/10021.html

【51CTO原创稿件,合作站点转载请注明原文作者和出处为 www.ssb69.com】

大咖来 电子竞技
上一篇:【大咖来了 第11期】IT管理者的自我认知和沟通管理 下一篇:助力抗疫,人工智能和大数据将全面爆发?
评论1
取消
2020-05-20 09:53:52
1
good

更多资讯推荐

如何定义和搭建可靠人工智能系统的规则?

几十年来的发展普及,让初创公司和创业者已经养成了将人工智能和机器学习融入几乎每一个项目的习惯。大家利用人工智能和机器学习目的是提高效率和速度,但你知道吗,不可靠的人工智能系统也许弊大于利。

读芯术 ·? 23h前
7种不同的使用AI聊天机器人的方式

如今,商务专业人员正在寻找一些先进技术来提高市场回报。人工智能(AI)已经证明了其优势,可以与世界各地的用户建立牢固的联系。

Cassie ·? 23h前
算法之“算法”:所有机器学习算法都可以表示为神经网络

大概从20世纪50年代的早期研究开始,机器学习的所有工作就都是随着神经网络的创建积累而来的。随后出现了一个又一个新算法,从逻辑回归到支持向量机。

读芯术 ·? 1天前
客户之声:人工智能是你优先考虑的吗? 你需要从数据策略开始

目前,世界上的每个部门都在研究人工智能(AI)。 人工智能的突破性进展将发生在健康和生命科学、网络智能、智能城市和交通领域。

佚名 ·? 1天前
监督学习、非监督学习、强化学习都是什么?终于有人讲明白了

本文带你了解机器学习的分类——监督学习、非监督学习、强化学习。

小川雄太郎 ·? 1天前
一文了解卷积神经网络基础,建议收藏

今天给大家讲一下卷积神经网络,主要包括四个部分:卷积神经网络的历史、全连接层、卷积层和池化层。

调皮的阿广 ·? 1天前
人工智能70年,研究者们最不愿意面对的惨痛教训是……

自1956年达特茅斯学院那场著名会议以来,人工智能研究走过了这么多年的旅途,经历许多高峰也走过很多低谷。前事不忘后事之师,这期间产生了很多经验教训需要我们反复学习,而最重要的一条教训却是很多研究者很难接受的。

读芯术 ·? 1天前
经济学里的机器学习:二者结合必将拥有光明的未来

机器学习在数据科学和自动化的各个领域得到了广泛的应用,但在经济学领域的应用并不多见。本文的目的就是具体介绍机器学习在当前经济结构中的应用及其未来的可能性。

读芯术 ·? 1天前
Copyright?2005-2020 www.ssb69.com 版权所有 未经许可 请勿转载
申博游戏登录直营网 正规申博开户登入 申博游戏端登入 百家乐手机版登入网址 菲律宾申博娱乐官网 网上百家乐登入
www.666msa.com www.99psb.com 申博开户直营网 正规申博开户登入 菲律宾申博娱乐直营网 新版太阳城申博开户
申博太阳城亚洲微信支付充值 菲律宾申博太阳网上娱乐99 www.77sbc.com 旧版申博会员注册 申博怎么开户 申博娱乐手机版