Hi 欢迎来到易观方舟
有问题就找小舟助手
联系我们 周一至周五 10:00 - 18:00

产品咨询:4006 - 010 - 231 转 1

商务合作:4006 - 010 - 231 转 2

咨询与帮助

【优秀团队采访】宝藏指南大公开,带你玩转2020OLAP算法大赛

 

​易观数科第四届OLAP算法大赛自火热启动来,已收到来自字节跳动、哔哩哔哩、爱奇艺、中科院计算所等60多个参赛团队的报名。目前报名尚未结束,欢迎算法大神们前来挑战!

 

作为国内 OLAP 技术应用最主要的赛事,易观的OLAP算法大赛直接影响了很多科技公司的技术选型。大赛英雄帖一经发出,即刻引起互联网各大门派积极响应,曾吸引了来自美团点评、阿里云、小米、链家、搜狗、科大讯飞、北京邮电大学、北京交通大学等多家知名企业、科研单位和个人报名。其中帆软团队凭借出色的能力,连续两年拿下前三的好成绩,2018年更是一举夺魁。

 

为给参赛者们助力,大赛采访到了帆软团队分享获奖经验和参赛心得。帆软团队在2018年参赛使用的是帆软自主研发的直连分布式引擎。分布式存储系统基于Alluxio和HDFS,采用列式存储方案,以Spark作为基础,基于流式计算,辅以高性能查询算法,为直连引擎提供强劲的查询支持。面对亿级数据和多维度复杂场景时,直连分布式引擎能大幅提高有序漏斗的计算的效率和准确性。

 

Q&A

 

Q:先做下自我介绍吧。

A:大家好,我是周辉,来自帆软。

 

Q:如何了解到易观的算法大赛并决定报名参加的?

A:同事微信群里分享了易观算法大赛的链接,刚好当时正在带领一个新团队做一个日志处理的引擎,就决定参加易观算法大赛,来验证下引擎的性能。

 

Q:团队成员在比赛内如何分工?

A:因为采用了刚刚开发完成的自研引擎,比赛的工作主要分成两部分,一部分同学专注于引擎自身的基础的性能优化,另外一部分同学专注于漏斗模型的算法优化。

 

Q:在比赛期间,团队遇到过什么样的困难?是如何解决的?

A:准备比赛的前期比较顺利,可是做到后面的题目的时候难度上升很多,保证结果正确已经很麻烦,写出来的算法耗时很高,稍加修改结果又不正确,一时间负责漏斗算法的同学比较灰心。又都是下班时间准备比赛,同学也比较疲惫。

让同学先休息了一天,然后跟同学一起分析题目,跳出原来的思路,用“上帝视角”重新审题,终于理清思路。

 

Q:团队在17,18年的比赛中取得了不错的成绩,可以分享一下团队对于18年“有序漏斗”赛题的解题思路、优化模型的思考、或者其他比赛经验么?

A:18年有序漏斗的难点在于加入了时间的关联属性计算,仅从题目字面意义业务角度出发,不小心就会写出多层循环的时间复杂度过高的算法。

考虑到关联属性一般都是比较重要且有意义的属性,一般属性的种类不会太多,在预处理数据的时候计算了关联属性的种类个数,只需要用几个对应长度的数组,分别用来检索,记录关联属性的关系即可做到在近似O(n)的时间复杂度下完成漏斗的关联属性计算。

 

Q:有什么想和这届参赛选手说的么?

A:预祝大家取得好成绩

 

谢谢帆软团队的分享,也感谢在帆软社区帮助宣传算法大赛,明年比赛欢迎再来组团拿奖!

 

作为易观A10峰会的重要项目,OLAP算法大赛不仅为技术黑马提供大展拳脚的道场,同时还为行业挖掘出更多技术型人才和更优秀解决方案。做技术领域的“伯乐”,让世界看到更多“黑马”,易观致力于推进大数据应用创新。未来,易观OLAP大赛取得的成果将用于数据产品的研发当中,从技术应用层面实践“数以致用”。

 

请持续关注Analysys易观公众号,在这里你不仅可以实时了解易观算法大赛比赛动向,还可以获取海量技术干货。易观第四届OLAP算法大赛”火热报名中。

 

赛题简介

 

存量时代,企业更注重精细化运营,借助用户行为分析工具,企业可针对性地进行渠道优化、产品迭代、运营策略设计等,在使用工具过程中,“事件分析”功能的使用频次极高。事件分析模型主要用于分析用户打开 APP、注册、支付订单等在应用上的行为,通过触发用户数、触发次数等基础指标度量用户行为,也支持指标运算、构建复杂的指标衡量业务过程。

 

本次大赛以“事件分析”为题目,下设3大场景来考察算法能力。

 

大赛题目

 

场景1:多指标多维度分析;

场景2:多指标多维度分析,并计算任意维度小计、合计值;

场景3:多指标多维度分析,计算任意维度小计、合计值,并支持关联用户属性数据。

 

  • 评委会随机设定多维度多指标需求,例如PV、UV、订单金额中位数,并要求根据指定维度+日期进行分组。参赛者根据具体需求计算结果,所有提交的方案都必须可行,并公开思路及源代码。

  • 所有参赛者必须完成三个场景(即三道题目)。所有赛题单独计算得分,在结果准确的基础上耗时少者得分越高,按总得分确定最终排名,更进一步的规则将在算法大赛群内沟通。

 

奖金设置

 

冠军:奖金6万元人民币(税前)+ 荣誉证书;

亚军:奖金3万元人民币(税前)+ 荣誉证书;

季军:奖金1万元人民币(税前)+ 荣誉证书;

特别奖:凡进入答辩环节的选手,将获得机械键盘一套,以及2020易观A10数据智能峰会开发者日门票一张。

 

赛程安排

 

——即日起-9月15日

初赛报名;

——9月7日-9月25日

参赛者获得测试数据,自行调试环境与算法。组织方提供demo数据、例题和答案,用于算法校验;

——9月25日-10月15日

组织方提供数据与测试环境,参赛者获得正式数据在正式环境比赛;

——10月15日-10月20日

参赛者提交算法说明文档,参加线上答辩;

——10月24日

易观A10峰会公布获奖名单并进行颁奖。

 

  • 说明:如有任何变动,将在2020易观第四届算法大赛微信群内沟通,入群者需通过报名方式参加,报名后大赛小助手会拉您入群。

 

参赛对象

 

  • 本次大赛面向全社会开放,相关领域的个人或团队均可报名参加

  • 大赛相关单位(有机会提前接触赛题和数据的人员)不得参加比赛,其他员工可参与比赛排名,但不领取任何奖项。

  • 比赛以团队形式报名,参赛团队成员人数为1-5名,报名时所有成员需提供真实信息,但每位参赛者仅能参与一支团队。

 

报名参赛,扫描下方 ↓↓

 


相关推荐:

体验文中提到的功能

立即免费体验Demo

百闻不如一见

现在来体验方舟如何帮你挖掘商机、增长业绩

体验Demo