1、自选赛题指南
以下选题为组委会根据企业及学科与大数据应用的结合列出的一些研究方 向,选手可以参考并进一步细化、分解,不必拘泥于给出的这些题目。凡是基于 互联网数据及企业内部等各方面数据进行分析,用于企业数字化经营、数字化营 销、大数据产品管理、大数据品牌管理、大数据舆情分析、大数据征信、金融大 数据等企业大数据应用的选题都可以参赛。
疫情对天津社会经济的影响分析;
股民情绪、重大事件、天气对股价、投资的影响关系
疫情前后股民投资倾向(互联网数据挖掘)变化
疫情后的旅游需求(影视娱乐需求等)调查研究;
如何应用大数据对企业进行风险监控
大数据画像对企业的应用
数据驱动企业业务决策(产品设计、营销、策划、运营、客服、售后等)
股民情绪(微博中的情绪表现)与个股、股价之间的相互影响
情绪、事件对宏观指数的影响
互金政策对股价的影响
天气异常对股价影响情况
科创板上市以来股民投资倾向(互联网数据挖掘)变化不同收入段的股民受股票讨论度的影响
网络舆情导向的市场预期和个股预期
某一类金融资产的市场关注度分析以及延伸出来的问题
挖掘预测某一上市公司的财务情况(分析上市公司的产品在网络中的声量、 口碑等,联合分析产品的销量预期)
调查某一金融机构的转型方向(机构需面向大众市场,挖掘网民的意见,可 以分析网民需要的金融服务,和希望改进的金融服务等)
企业扶贫对其股民及企业股价影响的研究
各类金融产品对投资者的吸引力研究(年龄段优势、性别优势等,将投资者 反馈作为衡量优劣的参考)
探究各类金融产品对非金融行业发展的影响价值
2、企业赛题指南——策略方案赛道
2、企业赛题指南——策略方案赛道
2.1 策略方案赛道题目:
赛题 1:银行综合金融产品营销方案
赛题 2:数字化打造护肤爆品
赛题 3:直播带货的利与弊
赛题 4:化妆品安全性舆情
赛题 5:疫情激发护肤市场的变化
赛题 6:大学生护肤产品研发建议
赛题 7:抗衰护肤产品的用户及市场分析
赛题 8:翻包事件对迪士尼的网络口碑影响分析
赛题 9:泰山景区舆情数据基础分析
2.2 模型算法赛道题目:
赛题 1:企业名称申报业务场景中机器人客服理解客户意图能力
赛题 2:道路机扫水洗作业路线优化
赛题 3:垃圾收运作业路线优化
2.3 策略方案赛道细则
2.3.1赛题 1:银行综合金融产品营销方案
2.3.1.1 背景和解决的问题
随着以互联网为代表的现代信息技术发展,诞生了诸多基于互联网的金融服务模式,互联网金融对传统金融模式产生了根本的影响。互联网金融依托于社交、
电子商务、大数据的发展,客户群体在短时间内得到快速增长,特别是在校大学生易于接受新鲜事物、对社交和电子商务依赖性较大,互联网金融产品在大学生
群体覆盖较广。互联网金融在快速发展的同时,因其违约成本低、信用体系不完善、风险管理能力弱等缺点,在个人客户信息保护和资金安全方面产生负面影响,
校园金融安全显得愈发重要。近年来,传统银行机构发力金融科技,几大国有银行相继成立金融科技公司,完善手机银行、移动支付,优化金融产品,关注服务
体验,发挥风险控制优势,与互联网头部企业加深合作,金融市场竞争更加激烈。如何在大学生群体中宣传使用银行金融产品,树立正确金融安全理念,显得尤为
重要。
2.3.1.2 目标
为在校大学生设计银行综合金融产品营销方案
方案内容包括:
产品种类介绍(建行手机银行、建信理财龙宝、大学生信用卡)
产品优势分析
产品应用场景
大学生群体规模、消费行为特征、使用金融产品的习惯、需求、金融知识掌握情况、偏好的礼品权益等。
产品推广策略
2.3.1.3 验收标准
(1)方案中涉及到的产品种类建议为手机银行、建信理财龙宝、大学生信
用卡,该类产品均可面向学生群体,参赛选手需充分了解产品功能与使用要求。
(2)方案设计时可针对某一产品单独设计策略,也可根据产品特征、学生
使用场景、需求,组合产品设计营销策略。
(3)方案设计应在充分调研、数据收集和分析的基础上完成。大学生群体规模、消费行为特征、使用金融产品的习惯、需求、金融知识掌握情况、偏好的
礼品权益等结论应有数据支撑。
2.3.1.4 出题单位:中国建设银行股份有限公司
2.3.1.5 奖项及奖金:一等奖一名,奖励 5000 元,二等奖一名,奖励 3000元,三等奖两名,每位奖励 1000元。
2.3.1.6 企业介绍:中国建设银行股份有限公司是一家在香港和内地上市的大型国有控股商业银行,设有 14912个分支机构,拥有员工 35万人。中国建设
银行植根本土,面向全球,以强烈的使命感和敢为人先、追求卓越的进取精神,致力于成为中国金融现代化建设的先行者。
2.3.2赛题 2: 数字化打造护肤爆品
2.3.2.1背景
2016- 2018年,我国化妆品市场中护肤品牌与彩妆品牌个数增幅均超过 20%,截止 2018 年,我国化妆品市场中护肤品牌个数共有 9907 个,彩妆品牌个数共
有 2762个。业内企业数量众多且保持较快速增长势必使市场中原有品牌所占份额受到挤压,外加消费者年均购买品牌数量的增加(2019年我国化妆品消费者年
均购买品牌数量为 5.8个,较 2018年增加 0.1个),未来我国化妆品行业竞争将进一步加剧,如何让国货新品牌快速崛起,在市场占有一席之地,成了众多国内
化妆品公司一直追求的目标
2.3.2.2 目标
为年轻国货品牌打造一款护肤品爆品
爆品内容包括:
1)产品品类
2)产品功效
3)产品价格
4)产品规格
5)产品用户画像
6)产品上市后优先选择的推广策略
注:1、该公司的优势是具备国内顶尖的研发实力,劣势是资本偏小,并没有超大资本做全网的广告营销
2.3.3赛题 3:直播带货的利与弊
2.3.3.1 背景
当前直播带货兴起,正处于蓬勃发展的时期,中国互联网络信息中心的数据显示,目前我国网络直播用户规模已达 5.6亿,占网民总数的 62%。而中信证券的数据显示,2019 年电商直播的行业规模已经超过 3000 亿元,2020 年有望突破万亿元。看似一片红火,但企业真的能从中转到钱吗?直播带货又有哪些套路和坑?
2.3.3.2 目标
请用数据分析阐述直播带货给不同的企业带来的利益有多大(可具体到品类、品牌或产品)内容包括:
1)直播带货逻辑
2)特定品类或产品的不同级别的主播的带货收益 3)给出不同类型企业的直播建议
2.3.4 赛题 4:化妆品安全性舆情
2.3.4.1 背景
2020年 6月 29日《化妆品监督管理条例》正式发布, 《化妆品监督管理条例》被称为化妆品行业最高法,从 2013年首次被国务院列入修订计划,
到今年的发布,共耗时 7年,堪称中国化妆品行业史的里程碑,那么我们国民大众对化妆品安全是怎么看待呢
2.3.4.2 目标
请用数据分析网民对化妆品安全性的情感态度,化妆品安全性方面还有哪些
改进之处。内容包括:
1)网民对化妆品安全性的情感态度
2)化妆品安全性的改进建议
2.3.5 赛题 5:疫情激发护肤市场的变化
2.3.5.1 背景
2019年底突来的疫情让民众分分带上了口罩,现在不戴口罩出门就觉得自己在裸奔,天天戴口罩也让很多人出现了口罩脸的问题,很多原本没问题的肌
肤开始变得出现了问题,需要特殊护理,那么受疫情影响都出现了哪些肌肤问题,又有哪些品牌抓住了时机,在这个事件上受益
2.3.5.2 目标
分析疫情带来得皮肤问题,同时分析出哪些品牌在这个事件中收益
内容包括:
1)皮肤问题得种类及占比
2)受益的品牌及其市场的变化
2.3.6 赛题 6:大学生护肤产品研发建议
2.3.6.1 背景
随着经济水平的提高,大学生群体越来越重视皮肤护理,对护肤品的要求也
越来越高,那么现在大学生对护肤品都有哪些需求,最受大学生喜爱的 top5品牌是哪些,给到国货护肤品牌的产品研发建议是什么呢
2.3.6.2 目标
通过数据分析大学生护肤需求,给出产品研发建议
内容包括:
1)通过数据分析大学生护肤需求
2)最受大学生喜爱的 top5品牌是哪些
3)给到国货护肤品牌的产品研发建议
2.3.7 赛题 7:大学生护肤产品研发建议
2.3.7.1 背景
现在抗衰产品受众年龄越来越年轻化,很多 90 后学生已经在使用抗初老的产品,那么抗初老产品的潜在用户画像是什么?抗衰产品现有市场饱和度怎样?抗衰产品有没有新的机会点
2.3.7.2 目标
通过数据分析分析抗衰产品的潜在用户画像,如果做一款抗衰新品,区别于已有产品的竞争点是什么
内容包括:
1)通过数据分析分析抗衰产品的潜在用户画像
2)现有市场抗衰产品的市场占有率、销量 top5产品的卖点都 是哪些
3)给出抗衰类产品的新品竞争点
注:赛题 2-赛题 7出题单位:守正创新生物科技(天津)有限公司
企业介绍:
守正创新生物科技(天津)有限公司,成立于 2018年 11月,坐落在天津滨海高新区,是拥有 integribiotech 融合算法的生物科技创新公司。品牌创始人郑
春阳是美国康奈尔大学药理系博士后、北京大学生物学系学士同时也是国家千人计划专家、国务院政府特殊津贴专家、全国政协委员。创新是公司保持领先优势
的核心,公司不同方向的研发团队启动了与皮肤表观遗传、皮肤微生态相关的多个研究项目,科研成果转化率达 80%。公司累计申请专利 30余项,其中 12项已获授权。
2.3.8 赛题 8:翻包事件对迪士尼的网络口碑影响分析
2.3.8.1 背景和解决的问题
对旅游目的地来说,突发舆情在所难免。事件发生后,如何正确处理事件、 应对舆情,关系到相关景区,甚至是县、市、省的网络舆情形象。
当舆情危机事件发生时,不论何种行业,何种机构,都应该通过舆情分析,从舆情危机中看到其背后存在的社会问题,然后采用行之有效的对策解决矛盾、
疏导情绪,进行舆情处置。如果在危机发生后,对其充耳不闻、视而不见、听之任之,将有可能造成损失。
结合口碑变化,尽早的发现舆情,进行应对,这样才不会使舆情危机由小变大,由少变多,愈演愈烈,最终造成巨大损失。2019 年年初,上海华东政法大学四名同学在迪士尼入园时遭到翻包,其中
一位王某深感不公不合法,在 3月 5日将上海迪士尼告上法庭,2019年 8月,多家媒体进行报道,一时间掀起轩然大浪。请以此为例对上海迪士尼的舆情事件处置和口碑评价变化进行研究。
2.3.8.2 目标
数据完成以下分析:
请对数据进行清洗,找出“迪士尼翻包事件”相关数据,并用可视化方法对数据量进行表达。
建立口碑评价指标体系,并使用给出的数据,对上海迪士尼进行口碑评分, 并进行可视化展现。
分析上海迪士尼,消费者,政府机构,媒体四方在此事件中的行为及对上海迪士尼的口碑产生的影响。
附件 1:迪士尼 2019年网络舆情数据.csv
2.3.8.3 验收标准
数据处理过程的真实性,运算过程可以复现;口碑评价指标体系的完整性及评分方法的合理性。
2.3.9 赛题 9:泰山景区舆情数据基础分析
2.3.9.1 背景和解决的问题
背景概述:自古以来,中国人民崇拜泰山。在中国传统文化中,泰山一直有“五岳独尊”的美誉。同时,“泰山”也具有很多引申意义。因此在互联网中有大量关于“泰山”的信息。
泰山景区相关管理者对泰山景区进行舆情监测时发现,收集到的信息中存在较多与泰山旅游不相关数据,还存在大量转载或描述相近数据,数据量大,对事件监测产生不利影响。去重无关数据和对文本话题进行聚类成为最为重要的两个
问题点。
2.3.9.2 目标
请运用给出的数据附件 2运用算法进行以下分析:
请对数据进行清洗,保留旅游相关数据。
有时存在对正文相似度过高文本进行去重。
分别对去重前的数据和去重后的互联网数据进行话题聚类。
附件 2:泰山相关互联网数据.csv
2.3.9.3 验收标准
对结果进行验收评估时,将用另一部分数据对相似文本去重和话题聚类,并对结果进行对比,判定正确率高的为胜。
注:赛题 8-赛题 9出题单位:海鳗数据奖项及奖金:暂不提供企业特别奖项,此赛题参与通用奖项评比。
企业介绍:海鳗数据是专门从事旅游大数据应用场景研究和旅游大数据价值挖掘的高科技公司。公司本部设在北京,在天津设有平台和数据运维团队,是国家高新技术企业。
海鳗云是面向旅游大数据典型应用场景推出的 SAAS服务平台,致力于整合高价值外部数据(互联网内容数据、位置数据、消费数据、搜索数据等)进行深入的数据价值挖掘和数据分析能力输出,为旅游监管机构和景区等涉旅企业在客
流管控、服务质量提升、产品开发以营销推广上赋能。目前,海鳗云平台实时监测旅游目的地五百余家,日数据增量两千万条,为宁夏、青海、甘肃、成都、余杭等政府用户以及泰山、黄山、崂山、都江堰等景区用户提供大数据分析服务。
海鳗数据着重进行产教融合推进,梳理自身产业技术和服务能力用以帮助 高校和高职的旅游管理相关专业提升旅游大数据教研实训能力。目前海鳗云 已经服务于湖南师范大学、黄河水利职业技术学院等多所院校。
2.4 企业赛题指南——模型算法赛道
2.4.1 赛题 1:企业名称申报业务场景中机器人客服理解客户意图能力
2.4.1.1 背景及问题
一个企业如果想要获得在市场上合法经营的资格,需要进行一系列的行政申请,第一步就是向市场监管部门为自己申请注册一个名字。
为了优化营商环境,让企业少跑腿,现在全国大部分地区企业名称的申报业务已经由传统的线下窗口提交申请人工审核转移至线上自助办理,机器 7*24小时实时在线审核,这样大大的压缩了名称申报的时间。但是,很多申请人在申报过程中一旦遇到问题就会面临求助无门的窘境,因为各地市场监管部门人力和经费有限,没有能力提供充足的在线咨询服务,电话没人接或始终占线是常态。
为了解决这个问题,海智大数据基于深耕工商注册十多年的经验,在承接全国多地官方企业名称申报平台的建设及运营的同时,开设了专门为企业解答开办问题的公众号“陪你办开办创业服务中心”,目的就是打造一个智能机器人客服平台,通过问答方式,可以准确的理解企业的意图,判断出现的问题,及时给出相应的解决方法和指引,让企业在申请名称过程中,遇到问题,立马提问就可以解决,将线上名称申请和咨询紧密结合,大大提高企业在线申报名称的用户体验。
2.4.1.2 目标
建立一个针对于提问者话术的 NLU 深度学习模型以及相应的训练机制,能够对给定的训练集进行语意分析学习,并且可以通过语料的增多进行自我训练,不断提高对提问人话术意图理解的精准度,最终达到准确判断准确回答的效果。
2.4.1.3 检验标准
组织方给出一部分实际问答语料数据集(挑战:数据量并不大),并标注针对每条语料数据所代表的意图是什么,用以开发训练所用(语料样例如图 1)。
(图1)
对开发成果进行验收评估时,将用另一部分实际问答语料数据对开发成果进行测试验证,意图判定正确率高的为胜者。
2.4.1.4 奖金:暂不提供企业特别奖项,此赛题参与通用奖项评比。
2.4.1.5 企业介绍:
海智大数据是一家专注于企业开办智能化服务的公司,通过建立自学习的办事规则云引擎,为企业办事人和政府提供一网通办问答和智能审批服务,解决办事人无人可问和审批效率低的问题。目前公司的云服务平台已打通企业核名、工商办照、公安刻章、税务登记、社保登记、银行开户等多个企业开办场景,为天津、山东、厦门等地将近 1,000万市场主体和多个政府部门提供服务。
2.4.2 赛题 2:道路机作业路线优化
(图2)
2.4.2.1 问题的提出
洗路车,高压清洗车,洒水车,吸尘车,每天要作业网状分布的城市道路, 一般情况下,早晚各一班,如何安排最优的作业路线和时段安排(不必整条路一次从头作业到尾,还要考虑路的两边作业,还要考虑错开早晚上下班高峰时段,还要考虑加水点分布及加水的等候时间,还要考虑放脏水的地点分布和放脏水的时间,不同等级道路作业遍数要求不同),使得几十辆车中每辆车总作业时间、总作业路程最短,总油耗最少?
2.4.2.2 给定限定条件
洗路车、高压清洗车,洒水车,吸尘车等四种作业类型车辆各自的车辆数目 ,每辆车的吨位、洗路头/湿扫头/洒水头的作业量,各自负责的道路,空间地理坐标对,道路等级及要求的作业遍数,道路两侧车道数,道路单双向限行属性,道路特定属性(如某一侧因施工暂时不作业)早、晚上下班高峰时段加水点分布及加水的平均等候时间,放脏水的地点分布和放脏水的时间,不必整条路一次从头作业到尾,优化的作业路线可以打散冬天不能洒水作业,夏天不能干吸作业
2.4.2.3 路线优化方案
给出洗路车、高压清洗车,洒水车,吸尘车等四种作业类型车辆,每辆车各自的作业优化路线和时间点安排研究以车辆为主线,输出空驶、作业、加油、加水(东丽)、倒废水的轨迹,
加油、倒废水、油耗、水耗、费用的报表,生成一个新的报表,包含多个标签页,先以东丽为基础输出报表,有数据的完成了
2.4.2.4 实际作业的绩效考核
研究以车辆为主线,输出空驶、作业、加油、加水、倒废水的轨迹,加油、 倒废水、油耗、水耗、费用的报表,生成一个新的报表,包含多个标签页,研究以车辆计划安排为主线(Excel 6个标签页,导入,一辆车若干行,空行隔开),输出计划与空驶路,作业路的对比(左边计划路,右边实际作业路)输出空驶路(时间排序)、作业路(时间排序)、加油、加水、倒废水、油耗、水耗费用的报表,输出与计划不符的报表或报警,
2.4.3 赛题 3:垃圾收运作业路线优化
2.4.3.1 问题的提出
(图3)
垃圾收运按车回放,显示计划作业线路和实际作业线路,及垃圾桶点位计划作业时间和实际作业时间
(图4)
垃圾收运作业按车回放,显示实际作业线路、到达时间、该点位收运作业时长餐厨垃圾车,其余垃圾车,有害垃圾车车,可回收垃圾车,每天要收运作业网状分布的城市垃圾点位,一般情况下,一天一班,但人员繁华密集地区一天收运多次。如何安排最优的作业路线和时段安排(不必顺整条路或整个小区一次从头作业到尾,还要考虑垃圾桶溢满,还要考虑错开早晚上下班高峰时段,还要考虑垃
圾中转站或垃圾处理厂位置及倒垃圾的等候时间,考虑垃圾车吨位,不同繁华密集地区垃圾桶收运作业遍数要求不同),使得每种类型垃圾收运的几十辆车中,每辆车总作业时间、总作业路程最短,总油耗最少?
2.4.3.2 给定限定条件
餐厨垃圾车,小区其余垃圾车,有害垃圾车,可回收垃圾车、中转站直运车等五种作业类型车辆各自的车辆数目 ,每辆车的吨位、车辆收运垃圾桶的方式(挤压直运处理厂还是送中转站?),各自负责的小区/餐饮单位,垃圾点空间地理坐标对,垃圾桶繁华密集等级及要求的作业遍数,垃圾桶特定属性(如因特殊情况暂时不作业)城市道路和小区内道路,及坐标对,城市道路单双向限行属性,早、晚上下班高峰时段中转站分布及地磅称重倒垃圾的平均等候时间处理厂的地点分布和地磅称重倒倒垃圾的平均等候时间中转站直运车,哪辆车直运到哪个处理厂餐厨单位餐厨垃圾收运车,哪辆车收运哪些区的哪些餐饮单位,运输到哪个处理厂垃圾桶溢满实时动态状态不必整条路一次从头收运作业到尾,优化的作业路线可以打散
2.4.3.3 路线优化方案
给出餐厨垃圾车,小区其余垃圾车,有害垃圾车车,可回收垃圾车、中转站直运车等五种作业类型,每辆车各自的作业优化路线和时间点安排餐厨单位餐厨垃圾收运车,一辆车收运跨区的餐厨垃圾点位时,哪辆车收运哪些区的哪些餐饮单位,作业优化路线和时间点安排
2.4.3.4 实际作业的绩效考核
研究以车辆为主线,输出空驶、作业、加油、加水、倒垃圾的轨迹,加油、 倒垃圾、油耗、水耗、费用的报表,生成一个新的报表,包含多个标签页,研究以车辆计划安排为主线(Excel 6个标签页,导入,一辆车若干行,空行隔开),输出计划与空驶路,作业路的对比(左边计划路,右边实际作业路)输出空驶路(时间排序)、作业路(时间排序)、加油、加水、倒垃圾、油耗费用的报表,输出与计划不符的报表或报警,
注:赛题 2-赛题 3出题单位:天津联合远航信息技术有限公司
奖项及奖金:暂不提供企业特别奖项,此赛题参与通用奖项评比。
企业介绍:天津联合远航信息技术有限公司,成立于 2006,位于天津市滨海高新区核心区,主营产品是智慧环卫平台,是一家以 LBS大数据技术为核心,融合 GIS、北斗定位和 4G、RFID/蓝牙、视频、自动称重等物联网技术,集硬件设备/软件平台、运营服务以及第三方监测服务为一体的连续八年国家级高新技术企业。是天津全市智慧环卫平台的开发与运营服务商,该平台接入全市环卫作业车3000+辆,是中国规模最大的市级智慧环卫平台之一。