淡马锡领投TOP TOY 投后估值约100亿港元专家已经证实
蔚来-SW早盘大涨逾10% 全新ES8正式开启预售
阿里发布Agentic Coding平台Qoder,可实现AI自主研发是真的?
李宁2025中期业绩发布:收入148.2亿元,同比上升3.3%是真的吗?
“中介巨头”变局:我爱我家上亿股权法拍,实控人谢勇缺钱?反转来了
创新药到加仓时点了吗?太强大了
长江有色:美欧制造业复苏支撑金属市场 22日铜价或上涨
赚了指数不赚钱?这些股票策略私募产品年内仍亏损后续来了
伟创力证实乌克兰工厂遭导弹袭击 有人员受伤学习了
普来仕:料9月美联储减息25基点 全年累计减息50基点最新进展
硅谷巨头强强联手!谷歌与Meta达成100亿美元云计算合同实时报道
阿里灵犀互娱汇报线从大文娱转向集团?虎鲸文娱暂无回应后续反转来了
伟创力证实乌克兰工厂遭导弹袭击 有人员受伤最新报道
名创优品集团Q2经调整净利润6.9亿元,美国市场营收同比增长超80%
李斌:有ES8一代车主,两个月前买了第二代,昨天看完发布会决定再买一台第三代
硅谷巨头强强联手!谷歌与Meta达成100亿美元云计算合同记者时时跟进
生物谷2025年上半年亏损2835万元学习了
31股二季度获社保基金扎堆持有官方处理结果
央行今日开展3612亿元7天期逆回购操作
数据泄露!黑客窃取安联人寿110万客户信息
小鹏汽车涨超12% 何小鹏斥资约2.5亿港元增持股份
高股息+高成长,半年报预期催化下首程控股慢牛逻辑渐入佳境是真的吗?
稀土永磁概念震荡走强 三川智慧20cm涨停
李宁上半年收入同比上升3.3%至148.17亿元 净利达17.37亿元
港股半导体板块走强 华虹半导体涨超5%反转来了
光大期货:8月22日软商品日报专家已经证实
B站、快手二季度业绩双双超预期! 重仓龙头, 港股互联网ETF(513770)前10大成份股权重超70%
生物谷2025年上半年亏损2835万元
顺网科技上半年净利润增近7成 积极布局算力、AI等新兴领域后续反转
港股部分新能源汽车概念高开 小鹏汽车涨9%
悟喜生活将于8月22日上午起短暂停牌后续来了
31股二季度获社保基金扎堆持有
B站Q2调整后净利润5.6亿元创新高,陈睿:AI正放大B站的优质内容优势
张丹红婚后首秀恩爱,向李国庆表白:将用余生回报你、爱你
沃顿科技2025年上半年营收8.8亿元 膜产业链协同发展
光大期货:8月22日能源化工日报
视频教程三:基金从业人员资格注册信息及投资者查询从业人员信息指南
用AI炒股的年轻人,赚到钱了吗?太强大了
加速“打钱”!刚刚,市场彻底爆发!实垂了
东方甄选前CEO孙东旭将离职?知情人士:只是休假
用AI炒股的年轻人,赚到钱了吗?最新进展
龙国农业银行原首席专家兼深圳市分行原党委书记、行长许锡龙被开除党籍又一个里程碑
金力泰陷入资金占用争议,受损投资者如何挽损?
走进办公室,美国投资巨头合伙人惊讶:都在用龙国AI?官方已经证实
李大霄:坐轿比抬轿爽后续反转
超80亿元担保事项未及时披露,南京新百三任董事长齐遭处罚
走进办公室,美国投资巨头合伙人惊讶:都在用龙国AI?
杨德龙:大盘站上3800点 牛市愈演愈烈
收评:四大股指期货涨超2% 碳酸锂跌超4%官方处理结果
罕见一幕,芯片ETF涨停后续反转来了
硅谷又一个“活久见”:马斯克竟曾邀请扎克伯格参与收购OpenAI官方通报
文/青果灵动公司AlphaGame组 马恒 研究目的:游戏玩家分两类:付费玩家和免费玩家,他们在游戏内的行为上存在一定差异。本研究针对一款成功手机网游《狂暴之翼》,使用支持向量机(SVM)训练了一个分类器,能自动识别一个玩家属于付费玩家的概率。本研究使用的数据是该手游的埋点数据,采用了4个显著特征作为输入维度。最终分类正确率达到81%。 分类器的应用:应用本分类器,可以识别游戏开服后具有潜在付费倾向的免费玩家,项目组有针对性地对这些玩家进行个性化服务(例如打折,特殊活动等),促进免费玩家向付费玩家的转变,从而提升游戏付费率和总体收益。对于有付费倾向但暂时没有付费的玩家,我们做两点假设: 1、他对这款游戏感兴趣,以至于产生了付费玩家的特征。 2、游戏中的商品(钻石,月卡等)价格高于他的心里预期。 在这个假设基础上,我们对这个玩家进行商品打折,或是低价销售,可以有效地促进破冰(玩家进行第一笔消费)。 一、玩家特征提取 我们从《狂暴之翼》埋点数据中,选取4个统计特征对玩家数据进行数据挖掘,然后训练分类器。这4个特征数据如下: a、玩家开服当天到达的最高等级; b、玩家的总点击次数; c、玩家点击游戏按键的频率; d、玩家开服当天游戏的总时间。

玩家特征数据示意图
对开服当天付费玩家和同样数量的非付费玩家进行上述数据统计,加一维付费/非付费标签属性,付费玩家标记为1,非付费玩家标记为0。 选取这四维属性的原因如下: 假设一个玩家付费,那么玩家等级在第一天应该会达到一个比较高的级别,同时他的在线时间也会较长;点击次数代表一个玩家的疲劳值,点击次数多,玩游戏越易产生疲劳,说明玩家对游戏的喜欢,更有可能成为付费玩家;点击频率太快,说明对游戏没认真的体验,点击频率太慢,说明挂机时间长,付费玩家的点击频率应该在一个合理的值附近波动。 在处理过程中,我们还有一个假设:玩家所在的地域影响玩家付费意愿和付费能力。考虑到人均收入越高的地区,付费玩家应该会越多,我们根据玩家的登录ip获取玩家的地区,根据2015年31个省的人均收入,对玩家进行了偏序度量,划分为了6个等级,如北京、上海、江苏省的度量为6,西藏,青海等省度量为1。按此方式为每个玩家增加了一维地区属性。 二、分类模型训练 我们定义的四个维度,都是连续的数值属性,并假设我们的玩家数据是线性可分的,所以我们选取了SVM(支持向量机)进行模型训练。 支持向量机,因其英文名为support vector machine,一般简称SVM,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略是通过间隔最大化,最终转化为一个凸二次规划问题的求解。 具体过程如下:随机选取了《狂暴之翼》三十个服的埋点数据,每个服随机选取与付费玩家等量的非付费玩家。然后利用SVM进行模型训练,最后得到一个玩家付费与非付费的分类器。由于每个服的数据量不同,为了保证数据不受服务器的影响,统计好玩家的特征之后,把玩家特征数据合并之后,再随机打乱分成2等份。其中,一份数据用做训练,另一份数据用来测试,测试分类器的准确度。 三、结果分析 分类器的量化评价标准是分类准确度,其定义如下:

其中,A表示被分类器正确分类的玩家数,B表示被分类器错误分类的玩家数,A与B的和,表示玩家总数。 从实际意义上来讲,80%准确度表示,对100个游戏玩家进行付费和非付费判断,分类器会把其中80个玩家正确的分为是否付费玩家,把20个玩家错误的分类。当分类器把一个玩家分到付费玩家中,说明这个玩家的特征符合付费玩家的特征,相比于其他非付费玩家更有可能通过我们的努力(促销,激励),转化为付费玩家。 图1为训练数据中不包含玩家地区属性,训练出的分类器对应的分类正确度。图2为训练数据中包含玩家地区属性,训练出的分类器对应的分类正确度。横坐标表示训练的数据量的大小,从5到30分别表示用了几个服的数据。纵坐标表示进行100次试验的准确度平均值。可以看出随着训练数据量的增大,模型的准确度会逐渐提高,然后稳定下来。同时测试的准确度也随着训练数据量的增大,逐渐提升,最后稳定在0.81附近。 在测试中我们发现:玩家的地区属性对分类器基本没影响。分析原因:付费玩家与非付费玩家在地区分布上的差异度很小。图3为付费玩家与非付费玩家的地区分布图,0代表非付费玩家,1代表付费玩家。随机选取与付费玩家等量的非付费玩家数。由于是随机选取,样本在一定程度上是可以代表整体的。从图中可以看出在样本中,虽然发达地区,付费玩家远多于欠发达地区,但是非付费玩家的地区分布与付费玩家地区分布基本相同,导致地域属性在分类中无显著区分能力。

图1训练数据中没有地区属性的分类器准确度变化曲线

图2训练数据中加入地区属性的分类器准确度变化曲线

图3付费玩家与非付费玩家的地区分布图
总结 本次研究得到的分类器的预测准确度有待提高。研究中,刻画玩家的维度较少,提取的某些特征区分付费与非付费玩家的作用有限。我们下一步工作有两点,一是对分类器进行一些应用,二是增加玩家的特征属性,发现更有价值的特征。 差异化服务一直以来都是商业竞争的核心,游戏业也如此。本文采用机器学习手段实现的用户分类器,可以使我们发现不同用户的需求,方便我们提供差异化的服务,从而提高产品盈利能力。
