学习平台的激励机制调研

https://www.zhihu.com/question/348467159/answer/861269757 #

重复是个负反馈 多样的新刺激是好的正反馈 奖励的变数越大,大脑分泌的多巴胺就越丰富。参见昨天的deep mind 研究结果。预测的不确定性越大,错误的征兆出现后,会有更高浓度的多巴胺分泌。人会因此进入一种专注状态,大脑中负责理性与判断力的部分被抑制,而负责需要与欲望的部分被激活。 4、我们应该用游戏的方式去看待学习(1)让每次学习都有新的东西吸引你;(2)让学习从易到难,把大目标分解成可执行的小目标;(3)每次学习小目标的达成给予“多变的酬赏”奖励自己;(4)减少比较对象、比较范围,增强成就感、获得感的正反馈;虽然我想说不要和别人比较,和自己比较才是唯一有效的。(5)把学习和实践相结合,实践的成果才是学习最大的奖赏。从某种意义上来说,生命就是学习的产物,学习就是我们的本能。如果你不爱学习,那么不是大脑的错,而是你学习的模型出了问题。

作者:混到大叔 链接:https://www.zhihu.com/question/348467159/answer/861269757 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

2021-09-12 08:40:44 星期日 #

这类研究有非常重要的意义。有一天,它可以用来实时评估人的学习状态,在充分了解我们自身的情况下,引导和辅助我们 A distributional code for value in dopamin-based reinforcement learning 如何理解DeepMind的新研究:多巴胺驱动大脑的分布强化学习? 生物,AI,心理:目前的大脑/认知/意识/AGI/DRL模型

游戏PBL激励机制—如何驱动群体完成指定目标 这种机制能P,就是points,点数;B,就是Badge,徽章;L就是Leaderboard,排行榜。

超级好文 GDC 2017:Epic Games 的 Ben Lewis-Evans 谈玩家心理和奖励 #

Dopamine是神经递质,用来集中玩家的注意力;本身并不带来快乐,但能在反馈学习过程中参与行为的塑造过程。游戏设计界其实现在和心理学存在脱节的倾向,因此很多人会尝试把心理学意义上的“快乐”转化为一个化学物质的指标来简化问题。但实际上大脑里的产生快乐过程远比一个化学物质的分泌水平复杂得多。 许多游戏都是从设定长期目标开始的。不幸的是,当被要求长时间坚持时,人类往往会动摇。通过留下短期奖励的面包屑痕迹,玩家不太可能在获得长期奖励的道路上分心或沮丧。

“进度条或经验条是典型的例子:少量的反馈和奖励让你知道你正在朝着更大的[目标]取得进展,”刘易斯-埃文斯说。

控制狂 玩家希望始终处于控制之中。如果不是,他们往往会表现出来。为了进步而被迫磨练的玩家可能会停止游戏。即便如此,精明的开发人员可以通过鼓励玩家反抗来利用玩家的控制欲来创造有趣的游戏场景。

“一个典型的例子是斯坦利寓言,这是一个关于叙述者试图控制你,以及你试图打破控制的游戏,”刘易斯-埃文斯解释说。“这样做感觉非常令人满意,即使你最终失败了。”

在一开始就建立控制权对确定玩家是否继续前进有很长的路要走。很多时候,开发人员在信息太少方面犯错——认为聪明的玩家更喜欢自己解决问题——或者一次性用信息轰炸他们。

“感到失控的真正重要方式之一就是感到困惑,”刘易斯-埃文斯说。“[一个优势] 有一点点的手握,在教程中的一点点指导,是它让玩家到达一个他们可以控制的程度。你告诉他们做什么,然后他们有控制权和展示这种控制权。这是 Unreal Tournament 中可选技能标记的好处之一:它们是玩家可以收集以显示其精通程度的可选东西。”

意外的奖励让玩家陷入循环,但这是一种很好的方式。“一个例子是在像传送门 2 这样的游戏中,你出人意料地想出了解决难题的方法,”刘易斯-埃文斯说。“这是非常令人满意的。这不是你一定看到的东西,感觉很好。” 他指出,意外奖励的高频率会削弱玩家收到奖励时的兴奋感。他们开始期待意外。

奖励从根本上说是反馈,很多反馈都可以成为奖励。”

损失厌恶是最难调和的认知偏见之一。实际上,这种偏见表明玩家会更努力地坚持自己所拥有的东西,而不是为了赚取他们可能得到的东西。

间隔的精确时间鼓励玩家不断回来寻找机会杀死敌人并清除他们的战利品。

固定比率的缺点是,如果玩家在获得另一个奖励之前必须等待太长时间,他们很容易停止执行任务。Lewis-Evans 解释说,诀窍是构建一个游戏,让玩家可以同时拥有许多固定比例,例如在不同建造阶段的多个建筑物。当一座建筑物完工时,另一座建筑物可能只需要再转一三个圈。

社会化压力 要么强化自我认同,要么加入大流

玩游戏,就是要赢!从王者荣耀学激励机制设计 1、开启激励,先设置一个小目标 激励必须总是有办法可以做到 2、激励反馈及时最重要 3、激励人内心的求胜欲 4、荣誉激励机制是内驱力 比如:根据你的成就设置不同的荣誉称号和徽章;单个英雄的胜率引来一片666;每个赛季的段位排名,总胜率排名,近20场、100场游戏的胜率排名等。 单个英雄战力的排名,在国服、省服甚至小区进行排名,看着自己的本命英雄战力排名前列,是不是颇有成就感? 看着自己挂着王者段位的头衔,或省服的标志性徽章,是不是感觉美滋滋? 5、激励的最高境界是上瘾 提醒一下大家:农药虽好玩,但确实有毒

塞思•普瑞巴什:现实和虚拟世界中的游戏机制

第一、约定机制:为了成功完成游戏,用户需要在事先约定的时间和地点完成事先约定的任务。塞思提到,酒吧的“欢乐时光”其实就运用了这一机制,鼓励人们再次消费。Facebook上的农场游戏Farmville也是这一机制的拥趸,用户们不得不赶着钟点为他们的作物浇水。当然,也有公司利用这一机制为客户造福。一间名为Vitality的公司发明了一项产品,利用email、flash和其他许多新鲜有趣的方法,提醒人们按时吃药。

第二、身份与影响力:用户通过社会压力影响其他用户行为的能力。现实社会中,人们都向往白金或黑金信用卡,因为那是身份的象征。在游戏中,用户也想要不断升级已显示自己的能力。塞斯认为,学校也可以利用这一机制提高学生学习的积极性。

第三、进度机制:通过将一项大任务分割成若干小任务而不断积累成果、达成目标的过程。 LinkedIn网站上的用户资料完整度便运用了这一机制。塞思还提到SCVNGR也通过这一机制设计了一款游戏,提高消费者忠诚度,为当地企业带来收入。

第四、社区机制:通过团队协作达成目标。Digg网站就是通过这一社区机制发现用户们最感兴趣的内容。同时,与激励机制结合,有趣的内容就会源源不断的冒出来。另一个例子来自麻省理工学院,他们将一些气球藏在美国的各个角落,鼓励人们通过网络寻找到这些气球。他们也利用了金字塔激励机制,第一个提出寻找地点建议的人可获得2000美元,而其他推荐这一建议的人也可获得部分奖金。结果,在12小时内,散落在各个角落的所有气球都被找到。

电脑游戏中激励大脑的七种方式 1, 用经验值条来度量进程。网络游戏中你会发现人物级别的经验值进度,人在不断肯定自我的过程中有更大的前进动力; 2, 把任务分割成可计量的短期和长期目标,玩家可以同时进行这些任务,并且和个人的获利挂钩,这是一个保持人们持续参与的常用方式; 3, 奖励成就,不惩罚失败。一个个小的奖励能最大化地满足人们的自尊心; 4, 及时的反馈。在网络游戏中当你完成一个任务、学习到一种新的技能时,你能马上去施展这项技能,这种反馈让人们更加确信奖励; 5, 不确定因素,或者叫惊喜,并有保证惊喜不会贬值的措施。极品装备的魅力就在此; 6, 合作,集体的归属感; 7, 充分的自由度。游戏玩家拥有更多的自由度,便可以爆发更大的力量。

2021-09-11 09:32:42 星期六