群体学习论
公理1:群体知识由个体学习结果提炼产生
公理2:个体更容易获得有更多个体经验的群体知识
公理3: 群体的知识空间是有限可数的
群体学习方法:
这个问题很有意思,让我们来捋一捋。
现象:对一个问题,看似比主流方案更优的解决方案却不一定有更大的用户群体。
群体反馈:“没有需求”,“你的方案不方便,学习成本过高”,“不够通用”,“我觉得现有方案就蛮好”,“哪那么多事,能用就好了”。
分析:
我们可以从这个角度来看,假设群体学习是这么一个过程:每个单独个体都基于自身的样本空间学习探索,虽然有些人的样本空间里探索不到方案,但总有些人会有机会探索到新的解决方案极值点(很难说是最值点),然后群体最终会从所有个体探索方案极值点中选取最小的作为群体用户解决方案。如果群体学习真的一直是这个过程的话,那么群体将总能不断找到解决方案的新的局部最优化点,对一个问题大家往往都会选择当前更佳的那种解决方案。但事实上会存在两个局限,
首先是评价标准有很大的主观问题,即我不承认你那里极值点比我低。什么是更好?什么是最好?每个人的标准不一样,每个人的需求也不一样。你这个方案对你的需求是最好,可能对我的也就一般。
第二个局限性是由于学习成本和用户惯性的存在,很容易造成群体方案的心甘情愿过拟合,虽然我承认你极值点更低,但我就在这里不出来了,我挪过去好累啊,就在这里就蛮好。
这两个局限性导致了群体性分布式学习很难学习到一个共同的最优解,只能存在一个主流的极值解。这就导致了解决同一个问题可以有不同的方法,但很难说谁是最好的。所以用户在对同一种问题的不同解决方案选择上我认为大体上可以分为三类群体,A群体,B群体和C群体。
A群体用户数量最庞大,他们一般承认自己不是最优的解决方案,但根据局限1和局限2,拒绝迁移。
B群体和C群体的数量可能相当也可能不相当,但是它们互相不承认对方更优,但是都公认自身比A群体更优。
随着时间发展,B群体或C群体完全可能成为新的A群体,但是保不准随着技术的不断前进,又会出现新的B群体和C群体,这样周而复始的也是非常的有意思。
用户需求、用户惯性、学习成本
用户需求是需要培养的,没培养的时候用户更趋向于改变自己的需求去适应自身现有知识和技术,之后慢慢就形成了用户惯性。
个体用户对同一问题的求解过程可以看成如下过程:
- A事件:个体从现有知识样本空间探索查找解决方案,如果存在则查找结束。
- B事件:个体从现有知识样本空间找不到方案,查看群体知识样本空间中是否有学习成本较低的方案,如果有,学习之,如果没有,则转C事件
- C事件:看看这个需求是否非常重要,如果不是很重要,就直接放弃,否则转D事件
- D事件:探索群体知识样本空间中学习成本高的方案是否满足要求,是则该项知识
学习成本、用户惯性两者相辅相成:
1.学习成本促成了用户惯性,不存在学习成本也就很难有用户惯性。
不同用户由于背景知识的不同而对于同一种事物的学习成本不同,但用户往往会先从自身的低学习成本样本空间中探索方案来解决需求,一旦探索到某种方案能解决自身需求,则停止学习、存档,形成针对该问题的一个固定解决方案,也就是个体用户惯性。多个个体用户惯性会融合成群体用户惯性。
2.用户惯性又能反作用于学习成本,使新用户对该群体方案的学习成本更低,从而使该方案的群体增长。
一方面,受到每个人知识积累的不同,不是所有个体都能在自身的低学习成本空间中探索到解决方案,这时就需要学习,学会以后这个知识的学习成本对于该个体来说就降低了,也就是学会新知识相当于扩展了自身的低成本学习空间。
另一方面,即使个体的知识样本空间中理论上存在更优的解决方案,但是新的探索个体却需要付出更多的探索时间,这种自发探索也是一种学习,从其他任务知识中迁移学习到这个任务,但是这个过程的学习成本往往比直接使用成熟主流的群体解决方案来的高。除非成熟方案已经满足不了这部分个体的需求,否则这部分个体也不会选择继续探索新方案。