LLM的一大难点在于数据,而数据是人产生,真的人产生的。哪怕是水水的豆腐块文章,一个 snippet 级别的代码记录,都是人产生的。只要是人产生的东西,都诞生于某种语境下。我喜欢说语境,别人喜欢说场景,是一回事。语境之中,隐藏的暗信息是需求。
“我有一个问题”,而产生这个问题的背景就是人类需求。“你有一个答案”,而答案的回答是人类创造力的结果,无论创造力的高低。不管别的访客如何 ctrl-c ctrl-v,我们至少有一个人在进行创造性活动。
创造性活动很多时候缺少激励,特别是物质激励。thumbsup 点赞、vv 视频流量量 等等这样的精神激励在不转化为商业价值之前,都是创造者所的不多的慰藉--其他真实人类的赞同。分享欲,而非占有欲,是人性中极为难得的品质。创造力,而非破坏力,是人这个造物对造物的反抗。
哪怕世道险恶,分享者毫无利得,我们总是能找到乐于分享的人。最低限度地说,我们可以通过实物补偿来获得他人的输出。
在未来的 LLM 之下,这种人际关系可能会被打破。
Machine knows all。如果 Machine 不知道,我们如何去知道呢?StackOverFlow 的流量下降,那么在上面回答的人会不断减少,有价值的东西会越来越少。这是源头的衰退。
推荐引擎已经让搜索引擎的质量不断下降了,LLM 加持的搜索将很快跨过一个零界点:我们愿意直接采用LLM给出的结果,而不会再去评估搜索结果、整合搜索结果、现成自己的搜索结论。够用就好是人的本性使然,如果机器做得比我更好,我为何不雇佣它呢?我只需要做“高级”的规划思考,将“重复性劳动”自动化或者外包出去,这不是很符合经济理论吗?这是end-user的衰退。
如果网络上的生产者减少,虚假的生产者增多(llm based bots),有识别能力的消费者减少,网络环境会不断恶化。GIGO 将开始大显神威。算法可以被要求不断提升优质内容的权重,但是算法可能不太能认识优质内容。当垃圾成为主流,正常反而显得异常。人力可能无法再维持 Machine 的水平,使之按照黄金时代的要求来给出回答。因为Machine知道“网上都是这样说的”,trainer也基本都是这样说的,为什么你们几个人的理解的权重要更高呢?这是机制的衰退。
当一个混动系统的某个动力源呈现衰退之相,另外一个动力源又“够用”的时候,前者会加速衰退而被清出市场。希望这是一种误判,希望这一天晚点到来。