我在之前的博客 中提到了「百万 AI 」这个想法,我想进一步阐释一下。
畅想与必要性 #
最近看罗辑思维公众号一篇卖课文章 ,在推广「AI 学习圈」。主要是讲如何使用 AI,比如用 AI 做 PPT、海报、图表,用它写代码,用它学习外语和制作音视频。这篇文章里面有一句话:
为什么叫 AI 学习圈,而不叫 AI 课程呢?你看,AI 是个新工具,你很难找一个确定的老师,讲解所有的技巧。
这篇文章有传播焦虑的嫌疑,我的一个问号是:这东西真的需要学吗?有啥技术门槛吗?这种课程说白了,不就是 ChatGPT 功能讲解吗?
另外,我也看到一个问题,它提到,很难找到一个固定的老师讲解所有的技巧。确实,我没有看到有人从零开始讲解人工智能。
我目前看到的一个现状:对于绝大多数人来说,AI 和他们的关系是「工具与使用者」,而非「造物与创造者」。目前,第二种关系仅局限于做 AI 科研的人,比如那些在 NeurIPS、ICML、CVPR 上发表论文的研究者。研究 AI 影响的科研工作者属于第一类,因为他们并没有参与改进算法,而是专注于算法的社会影响和效应。
对于国内就 AI 影响大谈特谈的人和文章,一方面我认同他们未雨绸缪的前瞻,但另一方面,我看不出来有什么干货,纯粹在通过贩卖焦虑来收智商税。
除了上面说的两种与 AI 的关系,还有另外一种:
知识与学习者。
这里面分为两种。一种是科普,另一种是教育。前者如 李开复梳理人工智能 ,后者如吴恩达的机器学习课程。
后一种是我想贡献的领域,但是目标群体不同。
我先说一下我的目标:帮助一百万普通中国人彻底掌握 AI。
这个目标需要有一个清晰的定义。首先,什么是「普通中国人」?我的定义是:
- 已完成九年义务教育,也就是初中毕业。
- 如果经历过大学教育,下面的两个要求至少满足一条:
- 大学所学专业非理工科。
- 不知道
$\int$
是什么意义也不知道$[1,2,3]\cdot [4,5,6]^\text{T}$
怎么算。
不符合上面条件的群体可以从我的畅想中受益,但并不是我想要帮助的主体。
那什么是彻底掌握 AI?我的一个标准:
可以从零开始训练出 GPT-2 并自己制作一个如同 ChatGPT 的网站。从零开始意味着你需要从自己爬取训练数据开始。要做到这一点,你需要拥有的技能包括但不限于微积分、线性代数、概率与贝叶斯统计、编程基础、数据科学、机器学习、深度学习、强化学习 (RLHF)、自然语言处理、分布式计算、高性能计算、前端开发、数据库管理、API 开发、网络安全、 Docker、Kubernetes、云部署、系统开发与运维。
也就是说,我的目标是帮助一百万最低只有初中毕业、看不懂 $\int$
的文科生掌握上面的技能。当然,AI 技术日新月异,「彻底掌握 AI」的标准之后大概率会变。
这个工作有没有必要?我从两方面分析。
第一,我相信 AI 对人类的影响是巨大的,我们目前处在变革的前夜。但我不满足于单纯教人们怎么用 ChatGPT 做 PPT(因为我不觉得这需要教)以及向他们科普 AI 的原理。这种属于非常浅的层面。这些知识你懂得再多大概率也只是 AI 变革大潮中被裹卷的那一批,而非波浪制造者。
第二,我在学习的过程中看到目前的教程有很多问题:
-
门槛高。不管是吴恩达的机器学习课程还是李沐领衔撰写的《动手学深度学习 》都不是我的目标群体可以看懂的。
-
看似有系统,其实没系统。比如 Coursera 以及 CS 自学指南 。我说它们看似有系统是因为里面的知识很全。但它们只是把一堆知识放在了一起,一个初中毕业的文科生根本不知道怎么开始。另外,它们太过于全面以至于更像是一本大辞典,而非一张地图。
-
不说人话、避重就轻、逻辑跳跃。这些在我学习统计学的时候感受很深。根本上来说,太多的教程最后只是把结论告诉我,而不是一步步让我知道这些东西是怎么被创造出来的以及一开始为什么要创造它们。
接下来的问题是,有必要让文科生学会 AI 吗?以及他们真的能学会吗?
关于第二点,我可以十分肯定地说,能。我坚信任何一个完成九年义务教育的中国人都完全有能力在两到三年内达到我上面定义的「彻底掌握」标准。这也是百万 AI 的使命。
那为什么百万 AI 的目标群体是一帮最低只有初中学历文科生?有必要费那么大劲让他们掌握 AI 吗?
我个人认为是有必要的,原因如下:
-
AI 人才储备事关国家未来。想要让 AI 成为中国的发展引擎,大多数人只是知道怎么用 ChatGPT 做 PPT 和海报,以及知道简单的 AI 科普知识,是远远不够的。
-
在 AI 时代机遇面前的机会不均等。如果 AI 的发展会像互联网浪潮一般带来一批高收入就业岗位,那最有可能拿到入场券的是大家公认的「聪明人」,也就是学历高的理工科毕业生。我的目标是把这些机遇分流一部分给自己都不相信可以学会 AI 的人。
-
提升创新力。如果彻底懂 AI 的人只有高学历的理工科毕业生,AI 的效用会比较低。最理想的方式是各行各业的人都有彻底弄懂 AI 的人。
-
挖掘个人潜能。很多人的潜能是被低估的,等待着被唤醒。
计划与步骤 #
教程 #
百万 AI 是一项长期的事业,我不打算也无法短期完成。在达到我自己定义的财务自由之前,我只会把它当成我的业余爱好,而非全职工作。
我目前做的是把我觉得覆盖范围比较大的内容,比如统计学以及基础的机器学习算法,写成低门槛、不逻辑跳跃的教程。也就是一边记录我的学习路径,一边把我嚼碎的知识串起来。这部分没有一个很强的系统性,但会成为我下一步计划的基础。
等我可以自己从零开始达到我定义的「彻底掌握 AI」的标准,我会通过反推的方法,推演出一个初中毕业的普通人想要一步步达到我目前的位置,需要哪些知识。我觉得这种方法的好处是,以目标为导向,只教给学生他们为了达成目标最需要用到的知识,而不是把厚厚的、根本不说人话的线性代数、微积分教材扔给他们,说看完才能进行下一步。那么做纯粹是耍流氓和偷懒。
这些知识路径我计划用纯文本作为载体,除非必要,不用视频。我的想法是我写首稿,如果运气好的话,「百万 AI」有了人气,那么大家可以修改我草稿里的错误以及提议更好的讲解方法。我的目标是这些内容成为中国 AI 教育事业中的基础设施,大家可以免费阅览,提交自己的贡献。
我也会成立一个 AI 学习社区,百万 AI 的学习者可以在里面互相提问和回答问题。每个人也可以发布自己的教程,可以选择作为百万 AI 现有教程的「版本二」,也可以单独放在这个社区以及自己的博客上。
我计划把每一篇博客翻译成 18 种语言,争取覆盖全球 75% 的人口。但这也带来一个难点:如果文章更新很快,一个英语读者对英译版提交的修改意见在中文版更新后就被覆盖掉了。当然,这个烦恼我暂时不用考虑。
我不计划对这些内容收费,但是我会对自己写的算法和系统收费:
-
我会把每篇教程的知识依赖写清楚,可以想象成每篇教程有一个知识结构树。这样一来,学习者可以清楚看出目前所学需要依赖之前的那些知识,如果不清楚,可以快速点进去复习。
-
我会写一套推荐算法,根据每个学习者不同的基础以及学习目标,给出最适合他们的学习路径以及每天的学习计划。
-
很多知识如果学完了不练习,最后会发现这些知识是死的。这就像算法如果不去练习,最后发现依然不会用。我会建一个像 Leetcode 一样、专属 AI 的练习系统。
-
在练习系统的基础上,我考虑做一套考试系统,用以检验学习者是否达到了最终的学习目标。这个考试我计划是考一整天。通过这个考试需要达到的水平大概是在不考虑英语水平的情况下,经过两年的科研培训后有机会被美国的计算机博士项目录取。
初步估算,如果订阅人数超过 10000 人,我就可以把它当成我的全职事业来做,甚至可以扩大公司规模。
咨询 #
教育是第一步,产业化是第二步。
我目前推测,百万 AI 的受众群体大概率是完成大学或大专教育的文科生,也包括一些理工科学生,也会有一些已经工作的学员。相对于科班出身的计算机学生,他们的优势是有一些专业背景,比如会计、教育、法律、人力资源、保险、金融、交通、医疗等等。我的想法是招募通过百万 AI 考试的学员,共同成立一家 AI 咨询公司。我不打算采用老板与雇佣者的关系。我想象的是合伙人关系。
创业扶持 #
如果咨询事业可以成功,我的下一步计划是创业投资,类似于李开复博士的创新工场。区别是,前期我只计划扶持百万 AI 的目标群体中通过考试的人。当然,我能扶持的额度取决于咨询公司是否可以做大做强。
困难分析 #
我目前能想到的困难:
-
学习者放弃率很高。最坏的结果是大部分人三分钟热度或者在生活中有别的压力,最后放弃学习。我能想到的解决办法是,尽最大可能把每一篇教程写得清晰易懂,在最开始的时候把学习路径说清楚。如果咨询公司事业可以做好,那合伙人的工资会很高。如果 AI 变革发生,高薪机会也会增加。在这种现实驱动下,有望放弃率会降低。
-
有人提前作出类似的产品与服务。我对此是热烈欢迎的,我目前把这一计划公开也就不怕有人「替」我提前把这一目标实现。如果此事真的发生,虽然我的人生少了一个动力,但也说明这不是我人生的使命,我会转向别的领域。
-
学习者通过百万 AI 的测评后,无法得到其他公司的认可,无法找到 AI 领域的工作。这是一个很现实的困难,我能想到的几点应对方法:1)咨询事业如果成功,那变相可以说明通过百万 AI 培训与测试的人,有真才实学;2)成立小型的科研团队,只发最基本的生活工资,专门留给那些希望通过两到三年的科研积累,进一步深造的人。这样一来可以给通过测试的学习者多一条出路,二来也可以增加百万 AI 的名气。3)成立一家 AI 媒体,有点类似现在的「机器之心」,专门解读 AI 领域最新的科研进展,这也会增加百万 AI 的曝光度。
最后一次修改于 2024-12-23