EP-037 Tinyfool:ChatGPT 会如何改变我们的生活?(文字版)
时间轴:
1:30 ChatGPT 到底是什么?它是一个聊天机器人吗
7:50 ChatGPT 可能会带来哪些新的商业模式
12:31 审查制度对 ChatGPT 会有影响吗
16:02 中文世界公开信息稀少对人工智能的影响
21:44 中国企业过于商业化对人工智能行业的影响
27:03 对中国类似 ChatGPT 产品的期待
30:20 培养技术公司需要什么样的行业环境
36:16 ChatGPT 会推动人类的产业革命吗
文字版全文:
袁莉:这周我们还是谈ChatGPT。为什么呢?因为这个技术可能改变我们的生活方式和工作方式。想一想浏览器、搜索引擎和苹果手机出现后对人类社会的改变。
我们今天请来了一位做技术的嘉宾:郝培强,网名叫Tinyfool。他2001年大学毕业后写了20多年程序,2009年和2011年分别创业做搜索和移动互联网。2020年GPT-3发布后,他开始研究OpenAI的API和产品。他在油管YouTube上的个人频道叫“Tinyfool的胡说八道”,最近做了好几期关于ChatGPT的节目,质量都挺高的,提出的问题也非常好,比如:为什么ChatGPT没有出现在中国?百度做的chatGPT能达到OpenAI的水平么?水平差是因为中文内容的质量差么?有兴趣的同学可以去看看。今天我们就从他节目中提出的一些问题开始问起。我应该怎么称呼你,是叫“小郝”呢,还是叫“Tinyfool”呢?
Tinyfool:叫我Tiny就行了。
袁莉:叫你Tiny…那好,Tiny,你好。
Tinyfool
[00:01:20]
你好你好。
袁莉:你能先给我们讲一下普及一下ChatGPT到底是什么。它只是一个聊天机器人吗?
Tinyfool
[00:01:28]
我可能会啰嗦,所以你随时(可以)打断我。就是,首先我一定会强调它不是一个聊天机器人。虽然可能90%的网民知道这个东西后,第一件事就是去做图灵测试,看我能不能成功地把它打败,看它是不是个机器人。但是我特别喜欢强调的,就是说它跟以往我们看到的小冰和其他的聊天机器人最大的区别就是它是能够工作的,它可以做非常多实际的任务,比方说它可以帮你做文章的润色,它甚至可以帮你生成代码,它可以给你改写一个东西,它有很多事情都可以做。它当然能抓取一些信息,你问他一些知识,比如谁是乔布斯、谁是比尔盖茨,它也可以告诉你,而后者讲的那个信息不见得准。
但是最近我特别爱讲它的具体原因是,因为我担心很多人会误解这个东西。因为这个东西非常革命性,我认为很多误解它的人会浪费一个机会,因为它带来了很多很多新的机会,但是我会看到可能有个也许70%、80%的人在想,这东西不就是个聊天机器人吗?所以我就想说,(这个场面就像)也许是汽车过来了,你觉得这个东西是骆驼来了。就在我这种人心目中,当然觉得很荒谬啊,但我不是为了嘲笑不懂技术的人,我想如果你这么去想的话,你可能会耽误一个非常大的机会,这是我的理解。
袁莉
[00:02:47]
你觉得这么这么激动人心的时刻,是吧,就是有人看不到。但是这个ChatGPT也不是一个搜索引擎,对不对?它和搜索引擎是一个什么样的关系呢?
Tinyfool
[00:02:57]
(这)也(是它)容易被误解的原因,是因为比方说我们知道Google存储了全球可能上亿的数据,具体的数量也许在几百亿、几千亿的数据,有这么多网页都在Google里存储了。ChatGPT我们去看它的文档,你也知道它里头可能有——我就记不清具体数字了——几百万亿的token(数据单位),你可以大概理解成(一个token就是)一个词,它也大概是可能有上亿的或者几百亿的这个文件在里面。但其实两者是完全不同的。
也有个很常见的误解,就是说Google和ChatGPT是不是一样的东西?今天我们看到Bing做了一个Bing chat对吧,它实际上是搜索和chat的结合,为什么是这样呢?就是我们知道这种超大规模的模型——而ChatGPT (还只)是large language model(大规模模型)——(对于)超大规模模型,它训练一次,哪怕你用全球最好的显卡、最好的服务器,用了无数的服务器,你可能还需要比如说半年、几个月这样的时间。
但是我们知道Google搜索,我们都用Google搜索对吧,哪怕我们用百度,我们也知道它其实每天都在更新,但是ChatGPT它不能做到每天都更新。这是因为这两者之间的技术是完全不同的。虽然我们可以理解成我们把同样的内容给它们,但它们处理完了以后得到的东西是完全不同的东西。一个叫索引,它的目标是尽快地获得信息;一个呢,我们把它叫做人工智能模型,这个模型其实最重要的是人怎么说话。其实ChatGPT已经是一个非常理解人说话模式的这么一个东西,同时包含了知识,但它的知识的存储方式不像搜索引擎那么非常清楚的、一条条的,甚至还包括一些乱的东西。就是这样的,所以它有时候可能结果是错的。
袁莉
[00:04:36]
那就接下来给我们稍微描述一下ChatGPT(代表的)即将到来的这个AI新时代是什么样子的?
Tinyfool
[00:04:42]
那我们先讲一个简单的问题,也就是说我认为搜索为什么很有价值,这个当然也是历史发展的一个过程。咱俩年纪可能……我不知道你是不是比我大一点点,就是在互联网刚出现的时候,咱们可能都在。一开始,我们以为互联网可能就是有几万个、几千个网站而已,对吧?这时我们知道哪个网站有名,我们就去看它而已。但到了某一天,在Google出现的那个时间点,基本上你已经不能、任何一个人没有能力去穷尽互联网上所有的网站了,你没有能力知道它有什么,而这个时候互联网已经变得非常之丰富,什么都有。那么技术上如果没有Google这样一个产品,实际上互联网对我们来说是不可用的,对吧。那么这个我觉得是搜索这个时代(的意义)。
但是呢,搜索其实解决不了一些问题。就是我有很多疑问,而Google只会把这些疑问中间的关健词提出来,帮我找到一些答案。但是这些答案怎么整合,怎么分析,这件事Google其实做不了。那正是我们今天看到有这么多人,可能是痴迷地去玩儿ChatGPT(的原因)。我不知道那个数据是不是准确,就是说ChatGPT已经有1亿的日活,但是我们今天看到它的热度(确实很高),这说明什么,说明这个交互模式它非常自然。就大家都觉得,我为什么不能直接问机器一个问题,机器告诉我答案呢?
其实我们等机器完成这件事,等了有几十年。其实在二战的时候,美国不是有一个叫DARPA(Defense Advanced Research Projects Agency)吗,就是国防先进技术研究局,他们就已经开始做这种基于对话的智能系统,他们叫专家系统,他们希望这个系统能够军事上面帮助一些知识库啊,等等的运用。但事实上,可能得到了Siri推出的时候,我们才觉得好像有一点点曙光。但Siri推出来以后,我们觉得这个东西虽然是对话式的,仍然能干的事情太少了。我相信很多人可能现在突然觉得说,今天的ChatGPT说话的能力,才是我们当年幻想Siri能做到的能力,对不对?我们都以为它是这样的。
我想再换一个角度,稍微简单点换个角度解释。就是说计算机最早的输入方式是什么?是连线。你要人工去hardware,去连一根电线或者是那个纸带卡,后来才有键盘,才有鼠标,对吧。那么其实这都是我们在迁就电脑,电脑理解不了我们直接说的话。今天我们的科技终于快到了电脑完全能理解,还不到完全,就快到那种感觉,我们马上就得到了一个巨大的畅快感。电脑突然有点像个人了,它能们跟我们自由地交流了,这就能释放出巨大的能量,这才是这场革命的核心。而不是它是能够陪我聊聊天,让我很高兴的一个聊天机器人,不是这样。它应该是我们人和电脑交互革命上的一个非常大的革新,这才是它真正的价值。
袁莉
[00:07:27]
我用了一下,我觉得它的语言能力太强了,而且我用中文和英文问它同样的问题,它竟然出来的答案是一样的。可是,它中文和英文都没有翻译腔,都是非常地道的,这个就是我觉得……我不说它内容本身怎么样,但是它的语言能力真的是让我很吃惊的。那你再给我们说一下,AI带来的这个能力、ChatGPT带来的能力会带来哪一些新的商业模式和交互模式呢?再稍微说一下好吧,因为中国的听众对这个会比较感兴趣。
Tinyfool
[00:08:03]
对,这个也是我最近在推特上面无数次强调的,就是你不要以为今天在网页中间看到的ChatGPT就是它的终极形态,这是它的一个DEMO。说句难听的就是说OPEN AI这家的公司,他们把GPT-3做出来了以后呢,他们感觉到了里头蕴含了巨大的能量,他们把这个API(注:人工智能算法服务)放出来,但是呢,他们发现在没有出ChatGPT之前,其实没有一个合作厂商认识到了他们这个大语言模型里头蕴含的知识和它的这种AI能力,所以他们做了ChatGPT,然后瞬间就火了。火了以后呢?我想举个例子啊,微软今天已经推出Bing Chat了,对吧。至少他们不是两三天前才做这件事情,但是我相信ChatGPT继续的火爆,也给微软一个(紧迫的)感觉,就是也许我们一直在谈这个deal对吧,但是现在变成这个东西必须马上推出来。就是这个东西是非常实际的,让我们理解了为什么。
你看历史,你就知道GPT可能是几亿的数据,GPT2可能就是几十亿的数据,到了(GPT-3)它这儿,这个数据又不断不断地增大,为什么要花那么多的钱去训练一个AI,它到底有什么用,对吧?ChatGPT把这个能力给释放出来了。
那在我看来,它最大的可能性是什么呢?就是我想你肯定也有印象,就是在iPhone出来的时候,有一些人,比方说我是欢呼雀跃;有一些人说,这东西没键盘,键盘都没有,到底有什么用?有人会这么说。可是到了今天,你可能没法去质疑,去说iPhone和安卓的价值,因为今天我们所有人的手机都变了,而且我们所谓的“用手机”,和10年前、20年前我们的“用手机”已经完全不是一件事情了。打电话已经不是一个很重要的事情了,而微信这种Super App还有什么打车了,外卖了这些东西,退回到iPhone出现之前,我相信大多数人想象不到说有一天,我们可以用一个手机去干这些事情,大多数人想象不到的。
ChatGPT它也是这样的一个产品,它是一个用户界面的革新。不是说我们这些做技术的人,不想把网站做到不懂技术的人也一眼就能明白它能干什么,也能跟这个网站交流、跟这个APP交流,对吧。
比方说举个例子,你用一个非常复杂的网站,比如说一个买房的网站。你想做非常复杂的过滤,要100万以下或者200万以下,然后呢,这个房子的平米数、这个房子的位置,你会发现这个UI你根本不会操作,可能只有我们做技术的人知道什么叫做筛选、过滤,还得大于、小于,这个费死劲了。
那么有了这种自然的API,你就像面对一个人类的中介一样,你把你的需求说出来,围绕哪个小区附近的、多少钱的、旁边有中学小学的、然后有医院的、什么距离怎么怎么样,你把这些说出来了,因为它懂你的语言,它就把需求整理成一种数据库能理解的语言,它就能把结果答出来。
所以,我的预言是什么?是从今天开始不是说只有search,只有搜索需要有一个聊天窗口,而是你今天想象到的所有的APP,所有的网站都需要这么一个东西了,以后大家的搜索也变得非常复杂了,是这样的,可以做各种各样复杂的搜索。而且呢,你也玩了这么久,你会发现对话体有个很有意思的部分,它有一个在我们技术上或者很多方法论上有的一个说法,叫做“逐步逼进”,这实际上是非常符合人类的需求。就是我可能一下子说不清楚我要什么。比方说我想要买一个便宜的房子,结果你就给我推荐了,一个很便宜又很偏的,但是对话体我就可以说第二句——有对话,我就可以补充需求——但是我希望它离北京一中很近。(我再发现)啊,这个房子不错,但是好像离医院又远了。对话体它跟以前的搜索又不一样,在搜索时候,你把多个条件加进去非常困难,而且哪个条件重,哪个条件轻(很难确定),所以这是一个非常大的革新。
现在很多人想不到这点。所以有人说程序员会不会失业,我才不担心程序员失业呢,因为每个老板都会说,我们得先加这个功能啊,加这个功能至少你半年就有活干了。
袁莉
[00:12:13]
半年,才半年的态势。好。呵呵,这个iPhone出来了以后,你看它确实是带来了这个革命性的变化,然后就带来了大家就是需要学一个新的技能是吧,会做这个iOS的,这个做APP的什么之类,其实制造了很多的工作机会对吧。
那大家就是在网上讨论的,还有一个特别热的热点。这个内容审查对这个ChatGPT是会造成什么样的影响。不少人就是做简体中文的对话和繁体中文的对话,然后有对比你自己也在YouTube有一期说,中国政府对这个内容相关的审查规定相对严厉,可能是C采取摒弃技术进入中国市场的一大障碍。但是你后来呢,又说了一些审核,对这个语料带来的影响,你能不能说一下给我们普及一下,就说这个内容审核对C经济中国发展,有就类似的这种的技术的发展会是一个什么样的影响,还有这内容审查对这语料库的影响,能不能给我们掰半开了。稍微说一下。
Tinyfool
[00:13:14]
首先我们简单地说,就是简体中文的内容,是我党控制的,是我国控制的,因为基本上用简体中文就是我们为主,也有一些海外的国家和地区也用中文,但比例太小。所以呢,在这方面,我反而认为中国并不是很吃亏的,因为比方说,我们可以大概理解成,问一个问题,如果简体中文没有这个内容,它也许可以从英文的内容弄出来,然后再翻译给你,或者它从繁体中文的内容弄出来,再翻译给你。但是如果既有简体中文内容,又有繁体中文内容,又有英语内容,那当然它肯定会选简体中文的内容——实际的原理不会这么简单,我们大概想象,就会看出来。也就是说,当你问了一个简体中文的问题,它为什么会表现出某种大陆的人民或者是国家的倾向。这是因为这个内容可能在台湾就没有人了解对吧。有些话题在台湾就没有人聊,英语世界了解也很少。但是有些问题大家都聊,那么这个问题问出来,可能就没有那么明显的倾向性。
袁莉
[00:14:13]
那我还是不太清楚,就比如说有一些内容在大陆是审查的,其实很多内容都在大陆是审查的。那我问它的话,最后大陆的简体中文可能没有这个内容,它会从繁体中文或者英文抓了过来,然后再回答。如果是中国的公司做ChapGPT这样的技术的产品,那他就需要继续审查,对不对。
Tinyfool
[00:14:38]
对中国的公司,我认为没你想的那么复杂。它很简单,就是它要从一头一尾做审查。刚才我们聊的是一个真正智能的AI它怎么做事情,因为美国人对这个限制比较少。当然,事实上也是有限制的,比如你问它什么撬门,它可能不能告诉你,它现在已经有这样的答案了,已经有人问过怎么撬门了,它会说我不能教你这个。但是这个和我们国内的这种审查是完全不同的量级和内容。
但是在国内呢?我们看了这么多年,其实我们大概会有一个理解,就是说国内的审查没有任何高科技,跟AI也没有任何关系,也就是只要你提到关健词了,你这个问题根本就进不来AI这层,就直接给你屏蔽掉就完了。这跟你发一条微博一样对吧,根本进不到下一层。那么(AI)回答也是这样,它一定得两边做防火墙,否则这家公司很危险。但这些东西呢,当然我是从经济上说,这些事情对国内这些公司来说并不是问题。因为他们在天津已经养了无数的审核团队,其实还有别的地儿,反正就是养了无数的审核团队,他们有这个精力去做这件事。当然从最终得到的结果的质量上来看,那大家肯定没办法追求这件事,因为他们要追求的是百分之百不出事,不能让上头找到毛病,这是他们要追求的。所以他们不会从AI这层来做这件事,就是最传统的关键词过滤,一头一尾,进去的问题不能包含有害关键词,出来的答案不能包含关键词,他们就两头卡住,跟中间的技术其实没有关系。
袁莉
[00:16:03]
我就接了我前面问的那个(继续),因为那天我看你在推特上又在那说,你说“很多人都说审核对语料带来的问题最大。其实我认为并不是。审核对人来说是个很大的问题,简中内容也比较单一化,但是很多人没注意到的是很多跟意识形态没关系的东西,西方的公开数据要多得多,政府有一定的义务去把很多数据花钱整理出来,全民免费使用。”你能不能说一下,这个是一个什么意思呢?
Tinyfool
[00:16:32]
这个其实很简单,就是说其实被审核掉的内容不影响(AI)它学成一个很会说话的机器人,这点就是我们还是把它分开。有一半是它非常会察言观色,非常会组织语言,这一半。这一半呢,其实审核掉一些内容其实并不会影响这个整体的效果。无非就是有些人名不能提而已,有些事件不能提,那么基本上的说话方式都是可以用的。
那么我说的第二部分实际上是什么呢?实际上等于说在欧美,特别是有一个运动叫做Open Data运动,要求政府把很多(信息公开)。实际上政府包含的数据都是公民的数据嘛,然后政府收集了所有公民信息,这个信息就应该是公民的信息。我指的是非私有信息,比方说政府运营的公交线路,这个信息不应该是私有的,应该所有人都能查询。比方说我想做一个APP,让我知道下楼就能坐这个公交,这个应该是个API,对吧。所以在西方呢,甚至包括台湾、香港都有叫Open Data的这个项目,它基本上的逻辑就是说,能公开的全部公开出来。那么这样的话呢,很多私有项目或者是公民希望了解到的,比方说一个国家的经济运行啊,各方面的信息,他都能拿到。
那首先呢,中国当然咱们都很了解,就是有些数据是作假的,这个不用说了,它虽然公开了,也是作假的。有很多数据呢,他根本没法公开。这是我谈的数据,并不是说好像哪个案件,或者哪个跟国家安全有关的事情。比方说我想知道一个城市有多少个图书馆,它们在哪里,这些信息其实都是应该有公开数据库的,这样方便我们普通人做一些应用。那这些数据在西方全是公开的,还包括很多很多(别的)了,就是各种各样的信息,这些信息其实都是潜在的,AI可以获取的信息。
我们再回到刚才那一个例子,我们想做一个智能的买房的软件,我只要跟它聊天就好了对吧。我说,那你能不能告诉我这个小区的房价趋势?那如果这个数据是每一个房地产公司自己去抓的,那这个数据也许不全。但如果是公开的,比如说来自于某个交易数据,这是政府的交易数据,而且是公开成一个API的话,那大家都有权威的结果,那无非就看你谁能把数据挖掘得更好了。
所以这个我认为反而是大的问题。因为我说句难听的,我一向认为我们不能谈一个技术对一个国家的政治的影响,因为技术就是把刀嘛,正派也可以用,反派也可以用,共和党用,民主党也能用,对不对。所以头两天有一个很荒谬的事情,有人说你们民主党人爱用ChatGPT,我心想你川普想用ChatGPT,申请个API也能用嘛,对吧。这个技术是中立的,但是我们最低限度要求是,在技术可以解决的领域,中立的领域,我们能不能把信息让技术尽量的获得,来辅助我们大家所有人获得一个更好的消息。
袁莉
[00:19:25]
那这个是不是你说Open Data?就是我那天和一个做AI的一个大牛聊了一下,他说简体中文的数据相对英文的是非常非常少的,所以对中国的公司来说,他们做起来也会相当容易一些,这个说法有道理吗?
Tinyfool
[00:19:44]
其实说句难听的,如果今天GPT-3开源了,今天所有的中国公司都已经有了OPEN AIl(的条件),就是它已经有了ChatGPT,它一家外国公司包含的中文数据,它用来回答我们的一些中文问题,大家已经觉得很不错了,对不对。而且它其实拿不到任何的机密数据,它的背后的所有数据都是来自……不是来自他们公司,其实你可以去看它的网站底下(列出来了),它有一些合作的数据抓取公司,也都是互联网上公开的数据。理论上这个数据你能抓,我也能抓,就用目前互联网的数据其实已经能训练出这么好的AI了,对不对。
但是国内的问题,我还是那么说,问题没有出在这个数据,无非就是……比方说ChatGPT有的数据你都买一套回来嘛,对吧,它从哪儿买你就从哪儿买就好了,你做到跟他一样总行吧,但是,不是这个问题。这个问题,就像我今天刚做的一个视频,就是说大概有一个朋友整理了一个Google和GPT、OPEN AI,它们在这个技术中间的交叉,一会儿你比我强,一会儿我比你强,直到ChatGPT出来,(Google的AI)Bard出来却出了个bug。你会发现这两家公司已经做了5年到10年在这个领域的深耕,那么你今天已经没有做过这种深耕的公司,你突然之间拿了一个开源的GPT2作为起点,你就说我想做一个跟Google和OPEN AI一样的产品,这不就挺难做的吗?对不对?你其实中间(差了)有无数的,我们技术上的人叫做Know-how的,你看不见摸不着的,甚至没法写到论文里头去的(东西)。写到论文里的东西,都是非常结构化的,非常重大的消息,但实际上有时候影响效率,影响结果的很多小细节、小技巧,无法被记载,这是公司内部秘密,想告诉你都很难。就是这样的东西,是这样的一个概念。
袁莉
[00:21:27]
你你有很多的这个Algorithm……
Tinyfool
[00:21:30]
算法。
袁莉
[00:21:30]
有很多算法。还有就是有一个科学家跟我说这个ChatGPT,其实它是一个Engineering,是一个很微妙的工程,所以就说不是说你有这个数据就可以做,或者你有它这个model就可以做得出来的。
还有就是你在有一期的节目里面,就是说中国企业过于商业化。其实这个呀,实际上好几个人……我跟好几个研究人员还有投资人,我跟他们说,他们都谈到了这个问题,就是中国为什么产生不了(把)类似ChatGPT还有DeepMind生产出来的技术和产品,他们觉得一个特别大的原因是中国企业过于注重这个商业化。你能不能把这个跟我们讲一下,为什么?我上一期和许成钢老师也谈过这个问题,是吧,中国本来是2015年、16年的时候,大家认为我们是一个AI大国,我们的这些企业都很牛,我们的数据很多,中国就是恨不得比美国还厉害,我们的超级计算机是世界最快的,什么的。那为什么就是突然之间人家出来一个ChatGPT,就好像中国的公司虽然也在说我们也有了,什么什么之类的,但是好像没有人相信?
Tinyfool
[00:22:34]
对,是这样的。其实我说句难听的,就是我们今天看很多数据,比方说科学家的列表,比方说AI科学家的、专业牛逼的科学家列表,里边可能有很多是华人,而这些人有的就根本就是在大陆读完了本科去美国读博士的,也完全可以回国,而且这两年回来回去的人很多,那为什么这些人没有集中的在中国创建一个研究中心?其实包括百度啊,还有阿里啊,他们雇的很多人在美国的时候都是领军人物,为什么没有做出领军人物的产品呢?
其实我可以讲一个最简单的例子,大概在05年左右吧,中国有一波互联网的热潮,叫做Web 2.0,那个时间点,其实有很多人都想做创新的东西。其实有些东西,我们并不能说完全是美国创造的。比方说土豆(创立)的时间并不比YouTube晚多少。
袁莉
[00:23:23]
因为我知道土豆实际上比YouTube创办要早。
Tinyfool
[00:23:25]
而像豆瓣这种模式,美国根本就没有。但是呢?实际上在最近这十几二十年,整个中国互联网\整个中国商业界被无情的一个现实打倒,就是你跟美国的基础设施完全不同。
在2005年的时候,我们想做电商,你怎么做?没有几个人有信用卡。信用卡在今天中国的普及率也很低,今天中国的电商如火如荼的原因,是因为有支付宝 、微信支付,这是我们走了一个弯道超车,这就叫弯道超车。就说我们在信用卡没有普及的前提下,在人民群众百姓对信用卡有恐惧的前提下,我们做出来了一种电子支付,于是我们的电商起来了。
当然不光是这一个原因,政府的审核也是很大的原因。那个时间点,你想做一些商业化的产品,或者说你想做个理想主义的产品,你就发现这个时候这句话到底是让他说,还是不让他说呢?你让他说,你网站被关掉;或者你不让他说,他就骂你,说你不是在做一个有理想主义的Web 2.0产品吗?
你如果说三年、五年,整个的行业,它是有一种倾向,也许是来自于某个思潮或者某个人。这么多年这个行业,我们的高科技产业,人家都不乐于去投资,这说明你的环境是有问题的。比方说,举个例子,倒退20年或者倒退10年,我想做芯片,我发现我认认真真做芯片,投了几个亿,政府也不补助我,然后呢,我市场上也没有什么机会。这个时候听说(上海)交大有个磨芯片的人发了财。
袁莉
[00:24:51]
汉芯事件(造假)。
Tinyfool
[00:24:52]
你让我情何以堪,你知道吗?然后呢,在那个年代,我们有一个词叫copy to China,你一开始可能在网上都在讨论copy to China的太Low了,这个丢脸。过了两年以后,这帮人上市了,跑到纽约去敲钟了,跑到纳斯达克敲钟了,你怎么办?我觉得我们这些做技术的人、行业中间的人,是一步步被现实教育成这个样子。谁没有点儿梦想呢?
再举个例子,我再举个最近的例子,在头两年不是还有一个芯片大潮吗?政府也说鼓励做芯片,对不对。结果你们听到了一个武汉的那个什么芯……
袁莉
[00:25:33]
弘芯半导体(造假)。
Tinyfool
[00:25:34]
所以就是说这个环境不断地告诉你说,没有土壤,没有土壤,没有土壤。你做吧,做了就死。你看芯片行业目前领先的公司,比方说N卡(NVIDIA,英伟达)的老板是个华人,虽然是台湾人对吧,然后我们A卡(AMD)的老板也是个华人。从来没有说中国人不懂技术,中国人没有创新意识,问题是他跑到硅谷去了,他就懂技术了;他跑到台湾台积电他就懂技术了;他回到大陆这么一块沃土,他觉得还是做点小生意,或者做一点copy to China的东西,这是没办法的。虽然我们还是得说,还是批评说行业不思进取,但是我们作为行业中一个人,你会想,你在这个行业你怎么办?你原来如果是做教育APP的,给你下架一年;如果你是做教育培训的,给你下架一年,你怎么做生意?这就是问题。
袁莉
[00:26:25]
对。我那天和一个技术大牛(聊),他跟我说,其实中国这些互联网公司前些年还是从硅谷招了一些挺牛的人回来,但是这些人呢,被招回来就差不多就相当于门客一样的,因为公司就是拿他们出来说个事儿,也觉得他们做的事儿也没什么商业价值。其实还是主要就是这些大公司,我们就说对标以前的就是美国的谷歌啊、Facebook啊、亚马逊啊之类的这些公司,他们对于这种技术的投入也没有他们在美国的同行(高),更使得他们也太专注于商业化了,这个也是一个问题。
那我再问你一个,就说中国国内的这个ChatGPT对标产品的水平,它可以达到什么样的程度?我们前面稍微讲了一下,你能再给我们说一下吗?就比如说百度说它三月份要发一个类似的产品,然后股价一下涨了好多;好像360也说了这个,你能不能稍微说一下,就是大概我们可以期待是一个什么样子的?
Tinyfool
[00:27:32]
我基本上不抱期待。因为那个360……就我那个视频不是说了吗,周鸿祎是很坦诚的,说他用的是开源的GPT-2,这个东西因为是开源的,我也用过,基本上知道它在任何一个领域的表现,跟GPT-3就毫无对比。在GPT-3没有出现的时候,你可能拿到GPT-2觉得是革命性的产品,但你见过GPT-3以后你再回来看GPT-2就觉得是个垃圾。虽然它们的可能内部结构很像,都是一家公司做的,我不太相信说,今天百度能在短期,比方说半年到几个月的时间内,做出一个GPT-3量级的东西。我觉得百度也好,中也好,他们做的都是GPT-2之上的东西,其实他们有一定能力把它做得像小冰那样,看起来很好玩,但它不像现在的这个ChatGPT。
其实ChatGPT,它也不是一个完美的产品,我从用户的角度来讲。用户的角度怎么说呢?就是90%的用户其实不知道它怎么用,但是今天会用它的用户,能把它用出来无数的花(活儿),甚至国外已经有很多cook book对吧,而且准备出实体书,就教你怎么用(ChatGPT)。为什么要教你怎么用呢?因为这个东西简直没法用。功能上讲它啥都能干,你只能通过对话的时候去想象它能干什么。所以呢从某种角度上讲,虽然我们做技术的或者说可能就是稍微懂一点的人,也许认为百度的东西会渣得一塌糊涂。但是百度在国内市场让人们觉得说,我们已经超英赶美了,已经达到美国先进水平了,我觉得问题不大。这块不用替百度担心,而且本来ChatGPT你不翻墙,也不能用嘛。国内的用户他也没法去对比。
所以呢,百度可以在某些领域,比方说一些预设的问题,把它专心致志的做好。而不像ChatGPT它有太多能做的事情。也就是说,这边做了个螺丝刀,你就做了一个数控加工中心。但是螺丝刀能不能拧螺丝吗?肯定可以。就是它虽然完全不是一个东西,但是你如果忽悠他说这个东西就是拿来拧螺丝的,那也没问题。所以股价肯定是可以的,我觉得还是可以的,也还是挺OK的一件事。
袁莉
[00:29:36]
也可以说我们也有了,是吧。
Tinyfool
[00:29:38]
我们也有了。其实你想嘛,比方说举个最简单的例子,我拿SpaceX跟你说对吧。SpaceX有了,中国才有了民用航天。在中国,你就可以想象,我们对中国政治的理解,就是说如果没有SpaceX公司,从来没听说这个事,你跑去跟国务院、跟航天局说,我要搞这个东西,人家会怎么想:你这个是不是要造导弹啊?
袁莉
[00:30:00]
你你要搞火箭,你一个私营公司干吗要去搞火箭?
Tinyfool
[00:30:04]
你要干什么坏事,或者是你要炸哪里?所以呢,这就是核心了,你说叫颠覆性创新,就是可以把原有的很多技术壁垒一下抹平的颠覆性创新,像ChatGPT这种东西只能在美国做。但是呢,我做一个跟它很像的,这个是我们擅长的事情,copy to China的阵地就是这个东西。
袁莉
[00:30:25]
你能不能再跟我们最后总结一下,对于这种技术公司来说,对于这个技术人员来说,一个什么样的制度环境和行业环境会是比较合适的呢?
Tinyfool
[00:30:36]
嗯,首先我觉得就是说,没有限制,这个我觉得是第一条。就是说我们现在可以回想,刚才其实举过一个SpaceX的例子,这类例子是有很多很多,我们倒推最近这十年美国在技术上的一些变革,一些商业模式的变革有很多,你可能会发现,就跟你想拍的电影一样,你根本过不了(审核),你根本没法去报这个项目。或者说你这个项目就这样做了,然后有人就来问你,这都是要干吗的?这是第一个问题,就是没有禁区。在中国呢,这个禁区还是挺多的,特别是比如说大家一听到ChatGPT,就会想这个东西有很多禁区啊,因为这东西涉及到文字啊,文字是我们的审核的第一线。只要涉及到在互联网上发文字和看文字,就是要审核的,对吧?那么你有很多的想法,就没法做。这是第一条。就是说我觉得应该没有禁区,什么都能做。
第二条呢,我认为是一个成熟的金融环境。因为我自己也创过业嘛,可能从我创业到今天,或者说从20年前到今天,我们会认为美国的资本是比较懂创新的,而且也是乐于去投一些比较长线的项目的,包括中国的项目比较长线的。那中国的资本呢,我们不得不说到有些资本的背景对吧,他比较短视,或者说他本来就有一种,我本来就是某个领域的、或者是某个单位的、或者某个地方的势力对吧,或者是权势,那么你要跟我合作,最好你是能在我这个地方获得我的……其实就是我不仅要给你钱,我要给你empower一些东西。那么这种东西,它其实跟创新是冲突的,它没法去看到那些可能要长期投入,但是可能一时半会儿不会有结果的东西。
我可以举个例子,就是我当年在一个大姐那儿聊天的时候,说到土豆。我们当时很迷惘,我们几个人问,说你看我们几个做个小网站,这个流量很小,对吧?找投资都很难,土豆这种东西。我们在那个时代,我认为土豆的流量费用是不可预估的,为什么美国资本会投资这种东西?那个大姐跟我讲,说你看,人家投资的不是今天的土豆,不是明天的土豆,是五年十年以后的土豆,这么去想,它就合理了。那这样的长期化的思维,其实在西方的资本里头还是比较常见的。一方面我觉得是这个是“仓廪实而知礼节”,人家足够有钱以后就会产生出多样的投资风格。第二呢,就是在美国,“创新可以带来收益”这种事情是根深蒂固的,是大家都相信的。投资了Intel的,投资了仙童(半导体公司)的,投资了各种各样的,包括苹果的、微软的,这都发了大财。在中国呢,你看到的很多投资机构,他投资了copy to China发财了。这第二个,我觉得是投资环境。
第三个呢,当然我们也可以说墙是一个很大的问题,对吧。虽然可能我们很多人都会翻墙,但实际上……
袁莉
[00:33:19]
翻墙的人是极少数。
Tinyfool
[00:33:20]
对,其实是极少数,对整体社会是有很大影响的。
袁莉
[00:33:24]
挺有意思的,因为微信上周末的时候,大家在传一篇文章,就是说中国如何错过了机器盛宴,其实是列了一个时间线。疫情这三年,作者就说中国因为疫情闭关了三年,正是OPEN AI的GPT发展壮大、产品化的三年。后来呢,这篇文章就两次都被删了,或者被屏蔽了。后来我看了有一个链接,我打开,我说怎么可以看了?然后就是把中国疫情的那些东西都给去掉了,于是就……
Tinyfool
[00:33:56]
哈哈哈。
袁莉
[00:33:58]
只剩下ChatGPT的,然后那个作者他最后还说明了一下文章转变的这个过程。我觉得,哎呀,真的是连讨论这个事情都不可以讨论,怎么……
Tinyfool
[00:34:09]
对的,你说的这个例子太好了,我们在行业中间有一些观念,有一些想法,它是因为没法去讨论,没法去讨论的话,你怎么进步?真的是这样的,就是这样的。
袁莉
[00:34:20]
还有土豆网,我可能要说一下,特别年轻的年轻人可能很多不知道它是中国可能最早的User Generated Video(网络平台),特别早的一个视频网站。最早的想法是说大家自己上传自己拍的视频。Anyway,还有什么,就说你对普通的中国的听众(要说的),你觉得他们应该对ChatGPT要了解的。
Tinyfool
[00:34:41]
其实倒还好,因为我自己啊是一个很佛系的人,我倒没有说你们一定得懂这个东西。我当然希望说大家都了解这东西,然后做了一个内容,或者咱们俩聊了以后,大家都很关注这个东西对吧。但实际上呢,我们也是说,你就算不懂这个东西,你该吃饭也可以吃饭,你该买东西也可以买东西,该生活也可以生活。但是我总是认为对很多人来说,改变你命运的时刻,它并不是说你工作了20年中间的每一天。而是某一天,某一天当你知道了有一个新的方式方法,某一天当你知道了一个新的机会,当某一天你知道了一个新的表达方式。比方说我们今天用的Podcast、微信公众号、油管等等等等,这些东西在它出现之前,我们也可以吃饭,也可以生活,都一样,但出现了以后我们就变了。
所以其实对于ChatGPT,我并没有很多人想象的,好像就是Tinyfool觉得说每个人必须得用这种,其实没有,但是我很希望说大家千万不要被它的表象所欺骗,而没看到它巨大的潜力。其实它有非常巨大的潜力。
讲一个简单例子,因为我在iOS时代,也算是一个鼓吹手。我们在当时看到了一个现象是什么呢?就比如你大学毕业,你在上海找一份工作,程序员的工作可能拿到8000,你什么都不用变,只要你说你会iOS,就可以拿到12000。
袁莉
[00:36:01]
iOS就是苹果的操作系统。
Tinyfool
[00:36:02]
对,这就是技术的力量对吧。但是你跟人家说这话的时候,人家不信的,人家会说你这个骗子是不是要骗我去买个苹果电脑?其实你说ChatGPT我也没股票对吧,这个东西火了关我屁事。但是我会希望说这个机会来的时候有的人能抓住。有人抓不住那当然无所谓了,该干吗还是能干什么的。
袁莉
[00:36:22]
我再问你最后一个问题吧。ChatGPT你觉得对于人类的这种的产业革命来说,它相当于一个什么样的等级呢?是相当于机动车出现了,还是汽车出现了,火车出现了,搜索引擎、互联网和iPhone,你觉得是差不多(能跟以上哪个同等级)?
Tinyfool
[00:36:40]
我觉得跟这些都差不太多,都差不了太远。
袁莉
[00:36:43]
这些都还是有量级(区别)的。蒸汽机出现那是最大的一个产业革命,和这个iPhone出现还是不一样。
Tinyfool
[00:36:51]
这么说吧。那我讲一个对ChatGPT过份乐观的一个观点,就是有很多人以为它是有人工智能了。现在看起来,我觉得ChatGPT像未来的真正人工智能的“嘴”,它已经达到了嘴的能力了,但是它其实没有那么好的大脑,我不认为它能够涵盖一个自洽的价值观,它没有这个能力,它目前还是个language model。但是,如果假设有一天,我们有了一个实体的机器人,它的嘴巴模块,可能就是ChatGPT负责的,就是它来负责说话的这个逻辑。但这个嘴它到底有多大的威力呢?很难说。这是我觉得不好估量的,但是我也认为这个角度上来讲,可能AI的各种突破都在眼前了。比方说举个最简单的例子,ChatGPT和那种我们在12年、13年看到的图像识别,它是完全垂直的,它并不能说我有ChatGPT,我就代替了图像识别。
那么其实在AI领域,语音识别、图像识别,现在可以说话了等等,其实我们相信有很多很多的领域都在不断地冒出来,不断地在改变这个世界。它当然不是历史的终结,但是它会带来一个非常大的革命。
但是革命也有一个问题,就是今天iPhone大家都有了,我们这个里面有什么信息?(有人会说)我看到一些古代的手机,都是20年前的手机,还能有40和弦呢,那你这个破iPhone,连键盘都没有。他理解不了这件事。你知道我现在有多幸福吗?我们在家坐着——这是中国啊,国外可能还没有像咱们那么奢侈——你想要一瓶可乐,你也能买。这是当年,二十多年前的一个理想,只要一小时买一瓶水,现在做到了。但是我们经历的人知道,很多人可能理解不了。现在都有汽车了,他们理解不了马车时代的人是什么样的感觉。但是它是一个真真正正的变革,真真正正的革命,它会在商业上带来巨大的利益,和(影响)很多参与的人,是彻底地改变我们的生活。
袁莉
[00:38:42]
那你会不会太乐观了?也许这个东西最后没有我们想象的那么厉害呢?
Tinyfool
[00:38:47]
其实我觉得我一点都不乐观。我吹点小牛皮,就说在移动互联网时代和ChatGPT这个时代,我做的预言都不会错。我跟你讲句实话,这真是实话。在iOS火到一定程度了,就已经没那么火了,已经不再有新东西的时候,就没有大的新的新闻那时候,我其实挺抑郁的。我特别兴奋,活在那个时代,就每天都觉得说可能会有一家公司做了一个,让我想:哇这个东西也能用APP来做,我没想到。或者说这样的东西,比如说像滴滴打车等,可能都不是我做的,我想到了我也不会去做那么复杂,但它做出来了,我就会觉得世界得到了改变。今天我就活在这样一个幸福感中间。
我之所以做了这么多期的节目来讲这个东西,因为我看到就像科幻一样,你科幻中幻想的很多东西,它也许需要几百年或者几十年才能实现。而我们今天幻想的ChatGPT的东西,可能一个月以后就实现了。我大概在一个月前说搜索和ChatGPT一定要合在一起,因为我刚才跟你讲搜索是实时信息,ChatGPT是非实时信息。结果Bing Chat出来了,很多人跑过来跟我留言说,哥你一个月前说了,说得真准。这种感觉很爽,我会觉得很舒服,(虽然)不见得能带来钱。
袁莉
[00:39:56]
我们会请每一位嘉宾推荐三部书或者是影视作品,你有什么推荐呢?
Tinyfool
[00:40:03]
推荐三本书,第一个是《国富论》亚当·斯密的;第二个是《枪炮、病菌与钢铁》;第三个叫《技术与文明》,叫张笑宇这个作者写的。
其实这三本书就跟刚才有一个问题比较有关联,我当时忍住没说这个东西。说句难听的就是对我这个人来说,我喜欢的就是这种……比方说第一个是亚当·斯密,我认为他揭示了这个世界的反直觉的本质。大家可能不知道这个真正统治这个世界的是Market,一直以为是某个政府,实际上你知道一个小集市是政府无法控制的,在任何一个小的村子里,都可能会产生一个小的Market。
那《枪炮、病菌与钢铁》和《技术与文明》这两本书呢,也都很像我很喜欢的观点。我最近一直有在形成一个新的观点,就是技术呢,它的发展是不可阻挡的。基本上张三不发明,李四就发明;牛顿不做微积分,莱布尼茨也要做,甚至两个人一块儿做。那这些东西,它有它本质的关联。就是说当这个技术发明了,下一个技术可能就已经在路上了。但是问题出在哪儿呢?问题出在,我认为以前我们常用的话,“技术是双刃剑”是错的。问题出在技术不断在前进,而人也需要进化。人需要发展出新的理论去面对手里更厉害的武器。而不是去抱怨说这个东西怎么那么强大,它能不能用来害我?因为它的进步是无法阻挡,所以你就必须得去掌握它,你得让它变成一个好的东西。
我们今天看了很多科幻都是那种,比方说赛博朋克那种东西,它都是对未来宇宙很黑暗的理解,包括我们对核武器的理解都很灰暗。我认为这些想法都是对的,但是最终这些想法要回到怎么去提供一个方案,让我们既拥有了科技文明带来的好处,又去避免它有可能的坏处。今天对于ChatGPT我也是这么想的。这个AI,你想拿它去做一些垃圾内容,完全没问题,你想拿它去做一些坏事,完全没有问题。做坏事的人看到这个东西,他也是高兴得要命。但是你想让人们的生活变得更美好,你想让这个世界变革,也是需要这样的东西。
所以我很庆幸,包括有一句话,听着可能有些观众就不太喜欢了:我喜欢的这个社会,它应该不断地有科技进步,这样所有的文明都会想,我们应该开放应该包容,应该允许大家去创新。如果这个世界科技突然停止了,那OK了,那copy to China就赢了,因为你是静止的,那就看谁抄得快嘛。但是这个世界正好一步一步地证明,你抄得再快也没有用,因为世界在不停地在进步。所以我希望所有的各种进步不断地改变人类,希望人类去提升自己的文化能力,对世界的理解,我们去应对这个更牛逼的世界。不是说有一天AI、强AI出来以后,我们吓得四散奔逃,而是我们发现因为我们也变得非常伟大,而强AI只能是我们的朋友,只能辅助我们,这才是未来。我觉得科技不应该是被恐惧的东西,而是要被拥有的东西。
袁莉
[00:42:59]
好,谢谢。谢谢Tiny。
Tinyfool
[00:43:02]
谢谢你。
袁莉
[00:43:02]
也谢谢大家收听,我们下次再见。
Tinyfool
[00:43:06]
再见。
—— end ——