马达钦北京时间2023年11月16日早9:00 World Science Hill独家电话专访了百度七剑客之一、酷我音乐创始人、Aibasis Ventures创始人、北京大学人工智能创新中心名誉主任雷鸣先生。
雷鸣,百度七剑客之一、酷我音乐创始人、Aibasis Ventures创始人、北京大学人工智能创新中心名誉主任。2000年放弃了美国七所大学的全额奖学金,成为百度创始七剑客之一。在百度期间,他主要负责搜索引擎的设计和实现工作。他带领技术团队,将百度搜索变成全球用户最多的中文搜索引擎。
2005年回国创办酷我音乐。他通过大量的产品技术创新,使酷我成为中国最大的网络音乐平台之一。自2014年起,酷我先后和酷狗、海洋音乐、QQ音乐合并成为腾讯音乐娱乐集团。
2015年创建智慧基石资本,主要投资孵化AI、消费、教育、医疗、娱乐等领域,雷鸣先生投资了包括人工智能媒体新智元、机器人外骨骼公司Yrobot、脑科学研究公司Neural Galaxy、骨科智能公司长木谷医疗等,还孵化了AI医学影像公司深睿医疗等。
教育活动方面,雷鸣先生参与创建了北京大学人工智能创新中心并任名誉主任,进行AI产业结合及AI创新型人才培养的探索。他在北京大学和清华大学都开设了全校公共课程《人工智能前沿与产业趋势》,并通过直播及网络课程方式影响了数十万人工智能从业者。他曾任新加坡国立大学客座教授,开设研究生课程《Technology Innovation and Entrepreneurship》。此外,雷鸣先生现任斯坦福大学商学院顾问委员会理事、斯坦福大学北京校友会副主席、北京大学校友会理事、北京大学企业家俱乐部理事、新加坡通商中国董事。
我主要是做一些AI有关的前沿科技的早期投资,包括天使轮~A轮。我也在关注大模型的发展动态,与行业专家和科研人员经常有一些紧密的沟通,致力于从各种角度观察AI的进步、产业落地和投资机会。
2.我们知道您作为百度七剑客之一,见证了整个互联网领域的发展与变迁,在您看来,如今的互联网领域相较于您参与创建百度时期,有哪些主要的变化与进步?
我当时从零开始参与百度创业的时候,互联网处于非常早期。百度创立于2000年,仅仅是刚过了门户时代的那一波,来到了互联网垂直分化的阶段,所以那个时候机会还是很多的。
我认为互联网大概每五年一个时间段,可以划分为最早的门户时代,然后到2000年前后的垂直应用时代,再到2005年的宽带时代,或者叫流媒体音视频时代,然后到2010年左右的移动互联网时代,再是2015年左右的移动流媒体时代。2015-2020年左右就没有再看到互联网领域有特别大的机会了。
其实我认为互联网最重要的就是可移动性和带宽决定了其中的创业机会,因此该领域的新机会我认为是不多了,这一点也可以从创业和投资趋势上能看出来,最近纯粹的互联网创业和投资相对来讲就越来越少了,当然还有一些像跨境电商这些还在进一步发展。
技术经历了不断的创新,到现在已经发展得足够好,之后技术本身再进一步发展对于应用层面来讲,能做到之前不能做的事情。我举个例子,像TikTok现在风靡全球,那它最重要是两个条件,一个是手机,它可以进行这个简单的视频录制,第二是这个移动宽带可以允许在手机上方便地上传和下载,因此这就让移动的视频流服务成为了可能,这也是TikTok出现的基础。
那到宽带以后,出现了一些比如说超宽带的新鲜事物,这些东西对于我们应用来讲,只能说让原来的服务变得更好,但不是说没有了超宽带,这些应用就运行不起来了。所以相应的,这些企业已经建立起了领袖地位,后面再去做同样的服务,就很难再去实现超越了。因此我认为互联网这个宏大的时代,就像当年个人电脑时代、软件时代一样,其实已经相对稳定化了。
我想说,人工智能和互联网是两个不同的事情,它们解决的问题是不一样的。互联网的核心是解决连接问题,如果一个产业的信息流动性与连接构成了主要矛盾,那互联网就会解决得非常好。比如说Amazon是用电商解决零售业,其逻辑在于我们如果连接所有商品和用户,这个连接是不是非常的充分,能不能让用户找到所有的商品?电商可以做到这一点,但是线下就不行。其次,因为网上选择众多,用户就很方便比价,从而找到高性价比的商品,同时通过发达的物流还可以进一步降低雇员成本和在城市里开实体店的成本。相比于互联网解决连接问题,人工智能解决了什么问题呢?
其一是供给侧问题。从经济学上来讲,任何一个产业都是在满足一种需求,例如餐饮业满足饮食需求,服装业满足穿衣需求。AI在连接上也可以做一些帮助,比如TikTok最重要的就是推荐算法,它能让连接变得更有效率,因为它能一直把我最喜欢的视频连接给我,这就是一个典型的例子,但AI最大的作用并不是帮助互联网更有效,而是解决供给侧问题。比如说像互联网教育、互联网医疗等等这些产业,虽然我们也看到一些公司做的不错,但是并没有像电商、搜索那样对整个产业造成颠覆式的影响,而只是敲敲边鼓,为什么呢?因为对这些产业而言,其最主要的矛盾并不是连接,而是供给侧高质量供给不足问题,这在服务业中是很常见的。
比如我们都知道看病、读书都应该去最好的地方,但是医生有限、师资有限,所以AI可以做一个事,虽然眼下还有争论,就是能成为最好的医生和老师,对此我对未来持开放态度。在GPT4这种大模型以后,我们更看到了AI的进一步潜力,随着AI越来越强的能力,再做一些垂直专业的模型,我认为AI可以在未来特定的时间达到初级医生、中级医生甚至高级医生的水平,如果能做到的话,AI就能够解决医疗上的供给不足问题了,因为AI可以无限复制,不存在供给侧不足的问题,而原来的大医生一天可能只能看30个病人,最多不会超过200个,但对于AI来说,比如一个GPU能看100个病人,如果还是不够,那么只需要增加GPU即可。这就是为什么AI能解决供给侧不足的问题,尤其是优质供给不足。
另外AI还可以进一步降低成本,因为一个经过多年训练的人,他的时间成本是很贵的,例如最优秀的医生、律师等,费用也是越来越高。但如果AI通过训练变成所谓最优秀,那么它得可复制性决定了,当AI用于服务所有人的时候,成本就会降得非常低。以上是AI在产业中的应用,它更多是独立于互联网,而有独特的个性化服务。
4.如今的AI领域,技术在不断地更新换代,这些最先进的AI变革大多发生在大型企业而非高校,作为AI领域的著名投资人,您认为高校的AI研究应该如何发挥出自己的优势和特色?小型的AI创业公司又应该如何在一众大厂的笼罩下生存并发展壮大?
确实如此,第一大模型现在成了AI研究的最核心方向。以前我们说AI还有很多方向,比如视觉、自然语言等等,而且它们还包含很多独立的子方向。但现在我们看到,大模型几乎成为了唯一的方向,因为它可以把所有的这些都融入到一个模型里面去解决,事实证明效果也确实挺好的。所以未来对于大模型,只有大厂才可以有巨大的算力投入,像OpenAI、Google等。
相反我们发现高校就很难有这么巨大的投入去买算力,我记得李飞飞教授曾经提出来说,希望政府能投入一些计算的基础设施供高校使用,而不是让高校去花自己为数不多的科研经费,我觉得这是个挺好的思路。另外高校也应发挥自身特长,业界的AI研究往往就是暴力美学,就是堆算法堆算力,但高校可以研究一些更有效的基础结构,探究其中原理,比如说研究下一代Transformer、解决收敛问题等等,即去研究一些AI流程里的具体环节,这样学术界和工业界也可以起到一个协同的作用。
而小企业,我觉得它们面临着跟高校一样的问题,因为你投入不了那么多。所以我个人觉得小企业最好是扮演硬落地的角色。就像当年互联网起来之后,像最早无论是Amazon还是Google、Facebook其实都是做的一个一个垂直领域的小应用而已,虽然它们如今早已变成了平台,但是最开始并不是。所以我觉得,小企业更多应该要做有价值的,有用的东西,这是最重要的,从而绕开比较困难的基础设施不足的劣势。
5.近一两年,随着以 ChatGPT为代表的大语言模型相继问世,您认为这会对AI领域的潮流产生什么样的影响,人工智能最终又会达到什么样的高度呢?
我认为ChatGPT是一个AI发展的一个新阶段,在此之前AI是多垂直方向的,像视觉、自然语言、声音等等,它们各有各的模型。但是大模型问世之后,现在正在尝试把这些模型都统一起来,最后变成一个认知模型,即对这个世界的一种认知,自然语言、文字、图片、视频,甚至将来的触觉、味觉,它们其实都只是一个输入输出而已。真正透过这些输入输出的逻辑,这后面其实有着巨大的计算空间,它们都是对于这种认知和常识的推理和总结。因此我对未来大模型的一个发展理解就是,模型越大,它的表达能力就越强,所以从理论上来讲,在数据越充分,模型效果就能做得越好,而且从应用上来讲,模型的压缩小型化还可以显著降低成本。
现阶段的人工智能,本质上说还是一个文字输入输出的文科脑,毕竟模型还没有产生真正的视觉,虽然我们输入了一些图片让模型看,但还是有很强烈的文字化的味道,由此训练出来的文科脑就是一个未来也许会进步的点。此外,可能还有一些有意思的点,比如说解决Hallucination的问题,即胡编乱造的问题,解决这一点后,大模型在一些不允许犯错误、严谨的地方的应用就会越来越好,比如像法律、医疗等等。
除了文科脑问题,与之相对的还有理科脑问题,我们很多像工程师、设计、编程、审计、会计等等,他们的工作几乎没有容错的空间。现在大家也看到,编程用AI辅助已经能将编程效率提高50%甚至更多。将来如果大模型能开发出理科脑,那么有可能提高会更多,甚至可以逐步代替人类做一些基本的编程任务。还有一个可能的方向就是变成一个有眼睛的智慧体,不同于传统的图像处理,这里的眼睛指的是它能处理视频流信息。那么大模型就会对真实世界的理解更加深刻,而不是只有人类那里道听途说的知识了。
有了这个之后,我认为像自动驾驶这些,就会比以前更容易做,做得更好。也就是说你给他看一下交规,他对这个世界的物体移动、撞击伤害这些东西他都已经有了完全的理解,大模型就能按交通规则驾驶,这与人类学习驾驶的过程也是一致的。
6.在与很多AI创业者的交流中,他们都对自己公司的盈利能力的不足与模型落地场景的局限等等现实问题表达过担忧,请问您认为AI创业公司应该如何找到自己的落地场景,又该如何规划公司的长远发展?
AI创业公司找落地场景确实是件有挑战性的事情,我们也和很多创业者聊过,我个人有些看法可以供大家参考。第一,现阶段创业就不要做平台类产品了,因为如果你想做一个比OpenAI还好的大模型,我认为这不太现实,因为你没有那么多资源。第二,如果基于大模型做一个类似于prompt平台或者Agent平台这种,那我个人认为,这个是可能实现的,但也比较难,因为这类平台就太单薄了,它其实只是一个很简单的工具层。这次的OpenAI发布会其实也让我们看到了,他们会向应用层进行扩展,对于一些简单的工具,很容易被降维打击,所以这个风险也是很大的。
所以我建议大家还是去做一些真正的应用,比如我们看一些公司用大模型去做游戏里的智能体,还有用大模型去做一个聊天机器人来针对一些特定的客服、销售、办公场景。所以如果你确实觉得有些特定的场景或者行业问题是可以用大模型来做好的,那么可以作尝试,但是你如果想泛化地向Office提出挑战,我个人觉得是很困难的。最终我们还是要用大模型来解决真实问题,无论 to B还是to C,让用户觉得满意是很重要的。如果真的能够用起来特别好,那就能快速获取用户,这一点与互联网时期是一样的,只要你有相当大的用户基础,以及用户数据,和对用户的理解,这些东西都能构成一定的壁垒。
因此,即便你只是对大模型做一些简单的 finetuning甚至是 prompt engineering,只要能对接好应用,快速获得用户,那么垂直应用上的这种用户交互数据和用户需求就能慢慢构成你的护城河,从而帮助你成为应用方面的大公司。
|