首页 >> 侧田

人工智能增强人类赋能想象力让机器也能有创意上胡海泉

2022-07-05 11:43:05

人工智能增强人类赋能想象力：让机器也能有创意（上）

出品：新浪科技《科学大家》、未来论坛

主讲嘉宾：范凌同济大学设计人工智能实验室主任、博士生导师，未来论坛青年理事，特赞信息科技创始人及CEO

人工智能很多时候和自动化、重复性的工作有关。其实人工智能刚刚出现的时候，很多的学者和行业先驱就在思考人工智能能不能帮助我们。

我们在探讨人工智能的时候，尤其是过去几年，往往看到两种场景：一个是我们可能在很多杂志上都会看到一个表格，统计了哪些行业、工作最有可能被人工智能取代

2013年一个牛津大学学者做的研究，看哪些行业最有可能在人工智能兴起的时候被取代，比如说像电话的接线员这些人等等；

另一种艺术化的表达。如上图右侧Adam Levey的作品《一个未来没有工作的世界》。这个作品就是把一些工作的从业者放到博物馆成为展品，比如这里是“工厂的工人”，下面写着“在21世纪初灭绝了”。

不论是表格还是艺术作品，都在讲一个充满“恐慌”的人工智能未来，这个未来中人的工作可能会受到技术进步的威胁。Elon Musk、比尔·盖茨、霍金，都指出了人工智能可能会成为人类未来的威胁。

我们可以用象限图来对人机未来做个分析。上图横轴代表对人来说很简单的工作，另一端是很难的工作。虽然我们自己也描述不清楚，为什么做得好的工作都是难的工作，比如我们很难说清楚如何把主持做好，可能会说“熟能生巧”或者“天赋运气”。

纵轴代表交给机器完成工作的意愿度，因为并不是工作我们都愿意交给机器做的。

我们讲机器取代人，都在讲左下角这个维度的工作，这是一种人与机器的“零和关系”——机器多做了人就少做了，这里的终极目标就是“自动化”。

我会集中探索右边这两个象限：本来就对人很难，机器完成度不算太高。机器帮忙的越多，人的能力就越强，我们叫赋能或者增强。

可以看到，很多使用人工智能来“增强”人类工作的例子，比如用word写作时，机器会提醒我们错别字，甚至帮我们完成句子。这都是基于大量的自然语言学习。这是一种“正和关系”，有了机器反而让我们的能力更强。

在过去10多年里，人工智能蓬勃发展、家喻户晓，既作为概念、技术，也作为一种社会状态。

如果我们把人工智能比作大脑，就像人的左脑右脑一样，左脑代表了语言、分析、抽象、数字、逻辑。代表更高、更快、更强——是不是意味着识别的速度更快，识别的效果更好，分析的结果更准，这都是一些定量的维度。

所以在人工智能左脑的层面上，我们的研究成果还是很丰硕的，很像我们常说的“学好数理化，走遍天下都不怕”。但当我们数理化能力强的时候，大家开始意识到要去培养艺术修养。那么人工智能是不是也到了要去培养右脑的时候呢？

右脑是一些比较抽象的、感性的、系统的、真实的图像思维，所以人的右脑这些属性对于机器来说，人工智能能不能让我们变得更美？人工智能能不能让我们变得更平等？人工智能能不能让我们变得更善意？人工智能能不能让我们具有同理心？

人工智能的右脑，也就是人工智能在过去一直注重更高、更快、更强以后能不能带来更美好的生活，就像我们自己关注GDP的绝对数字以后，现在关注到我们的获得感。人工智能也是一样，在飞速发展以后开始逐步地帮助我们去思考右脑的问题。

创意，这个词比较广义，分为两种：一种是“表达性的创意”，没有专业训练的小孩会用画笔表达自己的想法或者感受，所以这种是有感而发的创意。这种创意往往我们会把它等同为艺术，很感性，也不需要计量它到底有没有价值。

对了就是对了，别人也只需要去感受它，所以它是一种基于内在的自我表达，可能源自于记忆，可能源自于情感，可以源自于某种冲动，很像各种各样的艺术形态，不只是绘画，有雕塑也有音乐，表达性的创意更多的发自内心，不需要计较结果。

另外一种创意，则是类似我们看到的广告，我们使用的产品背后都有创意在，这些创意我们称之为叫“功能性的创意”，就是通过创意来解决一个问题，通过理性的分析创造一个答案，有明确的功能，有明确的方式可以度量，而且这种功能性的创意的出发点通常来自于外部。

这两张女性图像，上面这张是绘画作品，是表达性的创意，下面是电商的海报，是功能性创意。虽然风格似乎有接近的地方，但是出发点、目的完全不一样。上面是一种自我意识的表达，而下面是旨在销售、品牌的触达，有明确的功能性。

比较直白的说：表达性的创意约等于艺术，功能性的艺术可能约等于设计，设计都是有目的的，设计都是可衡量的，艺术都是表达的。

很有意思的是，如果大家用学术搜索创意这个词creativity，其实从无到有只有不到100年的历史，虽然整个创意在人类的世界贯穿了始终，但是创意这个词只有75年的历史，一开始和“想象”有关，慢慢才变为一种行动。所以我们研究创意其实是一个非常短暂的历史，这里面我们会对创意进行各种方式的演绎与延展。

创意这个词从无到有在过去的几十年里其实伴随着这样的一个趋势，我把它称之为叫“创意工具的发展”和“创意的大众化”。

过去不讲创意，因为不觉得创意是一个有意识的创造。但是慢慢随着创意的工具更可触达，逐步把创意这个概念、方式放大了，大众化了。

第一个帮助艺术家绘画的工具，英文叫Camera Obscura，就是“暗房”，影像的一个方式。所以艺术家可以很容易的捕捉到透视，让更多的画家可以画更准的透视，是简单的工具。

慢慢小孔成像Camera Obscura开始通过一些化学反应有了成像，有了照相机，照相机变成一个比较方便使用的光学仪器，光学相机、傻瓜相机，在30、40年前有了photoshop，然后数码相机让拍照变得更容易，现在我们每个人的手机都可以拍照。

这里举例的拍照或者图像维度的工具，其实变得越来越容易使用，因为越容易使用，越来越多的人会使用。原来Camera obscura全世界上千个艺术家在用，到现在几十亿的人在用手机，所以创意工具的发展自然而然带来的是创意的大众化和大爆发。

现在工具都和机器智能发生联系，创意工具也不例外，人工智能成为我们新的工具来做创造性的工作。

我们希望机器思考的方式和人思考的方式是一致的，所以给机器设定了很多思考的规则，但最后发现这个规则并不能带来更智能的结果。就像最早人类做飞机总想把飞机设计成鸟的样子，但是类鸟的飞机从来没有飞起来过，最后把飞行的原理抽象成为空机动力学，慢慢才形成之后的飞行器。

所以看看我们现在的飞行器，包括飞机、包括火箭，其实和鸟没有太多形状上的关系。人工智能也是一样，希望复现人思考的方式是走不通的。在过去10多年里逐步变成一种统计的逻辑，也就是说不追求因果关系而是追求关联关系。如果概

率上这些都发生过，通过学习这些概率，有可能产生新的结果。

所以创意的人工智能也是一样，我们通过创意变为数据，数据形成某种模型，这种模型带来运算，运算之后产生的结果进行评估，再来迭代这种运算的过程，这个就是人工智能之所以能够进入到创意领域就是走这样的一个流程。

如何让机器和创意发生联系？就像我们教一个人学习时，你要给他一本教科书，同理教机器能够进入到创意领域，第一先让机器开始理解创意。

10多年前，我当时还在普林斯顿大学，有一位年轻的教授李飞飞，现在已经是如雷贯耳的人工智能大牛，她做了一件事情，建立了一个数据集叫ImageNet，来帮助机器识别图像。

当时这个工具是比较早期的，成功的可能性并不大，不像现在ImageNet已经成为我们数据里面的基础。

但是当时看上去并不太完整，有一次李飞飞教授开玩笑说“早年的时候如果不是因为她是一个女性科学家，她可能连研究经费都申请不到”。

ImageNet让机器开始理解图像，现在绝大多数图象处理的人工智能都可能原自于ImageNet这个教科书，通过10多年的数据积累，现在准确率已经比人眼识别率还要高。这就是机器通过吸纳进数据，理解图像维度理解的越来越准，理解的越来越好。

我自己的研究团队做了一个数据集叫DesignNet，名字也算是致敬ImageNet。我们的数据集理解的是创意图像上面有什么字体、内容、风格、氛围、颜色的组合是怎么样的，所以这个数据集建立的是基于创意的知识和理解。

想象一下，对没有背景知识的人开始描述创意时，可能会说这是什么风格，颜色搭配是否互补等，可能会用一些比较简单的视觉和创意的词汇去描述创意的内容。我们建这个数据集，让机器也开始理解这方面的知识。

我们把创意变为数据的知识图谱，叫做“普罗米修斯”，可以不停的输入一些设计的问题，比如：什么是设计，它会产生一个知识图谱，有颜色、有字体、有大小等等。点进每一个知识图谱，比如说色彩这个关键字里面会延展出不同类型的知识关联。

我们问它暖色和绿色有什么关系，它把绿色和暖色的关系用多个维度串联起来，可能是互补的，可能是代表某种文化含义的等等。

也可以问它一些设计的知识，它有另一种表现形式。问它什么是“衬线体”，衬线体是和曲线骨架有关的，大量在互联网上关于设计的知识都被聚集在像“普罗米修斯”这样一个知识体系里面，可以进行询问。

所以我们把创意的知识库变成一个可搜索、可聚类、可分析、可连接、可关联的一个知识图谱，并且通过“普罗米修斯”前端的应用界面变成一个人可触达的创意知识库，这是我们做的把创意能够变为数据知识的事情。