AI绘画的“小秘密”都在这一篇文章里******
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
数字社区加速数实融合******
在浙江省湖州市安吉县鄣吴镇的“扇艺共富”工坊,创业者通过电商平台直播带货方式推介鄣吴竹扇。
夏鹏飞摄(新华社发)
近日,中国信息通信研究院发布《数字社区研究报告(2022年)》提出,随着数字化应用向纵深推进,各行各业将迎来新一轮创新升级。人与人、人与物、人与社会等关系也将因为数字化的全面介入而发生质变。随着数字经济的发展,数字社区这一新型网民生态圈,正在成为数字生活的入口与数字经济的载体。
新型互联网社区兴起
中国互联网络信息中心发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月份,我国网民规模为10.51亿,互联网普及率达74.4%,互联网基础建设全面覆盖,实现“县县通5G、村村通宽带”。数字技术给人们的出行、购物、社交、娱乐、就医、教育等各方面带来极大便利,人们的生产生活方式正在全面线上化、数字化。
在此基础上,数字经济发展格局全面扩展,深化数字化应用成为大势所趋。《“十四五”数字经济发展规划》提出,“十四五”时期,我国数字经济转向深化应用、规范发展、普惠共享的新阶段。随着数字化应用的纵深推进,各行各业将迎来颠覆性变化,新业态、新模式日新月异。移动支付、电子商务、网络购物、视频直播、远程会议等模式竞相发展。
数字社区是以新一代信息技术为基础,以海量数据为流通要素,以先进的数字化交互手段为主要表现形式,通过打造高互动的数字生活场景,建立人与人、人与物、人与社会之间的信任连接,从而实现线上线下高效融合的新型互联网社区。数字社区成为服务现代化产业体系建设、推进乡村振兴、促进区域协调发展的新型移动互联网产品形态。
作为一种新型互联网社区,数字社区具有普惠、连接、效率和信任四大特征,将物理世界的要素——人、产业、区域,利用多样化的表现形式,在数字世界连接成一个又一个内容模块,多种多样的内容模块组成生活中的方方面面,形成数字社区内容生态,由底层技术/数据支撑连通这一生态系统,最终形成规模巨大的多边网络效应,让不同的人群能够基于普惠机制获得平等的数字化服务。
同时,依托人工智能、音视频技术以及AI芯片等软硬件技术的集群式创新,数字社区有了更丰富的内容形式。人工智能生成内容的出现也降低了社区创作者的门槛。
“数字社区作为数字经济发展的新载体,是面向未来可持续发展提出的互联网社区建设新理念与新模式。”中国信息通信研究院总工程师敖立表示,数字社区通过多元化的信息交互技术搭建的内容矩阵连接起数亿用户与各行各业,并与实体经济深度融合,不断创造新场景、新机会、新模式,推动数实融合与数字中国建设。
深度连接产业与用户
回顾中国互联网平台的发展史,从以搜索引擎和资讯服务为主的门户时代,到QQ、淘宝盛行的以社交和电商为主的用户时代,再到以美团、京东为主的便利快捷的移动互联网时代,人们的数字生活越来越便捷。自2015年首次提出“互联网+”概念后,互联网行业又迎来了新的商业模式与盈利增长点,以快手等企业为代表的“高黏性、强互动”数字社区的涌现,不断扩展、丰富着人们的交互空间与生活生产消费方式,其间孵化、催生的大量技术场景赋能到实体产业,成为全球数字经济发展的重要推动力。
《“十四五”数字经济发展规划》提出,以数字技术与实体经济深度融合为主线,加强数字基础设施建设,完善数字经济治理体系,协同推进数字产业化和产业数字化,赋能传统产业转型升级,培育新产业新业态新模式。如今,数字社区深度连接了一个个产业与用户,不断提升用户价值、产业价值、社会价值,进而发挥数字化优势赋能传统产业,促进数实融合发展。随着内容生态的不断完善,直播、短视频等内容创作新领域分工越来越专业化,数字社区开始在引领产业数字化、稳就业与促就业方面发挥重要作用。
报告显示,中小企业和传统产业在经历了成长红利期后开始积极谋求转型,例如一些传统餐饮企业、实体店开始接入数字社区,用优质内容吸引留存用户,进行营销、团购等经营活动,获得了更多商业机会与客户资源。数字社区发挥数字化技术能力、产品能力赋能各行各业,推动数字经济和实体经济融合发展,实现营销数字化、运营数字化和供给数字化。
如今,越来越多的产业和商业模式通过接入数字社区,从过去围绕线下展开转变为以线上场景为中心,实现数字化转型。快手科技内容总监袭祥德表示,作为一家高互动、强参与的数字社区,快手正在线上建立起广泛而精准的连接,成为人们数字生活的入口。随着更多人在平台建立信任连接,快手在数实融合和产业升级方面做了大量探索,持续在数字社区创造正向价值。
对互联网行业来说,大力发展普惠数字社区,打造互动性数字生活场景,升级数字化、智能化技术应用,不仅意在拥抱实体经济,将数字化的动力带给千行百业,更有机会借此在产业互联网的“下半场”竞争中占得先机。
“随着数字社区与实体经济不断融合,越来越多的商业行为将在数字社区中进行,不断壮大数字社区的产业链条。”中国信息通信研究院知识产权与创新发展中心创新发展部副主任张倩表示,电商利用视频+直播的强互动、快反馈特征,与消费者建立并积累信任关系。基于这种信任关系,未来数字社区将有机会成为一个更大、更丰富、消费形态更多的市场。行业的定制化程度进一步提高,原来无法被满足的个性化需求会被集中开发成新的服务;市场响应速度会更快,供给端的产品会更快得到消费端的反馈;市场中经营种类将会更多,市场规模进一步扩大。整体而言,随着信息技术对人与人、人与社会关系的深刻改变,数字社区有望成为数字经济的新增长极。
激发更多新应用场景
随着数字化进程的加快,数字社区将深入赋能人们工作和生活的方方面面,数字化能力将促进城市社区公共服务创新,带动乡村振兴,并助力区域协调发展;充分发挥数字社区直观性、便捷性、趣味性、互动性特点,互联网信息化成果将惠及每一位用户,以技术手段弥合数字鸿沟。
数字社区可助力城市公共服务体系更加完善。报告提出,在一、二线城市社区,不仅在线消费、即时零售、社区团购等消费类需求旺盛,用户在娱乐、学习、就业等方方面面也提出越来越高的需求。数字社区依托5G、互联网、大数据、人工智能等新兴技术,提供线上线下融合的服务能力,让本地社区生活服务更精准、更便捷、更丰富。数字技术助力本地生活服务更加智慧化,打造数字社区已经成为当前城市社区发展的重要方向。
在乡村振兴方面,数字社区除了建立农民和消费者直接联系的渠道,推动农业农村经济发展,还成为培养乡村人才的第二课堂和基地。通过发掘有能力的乡村用户,为其提供产品、相关知识和资源,培养其成为乡村带头人,带动乡村发展。近期,农业农村部科技教育司与共青团中央青年发展部联合开展国家乡村振兴重点帮扶县“农村青年主播”培育工作,依托快手“村播计划”,通过线下活动、培训指导、线上规模化运营、专项传播等多项持续性举措,培养数字乡村新主播人才。
中西部欠发达地区拥有价低质优的产品,但受限于基础设施薄弱、公共服务资源匮乏,与经济发达的东南部地区相比缺乏竞争力。普惠的数字社区为中西部地区充分挖掘产业特色、地区文化和旅游资源提供了全新媒介,通过社区平台、线上与线下结合,促进生产要素优化配置,实现区域产品优势互补。同时,产业的发展能带动人才格局流动,吸引一批有互联网意识、有技术能力的青年创业。
中央财经大学中国互联网经济研究院副院长、教授欧阳日辉表示,普惠数字社区为就业、创业和新职业发展开辟新空间,是新个体、新职业、微经济的承载地,数字城市社区与数字乡村社区建设相辅相成,共促数字中国建设。(经济日报记者 王轶辰)
(文图:赵筱尘 巫邓炎)