有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
中国两院院士评出2022年中国和世界十大科技进展******
中新网北京1月12日电 (记者 孙自法)由中国科学院和中国工程院两院院士投票评选的2022年中国十大科技进展新闻、世界十大科技进展新闻,1月12日在北京揭晓并对外公布,“中国天眼”系列重要进展、中国空间站完成在轨建造和首个完整人类基因组序列公布、人造心脏研究重要进展等分别入选中国和世界的十大科技进展。
2022年中国十大科技进展新闻分别是:
——“中国天眼”(FAST)取得系列重要进展。中科院国家天文台李菂研究员领导的团队,采用原创的中性氢窄线自吸收方法,首次获得原恒星核包层中具有高置信度的塞曼效应测量结果;李菂团队首次提出能够统一解释重复快速射电暴偏振频率演化的机制,为最终确定FRB起源提供关键观测证据;李菂领导的国际合作团队,发现迄今唯一一例持续活跃的重复快速射电暴,并确认近源区域拥有目前已知的最大电子密度;FAST快速射电暴优先和重大项目科学研究团队,对一例位于银河系外的快速射电暴开展深度观测,首次探测到距离快速射电暴中心仅1个天文单位(即太阳到地球的距离)的周边环境的磁场变化,向着揭示快速射电暴中心引擎机制迈出重要一步;中科院国家天文台徐聪研究员领导的国际团队,对致密星系群“斯蒂芬五重星系”及周围天区的氢原子气体进行成像观测,发现一个尺度大约为200万光年的巨大原子气体结构,比银河系大20倍,这是迄今在宇宙中探测到的最大的原子气体结构。
快速射电暴和宿主星系艺术想象图。 中科院国家天文台供图——中国空间站完成在轨建造并取得一系列重大进展。神舟十五号载人飞船发射成功并自主快速交会对接于空间站天和核心舱。神舟十五号航天员乘组入驻“天宫”,与神舟十四号航天员乘组相聚中国人的“太空家园”,开启中国空间站长期有人驻留时代。19个月内,中国载人航天密集实施11次发射、2次飞船返回、7次航天员出舱,4个飞行乘组12名航天员接续在轨驻留,中国空间站“T”字基本构型组装建造如期完成。
建成空间站,建设国家太空实验室。 中国科学报供图——中国科学家发现玉米和水稻增产关键基因。《科学》杂志在线发表中国农业大学教授杨小红、李建生与华中农业大学教授严建兵联合团队的研究论文,经过三代科学家18年研究发现,玉米基因KRN2和水稻基因OsKRN2受到趋同选择,并通过相似的途径调控玉米和水稻的产量,并进一步在全基因组层面阐明了趋同进化的遗传规律。
——科学家首次发现并证实玻色子奇异金属。电子科技大学李言荣院士团队与美国布朗大学教授James M. Valles Jr、北京大学谢心澄院士等协同攻关,成功突破费米子体系的限制,首次在玻色子体系中诱导出奇异金属态。
——中国科学家将二氧化碳人工合成葡萄糖和脂肪酸。电子科技大学夏川课题组、中国科学院深圳先进技术研究院于涛课题组和中国科学技术大学曾杰课题组共同创建一种二氧化碳转化新路径,通过电催化与生物合成相结合,成功以二氧化碳和水为原料合成葡萄糖和脂肪酸,为人工和半人工合成“粮食”提供了新路径。
改造后用于制备葡萄糖的酵母菌株发酵液(棕色溶液)和制备的葡萄糖(白色溶液)。 中国科学报供图——中国迄今运载能力最大固体运载火箭“力箭一号”首飞成功。由中科院力学研究所抓总研制、中国迄今运载能力最大的固体运载火箭“力箭一号”以“一箭六星”方式成功发射,首飞圆满成功的“力箭一号”作为中小型卫星发射优先选择,丰富了中国固体运载火箭发射能力谱系。
——“夸父一号”成功发射并发布首批科学图像。中国综合性太阳探测专用卫星“夸父一号”2022年10月成功发射,首批科学图像于12月对外发布,成果实现多个国内外首次,在轨验证了“夸父一号”3台有效载荷的观测能力和先进性。全称先进天基太阳天文台(ASO-S)的“夸父一号”卫星科学目标为“一磁两暴”,同时为空间天气预报提供支持。
——新技术可在海水里原位直接电解制氢。中国工程院院士谢和平团队在《自然》发表论文,以物理力学与电化学相结合的全新思路,建立相变迁移驱动的海水无淡化原位直接电解制氢全新原理与技术,未来有望与海上可再生能源相结合,构建无淡化、无额外催化剂工程、无海水输运、无污染处理的海水原位直接电解制氢工厂。
海水无淡化原位直接电解制氢稳定性——课题组供图——国家重大科技基础设施“稳态强磁场实验装置”实现重大突破。由中科院合肥物质科学研究院强磁场科学中心研制的国家重大科技基础设施“稳态强磁场实验装置”实现重大突破,创造场强45.22万高斯的稳态强磁场,超越已保持了23年之久的45万高斯稳态强磁场世界纪录,达到国际领先水平。
——“巅峰使命”珠峰科考创造多项新纪录。“巅峰使命”珠峰科考活动共有5个科考分队、16支科考小组、270多名科考队员参加。此次科考在西风-季风协同作用及影响、巅峰海拔的强烈升温、巅峰海拔的冰雪融化、高新技术平台观测的水汽和温室气体、珠峰地区的强大气氧化性过程、珠峰地区人体生理的特殊反应、珠峰地区变绿的生态过程等方面取得了众多亮点成果,创下多项科考新纪录。
科考队员成功开展珠峰峰顶综合科考工作。 中科院青藏高原研究所供图2022年世界十大科技进展新闻分别是:
——首个完整人类基因组序列公布。美国研究人员领衔的国际科研团队公布了首个完整、无间隙的人类基因组序列,人类基因组含有约30亿个DNA(脱氧核糖核酸)碱基对,完成这些碱基对的完整、无间隙测序对于了解人类基因组变异全谱、掌握基因对某些疾病的影响至关重要。
——人造心脏研究取得重要进展。美国工程师使用一种新的增材纺织品制造方法,开发出第一个具有螺旋排列跳动心脏细胞的人类心室生物杂交模型,并证明其肌肉排列确实会显著增加每次收缩时心室泵出的血液量。该研究是朝着器官生物制造迈出的重要一步,使人们更接近于建立用于移植的人体心脏的最终目标。
——银河系中心黑洞的首张照片面世。包括中国在内的全球多地天文学家同步公布一个超大质量黑洞——人马座 A*(Sgr A*)的照片。这是人类“看见”的第二个黑洞,也是银河系中心超大质量黑洞真实存在的首个直接视觉证据。这个超大质量黑洞距离太阳系约2.7万光年,质量超过太阳质量的400万倍。
银河系中心黑洞的首张照片。EHT合作组织供图——人类首次成功改变小行星轨道。美国宇航局利用双小行星重定向测试航天器,撞击了一颗近地双小行星系统中较小的小行星——Dimorphos,以期改变其运行轨道。这是世界上首个旨在防御地球免受小行星撞击威胁的测试任务,结果证实这次任务取得成功。
——美国首次成功在核聚变反应中实现“净能量增益”。美国国家点火装置团队首次在可控核聚变实验中实现核聚变反应的净能量增益,即通过核聚变产生的能量比激发聚变所使用的能量更多,这项突破首次证实惯性核聚变能的基本科学原理和可行性。
——詹姆斯·韦布空间望远镜顺利入轨首次传回照片。作为迄今最大、功能最强的空间望远镜,詹姆斯·韦布空间望远镜主镜直径6.5米,由18片巨大六边形镜片构成,配有5层可展开的遮阳板。该望远镜公布了其拍摄的一批宇宙全彩色照片后,还拍摄到距离地球约280亿光年的最遥远恒星的新图像,并首次在系外行星上明确探测到二氧化碳。
——世界首台百亿亿次超级计算机打破速度纪录。国际超算组织宣布,美国橡树岭国家实验室的超级计算机“前沿”在2022年国际超算Top500榜单中拔得头筹,成为现今世界上运行速度最快的超级计算机,算力高达每秒1.1百亿亿次,也是目前国际上公告的首台每秒能执行百亿亿次浮点运算的计算机。
——猪蛋白角膜让人重见光明。瑞典林雪平大学等研究人员通过提取猪胶原蛋白制成的人工角膜,成功使失明或视力受损的人恢复了视力,且手术两年后,患者没有严重并发症或副作用的报告。该研究结果有助于开发出一种符合人类植入物标准、可以大规模生产并储存长达两年的生物材料,从而惠及更多有视力问题的人。
由猪胶原蛋白制成的角膜。 图片来源:THOR BALKHED、林雪平大学——人工智能加速“原创”新蛋白质设计。随着人工智能(AI)的巨大进步,美国西雅图华盛顿大学(UW)生物化学家David Baker领导的一个团队,只需几秒钟便可以设计出“原创”新蛋白质。在Baker团队开发的一种名为“幻觉”的方法中,研究人员将随机的氨基酸序列输入结构预测网络;根据网络的预测,改变其结构,使之变得更像蛋白质。
——科学家发现“四中子态”存在最明确证据。由数十个国家的科学家组成的联合团队发现了迄今“四中子态”(tetraneutron)奇异物质存在的最明确证据,相关研究论文已发表于《自然》,这一发现将有助于物理学家对核力本质的理论进行微调。
据了解,中国两院院士投票评选2022年中国十大科技进展新闻、世界十大科技进展新闻活动,由中国科学院、中国工程院主办,中科院学部工作局、中国工程院办公厅、中国科学报社承办。此项年度评选活动至今已举办29次。(完)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |