自聊天机器人ChatGPT火爆以来,微软公司(sī)创始人(rén)比尔·盖(gài)茨(cí)已多次公开谈(tán)论人(rén)工(gōng)智能话题。在最近的(de)一(yī)次采(cǎi)访中,他(tā)再次表示:“AI可能会让科技行业迎来一次(cì)剧烈的洗(xǐ)牌(pái)”。
这个结论是他在当地时(shí)间2月20日接(jiē)受《In Good Company》节目专访(fǎng)时提出的。
他预期(qī),AI的(de)发展可能会威胁(xié)到谷歌的市占率,因为(wèi)微软在AI方面的行动相当迅速。而最终科(kē)技巨头(tóu)将把AI整合成用户的“全能助手”,包(bāo)揽(lǎn)一切应用,与人们进行沟通并(bìng)提供建(jiàn)议,可以取代亚马逊、Siri或Outlook等应(yīng)用。
大佬(lǎo)口中(zhōng)全能助手的到来(lái)可能(néng)尚需时日,但(dàn)由ControlNet引发(fā)的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的(de)话(huà)题热点(diǎn)包围中杀出重围。
01
ControlNet颠覆AI绘画新玩法
AIGC向可控靠近
以AI绘画为代表(biǎo)的(de)AIGC上一次爆(bào)火的时(shí)候,还是2022年8月,在美国科罗拉多(duō)州举办的新兴数字艺术家(jiā)竞赛中,一幅(fú)名为《太空歌剧院》的作(zuò)品获奖。
随(suí)后各大厂(chǎng)商的(de)AI绘画软件被广大(dà)网(wǎng)友熟知并体验,Stable Diffusion便是其中代表。
用户们可以在应用中(zhōng)输(shū)入一组关(guān)键词或者一张(zhāng)照片,就能获得一幅AI创作的(de)画作。
作画(huà)的关(guān)键就(jiù)是所输入的(de)文本。同(tóng)一组(zǔ)关键词也可以(yǐ)创作出(chū)很(hěn)多张(zhāng)风格(gé)不一样的画作(zuò),这(zhè)让创作的过程就像(xiàng)开盲盒。
很(hěn)多用户很喜(xǐ)欢这种不确(què)定的惊喜,他(tā)们会将生成的美图(tú)当做头(tóu)像。而另一部分喜欢翻看AI绘画的“翻车”作(zuò)品。在社交媒体上,许多用户分享AI“翻车(chē)现场”,例如,一位(wèi)网友的小狗照片(piàn)被AI画成(chéng)了“肌肉男”,还(hái)有网友的(de)个人照片被AI识别成(chéng)了建筑(zhù)。
而如(rú)今随着ControlNet的出(chū)现(xiàn)与(yǔ)加持,以往AI绘画的填写关键词游戏可能要被(bèi)颠覆了。
ControlNet是(shì)一位正在(zài)斯坦福读博的中国人张吕敏创作的一种基(jī)于控(kòng)制点的图像变形算法,主要用于(yú)数字图像处理、计算(suàn)机(jī)视觉和(hé)计算机图形学等领域。
其(qí)SD插件一经(jīng)发(fā)布,在短短的两天内便(biàn)成为了AI绘画领域最新的热(rè)点。
在此(cǐ)之前,大(dà)家(jiā)用了很多方法想让AI生成的结果尽(jǐn)可(kě)能(néng)的符(fú)合要求,但(dàn)是都(dōu)不尽如(rú)人(rén)意,它(tā)的出(chū)现代表(biǎo)着AI生成开始(shǐ)进入真(zhēn)正(zhèng)的可控时期。
因为(wèi)ControlNet可(kě)以(yǐ)直接提取画面的构图,人物的姿势和画面的深度信息等。有了它的帮助,就不用频繁的用提示词来碰(pèng)运气,抽(chōu)盲(máng)盒式的创作了。
通俗的说ControlNet相当于给AI绘画加了(le)“魔(mó)法”,不(bù)少博主的作(zuò)品(pǐn)已经获得了大量的(de)浏览量,“viggo”就是其中之一,他用(yòng)朋(péng)友(yǒu)的照片直接带(dài)她们(men)走进(jìn)动(dòng)漫(màn)世界(jiè)。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插件(jiàn)拓展找(zhǎo)到对(duì)应的关键词;最后用ControlNet插件绑(bǎng)定骨骼开始(shǐ)换关(guān)键词试效(xiào)果(guǒ)。
通过图(tú)片就(jiù)可以(yǐ)看出来,效果十分惊(jīng)艳。
更厉害的是(shì),除了(le)真实(shí)的照片,草图(tú)也可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全(quán)彩图。大(dà)神张吕敏(mǐn)其本(běn)尊也亲自(zì)回应。
不得不说当下AIGC已经变得越来越强大(dà),甚(shèn)至输(shū)出的(de)作品都(dōu)已经(jīng)能以假乱真了。
02
难(nán)辨虚实(shí),AIGC技术力爆(bào)发
警惕(tì)安全(quán)问题
近日,“苏州金(jīn)鸡湖有(yǒu)游艇party”的(de)消息火(huǒ)遍网络(luò),而经(jīng)过(guò)警方辟谣这所谓的(de)“party”可能是全国第一起AI绘图诈骗。
由于这个(gè)活(huó)动里面给出的美女照片都是AI制作的真(zhēn)人照(zhào)片绘图,因为太逼真,被(bèi)大家当(dāng)成真(zhēn)事传播了。
不过仔细观察可以发现,活动发起者提(tí)供(gōng)的照片(piàn)中有个很(hěn)大(dà)的漏洞可以发现并非真人,而是AI绘(huì)图,那便是图片中女性的手指部(bù)分有(yǒu)的存在(zài)异(yì)常。
有(yǒu)行业人事表(biǎo)示:“现在因为(wèi)手(shǒu)指(zhǐ)部分的绘(huì)画算法比(bǐ)较复(fù)杂(zá),AI还不太会画人的手,但最新看到的图片已(yǐ)经有越来越完美(měi)的AI模型出(chū)现,以后(hòu)可能就完(wán)全(quán)没(méi)有(yǒu)漏洞了。”
类(lèi)似的AI作(zuò)图诈(zhà)骗在国外(wài)也已有(yǒu)发(fā)生(shēng)。据英(yīng)国广播(bō)公司报道,土耳其地震期间(jiān),有Tiktok用(yòng)户(hù)使(shǐ)用AI合成了儿童(tóng)受灾的假(jiǎ)照(zhào)片发布到网络,以此诱骗善(shàn)良的人(rén)打赏“捐助”从而(ér)实施诈骗。
目前随着技术发展(zhǎn),AIGC已经能做(zuò)出真人照片般的绘(huì)图效果,如果这样的图(tú)片被(bèi)用来(lái)诈骗,将非(fēi)常可怕。
此外(wài)AIGC还引发了很多担忧,一(yī)方面,批判者认为(wèi)AI在(zài)“学(xué)习(xí)”了大量前人的作品(pǐn)之后,其创作没有任何情绪和灵魂,难以和(hé)人类(lèi)的(de)艺术(shù)创(chuàng)作相提并论。
另一方(fāng)面(miàn),AIGC背后的版权、目前(qián)都并没(méi)有得(dé)到有效的解决,还有(yǒu)AIGC会不会(huì)代(dài)替人(rén)类(lèi)“至高(gāo)无(wú)上”的创(chuàng)意(yì)。
马斯(sī)克也强调,人工智能的安全问题需要(yào)得到重视(shì),太晚就来不及(jí)了。
03
AIGC下一(yī)站除了视频(pín),还有远方
技术都是有(yǒu)两(liǎng)面(miàn)性的,潜在的(de)危害并不能掩盖其光辉的贡(gòng)献。现在看来,人工(gōng)智(zhì)能技术将是第四次工(gōng)业革命的(de)核心驱(qū)动力量,将(jiāng)创造新的增长(zhǎng)奇迹。
过去一年,人工智能在技(jì)术和商业(yè)层(céng)面都有了巨大进(jìn)展,AI绘画就是人工智(zhì)能技术发生方向性(xìng)改变的(de)一个代表。其下一站或(huò)许就是视频。
此前,Meta和谷歌先(xiān)后发布了几条引爆科技圈的(de)短视频(pín)。这些(xiē)视频(pín)引发关注并非内容做得多优秀,反而都(dōu)非(fēi)常(cháng)简单,比如一匹正在喝(hē)水的马(mǎ),一只画画的玩具(jù)熊(xióng),或(huò)者一段(duàn)骑(qí)摩托车的第一视角录像(xiàng),随便一个有手机的(de)人都可(kě)以随(suí)手(shǒu)录下一段(duàn)。
但这些短视频的创(chuàng)作方式(shì)非常简单,创作(zuò)者仅仅(jǐn)需要向AI输入一段话,甚至只是说一下(xià)要求,AI就(jiù)可(kě)以根据(jù)需(xū)要生成一段视频(pín)。
谷(gǔ)歌发(fā)布的两(liǎng)个AI生成(chéng)视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与(yǔ)Meta的(de)Make-A-Video没有太多(duō)的差别。
在Make-A-Video公(gōng)布了AI生(shēng)成的视频后,AI圈就(jiù)已经玩了一波(bō)梗,一(yī)个能够做出更高清视(shì)频的AI还不(bù)足以在(zài)短(duǎn)时间内戳中兴奋点。
Phenaki更加(jiā)令(lìng)人震惊的(de)地方在(zài)于,它可以制作出超(chāo)过(guò)2分钟的(de)连贯(guàn)的也有(yǒu)确切(qiè)内(900g是几斤 900g是多少毫升nèi)容的视(shì)频,这才是(shì)真正让人们(men)感到惊喜的地方。因为无论AI生成的视频多么高(gāo)清,也只能是为(wèi)内容生(shēng)产者提供一个灵感,一(yī)个素材,一个过场(chǎng)动画。
不(bù)过(guò)能够制作(zuò)出有具体剧(jù)情内容(róng)的视频就(jiù)意味(wèi)着,一些视频创(chuàng)作(zuò)由AI代替人工完成已(yǐ)经初步(bù)有了可能。
当下AI的发展速度已经超(chāo)过(guò)大部分(fēn)人的想象。内容产业的本质(zhì)是供给创(chuàng)造需(xū)求,AIGC作为全新的内容生产方式,可以为(wèi)内容产业带来更新的(de)内容风(fēng)格、更快的生产速度,更低(dī)的(de)生(shēng)产成本(běn),这无(wú)疑会驱(qū)动内容产业(yè)的大(dà)爆发。
除了AI绘图、视频,AIGC技术还能应用于音乐(lè)、代码、机器(qì)人(rén)动作等多种内容(róng)形(xíng)式的生成。不难(nán)发现(xiàn)该项技术不仅在游戏(xì)等行业能得到有效应用,对(duì)于下一代互联网各种元(yuán)素(sù)的构建亦有关键(jiàn)意义。
从(cóng)商(shāng)业化的(de)角度(dù)来看(kàn),文化娱乐、教(jiào)育、传媒等诸多领域(yù),本身就(jiù)对基于AI的可视(shì)化内(nèi)容(róng)有强烈需求(qiú)。
因此(cǐ),AI绘画及视(shì)频(pín)或不是结(jié)果,而(ér)只是AI进程中的一块重要拼(pīn)图,有(yǒu)望在技术更(gèng)新的加持下实现更(gèng)大的(de)应(yīng)用(yòng)价值。
AI从理解内容,走(zǒu)向了可以(yǐ)生成内容,甚至能够创(chuàng)造出独(dú)立价值和独立视(shì)角的内(nèi)容(róng)。AIGC的再(zài)次出圈,更代表着未(wèi)来(lái)的先进(jìn)生产力即将到来(lái)。
04
紧(jǐn)抓(zhuā)大模型与算(suàn)力,牢固AIGC底座(zuò)
从技术的发展也可以看(kàn)出,在语言大模(mó)型、图像(xiàng)大模型之后,多模态大模型已(yǐ)经成(chéng)为(wèi)了新的趋势(shì)。
大模型被誉为当前人工(gōng)智能发(fā)展的智能(néng)底座(zuò),是全球竞争最激烈的(de)研(yán)究(jiū)方向(xiàng)之一,包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等(děng)众多头部企(qǐ)业都在竞相发力。
不过训(xùn)练大模型的确价格不菲(fēi),以国盛证券发(fā)布的《ChatGPT需要多少算力(lì)》报告(gào)估算,GPT-3训(xùn)练一次(cì)的成本(běn)约(yuē)为140万(wàn)美(měi)元。而(ér)对(duì)于一些更大(dà)的LLM(大型(xíng)语言模(mó)型),训练成(chéng)本则介(jiè)于(yú)200万美元至1200万美元高价之(zhī)间。
以(yǐ)ChatGPT在(zài)2023年1月的(de)独立访客(kè)平均数1300万计算,其对应芯片需求为3万(wàn)多片英(yīng)伟(wěi)达A100 GPU,初始投入成本(běn)约为8亿美(měi)元,每日仅电费就在5万美元左(zuǒ)右。
此外不(bù)论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关注各类大(dà)模型的(de)发展同(tóng)时,更(gèng)应(yīng)该关注算力网(wǎng)络的建(jiàn)设(shè)。
算力(lì)网络(luò)正驱(qū)动AI产业发展进入史诗级加速进程,让(ràng)AIGC及(jí)通用(yòng)AI这一人(rén)工智(zhì)能发(fā)展的终极目标离得更近。
因为算(suàn)力(lì)可以(yǐ)对突破性(xìng)技术创(chuàng)新提供大力的支持。这方面,多模(mó)态大模型是典型。作为面向未来(lái)强人工智能、通用(yòng)人工(gōng)智(zhì)能的重要技术创新(xīn),多(duō)模态大模型已经在人工智能领域提(tí)出了很多年,业(yè)界也有不少(shǎo)技术突(tū)破(pò),但(dàn)是,多模(mó)态大模型进一步往下走,算(suàn)力需求呈几何式(shì)上升,一般的算力基(jī)础(chǔ)设施(shī)很快将难以胜(shèng)任。
从图(tú)像、文字、语音单(dān)独(dú)一(yī)项的训练,到双(shuāng)模态(tài)、三模态的跃迁,让人工智能可(kě)以灵(líng)活应(yīng)对不(bù)同(tóng)模态的转(zhuǎn)化(huà)、像人与世界交(jiāo)互(hù)一样自然,这方(fāng)面,由(yóu)算力网络来驱动将有明显优势。
此外,还(hái)有(yǒu)很(hěn)多需要爆发(fā)式(shì)增长的算力来(lái)支撑的技(jì)术创新,将在人工智能算力(lì)网络(luò)支撑下快速推(tuī)进。
AIGC已经露出曙光,期(qī)待在大模(mó)型和(hé)大(dà)算力的支(zhī)持下AIGC能持(chí)续颠(diān)覆(fù)内容生(shēng)产的方式,将(jiāng)创(chuàng)造(zào)的(de)边际成本降低,让万众受益。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了