自聊天机器(qì)人ChatGPT火爆(bào)以来,微软(ruǎn)公司创始人比尔·盖(gài)茨(cí)已(yǐ)多次公开谈(tán)论人工智能话题。在(zài)最(zuì)近的(de)一(yī)次采访中(zhōng),他再次表(biǎo)示:“AI可能会让科技行业迎来一次剧烈的洗牌(pái)”。
这个(gè)结论是他在当地时间2月20日接受《In Good Company》节目(mù)专访(fǎng)时(shí)提(tí)出的。
他预期(qī),AI的发展可(kě)能会威胁(xié)到谷歌的市占率,因为微(wēi)软在AI方面(miàn)的行(xíng)动相当迅速。而最终(zhōng)科技巨头将把AI整合(hé)成用(yòng)户的“全能助手”,包揽(lǎn)一(yī)切应用,与(yǔ)人们(men)进行沟通并提供建议,可以取代亚马逊(xùn)、Siri或Outlook等应用。
大佬(lǎo)口中全能(néng)助手(shǒu)的到来可能尚需时(shí)日,但由ControlNet引发的又一次AI绘(huì)画(huà)浪潮(cháo),让AIGC在(zài)ChatGPT的话题(tí)热点包(bāo)围(wéi)中杀出重围。
01
ControlNet颠覆AI绘画新(xīn)玩(wán)法
AIGC向可控靠近
以AI绘画为代(dài)表的(de)AIGC上一次爆火(huǒ)的时候,还(hái)是2022年8月(yuè),在(zài)美国科(kē)罗拉多州举(jǔ)办的新兴(xīng)数字艺术家竞赛中(zhōng),一幅名为《太空歌剧(jù)院》的作品(pǐn)获奖。
随后各大厂(chǎng)商的(de)AI绘画软件被广大网友(yǒu)熟知并体验,Stable Diffusion便是(shì)其中代表。
用户们可以在(zài)应用中输入一组(zǔ)关键词或者一张照片(piàn),就能获得一幅AI创作的画(huà)作(zuò)。
作画的关键就(jiù)是所输入的文本。同一组关键词也可(kě)以创作出很多张风格不一样的画作,这让创作的过程就像(xiàng)开盲盒。
很多用户很(hěn)喜欢(huān)这种不确定的惊喜,他(tā)们会将生成的美图当做(zuò)头像(xiàng)。而(ér)另(lìng)一部分喜欢(huān)翻看AI绘画的“翻车”作品。在社交媒体上,许多用户分享(xiǎng)AI“翻车现场”,例(lì)如,一位网(wǎng)友(yǒu)的(de)小狗照(zhào)片被AI画成了(le)“肌肉男”,还有(yǒu)网友的个(gè)人照片被(bèi)AI识别成了建筑。
而如今随着ControlNet的出现与(yǔ)加持,以(yǐ)往AI绘画(huà)的填写关键词游戏可能要被颠覆了。
ControlNet是一位正在斯坦福读博的中国人张吕敏创(chuàng)作(zuò)的(de)一种基于控制点的图像变形算法,主要用于数(shù)字(zì)图像处理、计(jì)算机视觉和计算机图(tú)形学等(děng)领域(yù)。
其(qí)SD插件一经发布(bù),在(zài)短(duǎn)短的两天(tiān)内(nèi)便成为了AI绘画领(lǐng)域最新的热点。
在此之前(qián),大(dà)家用了很多方(fāng)法想(xiǎng)让(ràng)AI生成的结果尽可(kě)能的符合要求,但(dàn)是都不尽如人意,它的出现代表(biǎo)着AI生成开始(shǐ)进入真正的可控时(shí)期。
因(yīn)为ControlNet可以直接提取画(huà)面(miàn)的构图,人(rén)物的姿势和画(huà)面的(de)深度信息等。有了它的帮助,就不(bù)用频繁的用提示词来碰运(yùn)气(qì),抽盲盒式的(de)创作了。
通俗的说(shuō)ControlNet相当(dāng)于给AI绘画(huà)加了“魔法”,不少博主的作品已经获得了大量的(de)浏览量(liàng),“viggo”就是(shì)其中之一(yī),他(tā)用朋友的照片直接带她们(men)走(zǒu)进动漫世界。
viggo先(xiān)用StableDiffusion图片(piàn)转(zhuǎn)文字。
再用Text2Prompt插件拓展找到(dào)对(duì)应的关键(jiàn)词;最后用(yòng)ControlNet插件绑(bǎng)定骨骼开始换关键词试(shì)效果。
通过(guò)图(tú)片(piàn)就可以看出来,效果十(shí)分惊(jīng)艳。
更厉害的(de)是,除了真(zhēn)实的照片,草图也(yě)可以(yǐ)加上(shàng)“魔法”,知乎大牛(niú)“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线稿(gǎo)转全彩图。大神张吕敏其本尊也亲(qīn)自回应。
不得不说当下AIGC已经变得越来越强(qiáng)大(dà),甚至输出的作品都已(yǐ)经能以(yǐ)假乱真了。
02
难(nán)辨虚实(shí),AIGC技术(shù)力爆发
警惕(tì)安(ān)全问题
近日(rì),“苏州金鸡湖有(yǒu)游艇(tǐng)party”的消息火(huǒ)遍网络,而(ér)经过(guò)警方(fāng)辟谣这所谓的“party”可能是全(quán)国(guó)第一起AI绘(huì)图诈(zhà)骗(piàn)。
由于这个活(huó)动里(lǐ)面给出的美女照片都是AI制作(zuò)的(de)真人照片绘图(tú),因为太逼真,被大家(jiā)当成真(zhēn)事传播了。
不过仔细(xì)观察可以(yǐ)发现(xiàn),活动发(fā)起者提供的照片中有(yǒu)个(gè)很大(dà)的漏洞可以(yǐ)发现并非真人,而是AI绘图,那便是图片中(zhōng)女性(xìng)的手(shǒu)指(zhǐ)部(bù)分有(yǒu)的存在异常。
有行业人事表示:“现在因为手(shǒu)指(zhǐ)部分的绘画(huà)算法比(bǐ)较(jiào)复杂,AI还(hái)不太会(huì)画人(rén)的手(shǒu),但最新看到的图片(piàn)已经有越来越完美(měi)的AI模型出现,以后(hòu)可能就完全没有漏洞了(le)。”
类似的(de)AI作图诈骗在国外也已有(yǒu)发生。据(jù)英国广播公(gōng)司报道(dào),土耳其地震(zhèn)期(qī)间,有(yǒu)Tiktok用(yòng)户使用AI合成了儿童受(shòu)灾的假照片发布到网络,以此(cǐ)诱骗善良的人打赏(shǎng)“捐助”从而实施(shī)诈(zhà)骗。
目前随(suí)着技(jì)术发(fā)展,AIGC已(yǐ)经能做(zuò)出真人照(zhào)片般的绘图效果,如果这样的图片被用来(lái)诈骗,将(jiāng)非常可怕。
此(cǐ)外AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判者(zhě)认为AI在“学习”了大(dà)量前人的作品(pǐn)之后,其创作没有任何情绪和灵魂,难以和人类的艺术创(chuàng)作相提(tí)并论。
另(lìng)一(yī)方(fāng)面,AIGC背后的版权(quán)、目前都并没有得到有效的解(jiě)决(jué),还有(yǒu)AIGC会不(bù)会代(dài)替人类“至高无(wú)上”的创意。
马斯克(kè)也强调,人工智能(néng)的安全问题需要(yào)得到重(zhòng)视,太(tài)晚就来不及了。
03
AIGC下(xià)一站除了视频,还有远(yuǎn)方
技术都是有(yǒu)两面性的,潜在的危害并不能(néng)掩盖其(qí)光辉的贡献。现在看(kàn)来(lái),人工智能技术(shù)将是第四次(cì)工业革命的(de)核心(xīn)驱动力量,将(jiāng)创造新(xīn)的增长奇(qí)迹。
过(guò)去一(yī)年,人工智能在技术和商业层面(miàn)都(dōu)有了(le)巨(jù)大进展,AI绘画就是人(rén)工智能技术发生(shēng)方向性(xìng)改变的(de)一个代表。其下一站或许就(jiù)是视频。
此前,Meta和谷歌先后发布了几条引爆科技圈(quān)的短(duǎn)视频。这些视频引发关注(zhù)并非内容做得多优秀(xiù),反(fǎn)而都非常简单,比(bǐ)如一匹正在喝水的(de)马,一只画画的玩(wán)具(jù)熊(xióng),或者一段(duàn)骑(qí)摩(mó)托车的第一(yī)视角录像(xiàng),随便一个(gè)有手机的人都可以随手录下一(yī)段。
但这些(xiē)短视频的(de)创作方式非常简单(dān),创作者仅仅需要向AI输(shū)入一段话,甚至只是(shì)说一下要求,AI就(jiù)可(kě)以根据需(xū)要(yào)生成一段视(shì)频。
谷歌发(fā)布的两个AI生成视频分别来(lái)自于(yú)Imagen Video和Phenaki,前者主要(yào)突出的(de)是高(gāo)清,与Meta的Make-A-Video没有太多的差别。
在Make-A-Video公布了AI生(shēng)成的视频后(hòu),AI圈就已经玩了一波梗,一个能够做出更高(gāo)清(qīng)视(shì)频的AI还不足(zú)以(yǐ)在短时间(jiān)内戳中(zhōng)兴奋点。
Phenaki更(gèng)加令(lìng)人震惊的地方在(zài)于,它(tā)可以制(zhì)作出(chū文言文许行原文及翻译注释,文言文许行原文及翻译及注释)超过2分(fēn)钟的连贯(guàn)的也有确切内容(róng)的视频,这(zhè)才是真(zhēn)正让人(rén)们感到惊喜的地方。因为无论AI生(shēng)成的视频多么(me)高清(qīng),也只能是为内容生产者提供一(yī)个灵感,一个素材,一个过(guò)场动(dòng)画。
不过能够制作出有具体剧情内容(róng)的视(shì)频就意味着,一些视频创作由AI代替人工完成已经初步有了可能。
当下(xià)AI的发展(zhǎn)速度已经超过大部分人的想象。内容产业的(de)本质是供给(gěi)创造需求,AIGC作为(wèi)全新的内容(róng)生产方式(shì),可以为内容产业带来更新的内(nèi)容(róng)风格、更快的生产速(sù)度,更低的生产成本,这无疑会驱(qū)动(dòng)内容(róng)产业的大爆发。
除了AI绘(huì)图、视频,AIGC技术还能(néng)应用于音乐、代码、机器人动作等多种(zhǒng)内(nèi)容(róng)形式的(de)生(shēng)成。不难发现该项技术不(bù)仅在游戏等行业能(néng)得到有效(xiào)应用,对于下一(yī)代互联网各种元素的构建(jiàn)亦(yì)有(yǒu)关(guān)键意义。
从(cóng)商业化的角度(dù)来看,文化娱乐、教育、传媒等诸多(duō)领域,本身就对基于AI的可视(shì)化内容(róng)有强烈需求。
因此,AI绘画及视频或不是结(jié)果,而只(zhǐ)是AI进程中的一块重(zhòng)要拼图,有望在技术更新的加持下实现更大的(de)应用价值。
AI从理解内容,走(zǒu)向了可以生成(chéng)内容(róng),甚(shèn)至(zhì)能够创造(zào)出独立价值和独立(lì)视角的内(nèi)容。AIGC的(de)再次出圈,更代表着未来的先进生产力即将到来。
04
紧抓大模型与算力,牢固AIGC底座
从技术的发展也可以看出,在(zài)语言大模型(xíng)、图(tú)像大模型(xíng)之(zhī)后,多模态大(dà)模(mó)型已(yǐ)经成为了新的趋(qū)势。
大模型被誉为当(dāng)前人(rén)工智能发展的(de)智能底座,是全球竞争最激(jī)烈的研(yán)究(jiū)方向之一,包括谷歌、亚马逊、百度、阿(ā)里、腾(téng)讯等众多头部企业都(dōu)在竞相发力。
不过训练(liàn)大模型的确价(jià)格(gé)不(bù)菲,以国盛证券发布的《ChatGPT需要(yào)多少(shǎo)算力》报(bào)告估算,GPT-3训练一次的(de)成本(běn)约(yuē)为(wèi)140万美元。而(ér)对于(yú)一些更大的LLM(大型语(yǔ)言(yán)模型),训(xùn)练成本则介于200万美元至1200万美元高价(jià)之间。
以ChatGPT在(zài)2023年1月的独(dú)立(lì)访客(kè)平均数1300万计算,其对应芯(xīn)片(piàn)需(xū)求为(wèi)3万多片英伟达A100 GPU,初始投(tóu)入成本(běn)约为(wèi)8亿美元(yuán),每日仅电费就在(zài)5万(wàn)美元(yuán)左右。
此外不论是ChatGPT还是(shì)AIGC,都离(lí)不开(kāi)庞(páng)大算(suàn)力支(zhī)持(chí)。在关注各类大模型的发展同时,更应该关(guān)注算力(lì)网络的建设。
算力网络(luò)正驱动AI产业发(fā)展进入史诗级加(jiā)速进程(chéng),让AIGC及通用AI这一人工(gōng)智能发展的终极目标离得更近。
因为(wèi)算力(lì)可以对突破(pò)性技术(shù)创(chuàng)新提供大力(lì)的支持。这(zhè)方(fāng)面(miàn),多模态大模型是典(diǎn)型。作为(wèi)面向未来强人工智能、通用人工智能(néng)的重要技术创新(xīn),多模态大模型已经在(zài)人工(gōng)智能领域(yù)提出了很多年,业界(jiè)也有不少技术突破,但是,多模态大模型进(jìn)一步往(wǎng)下走,算力需求呈(chéng)几何式上升,一般(bān)的算(suàn)力(lì)基(jī)础设施很快将难以胜任。
从图(tú)像、文字、语(yǔ)音单独(dú)一项的训(xùn)练,到双(shuāng)模态(tài)、三模态的(de)跃(yuè)迁,让人工智(zhì)能可以灵活应对(duì)不同模态的(de)转化、像人与(yǔ)世界交互(hù)一(yī)样自然(rán),这方面,由算力网络来驱动将有明显优势。
此外,还有(yǒu)很(hěn)多需要爆发式增长的算力(lì)来(lái)支撑的(de)技(jì)术(shù)创新,将在(zài)人工智(zhì)能算力网(wǎng)络支撑下快(kuài)速(sù)推进。
AIGC已经露出曙光,期待在大模型和大算(suàn)力的支持下AIGC能持续(xù)颠(diān)覆内(nèi)容生产的方式,将创造的边际(jì)成本降低(dī),让万众(zhòng)受益(yì)。
未经允许不得转载:成都工装公司_工装装修效果图_专注公装设计装修 - 无同之家装饰 文言文许行原文及翻译注释,文言文许行原文及翻译及注释
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了