自(zì)聊天机器人ChatGPT火(huǒ)爆以(yǐ)来,微软公司创始人比尔(ěr)·盖茨已多次公开谈论人(rén)工智能话题。在最近的一次采(cǎi)访中,他(tā)再次表示:“AI可(kě)能会让科技行业(yè)迎来(lái)一(yī)次(cì)剧烈的洗(xǐ)牌”。
这个(gè)结论是(shì)他在当地(dì)时间2月20日接受(shòu)《In Good Company》节目专访时提出的(de)。
他预期,AI的发展(zhǎn)可能会威胁(xié)到谷歌的市占(zhàn)率,因为微软(ruǎn)在AI方面的(de)行动相当(dāng)迅速。而最(zuì)终(zhōng)科技巨头(tóu)将(jiāng)把AI整合成(chéng)用户的(de)“全能助手”,包揽一切(qiè)应用,与人们进行沟(gōu)通并提供建(jiàn)议(yì),可以(yǐ)取代(dài)亚马逊(xùn)、Siri或Outlook等(děng)应用。
大佬口中全能助手(shǒu)的到来可(kě)能(néng)尚需时日,但由ControlNet引发的又一(yī)次AI绘画浪(làng)潮(cháo),让AIGC在ChatGPT的话题热点(diǎn)包围中杀(shā)出重围。
01
ControlNet颠覆(fù)AI绘画(huà)新玩法(fǎ)
AIGC向可控靠近
以AI绘(huì)画为(wèi)代表的(de)AIGC上一次爆火的时(shí)候(hòu),还(hái)是(shì)2022年8月,在美国科罗拉(lā)多州举(jǔ)办的新兴数字艺术家竞赛(sài)中,一幅(fú)名为(wèi)《太空歌剧(jù)院》的(de)作品获奖。
随后(hòu)各大厂商的AI绘画软(ruǎn)件被广大网友(yǒu)熟(shú)知并体验(yàn),Stable Diffusion便是其中(zhōng)代表。
用户们可(kě)以在应用中输入一组关键词或者一张照(zhào)片,就能获得(dé)一幅AI创作的画作。
作画的关(guān)键就是(shì)所输入的文(wén)本。同(tóng)一组关键词也可(kě)以创作出很多张风(fēng)格不一样的画(huà)作,这(zhè)让创(chuàng)作的过程就(jiù)像开盲盒(hé)。
很多用户(hù)很喜欢这(zhè)种不确定的惊喜(xǐ),他们(men)会将生成的(de)美(měi)图当做头像。而另一部分喜欢翻看AI绘画(huà)的“翻(fān)车”作品。在社(shè)交媒体(tǐ)上,许多用户(hù)分享AI“翻车现场”,例如,一位网友(yǒu)的小狗照片被AI画成了“肌(jī)肉男”,还(hái)有(yǒu)网友(yǒu)的个(gè)人(rén)照片(piàn)被AI识别成了(le)建(jiàn)筑。
而如今随着ControlNet的出现(xiàn)与(yǔ)加持(chí),以往AI绘(huì)画的(de)填写关(guān)键词(cí)游戏可能要被(bèi)颠覆了。
ControlNet是一位正在(zài)斯(sī)坦福读博的中国(guó)人张(zhāng)吕敏创(chuàng)作的一种基于控制点的图(tú)像(xiàng)变形算法,主要用于数字图像(xiàng)处理、计(jì)算(尽管的关联词后面是什么,尽管的关联词表示什么关系suàn)机视觉(jué)和计算机图形学等领(lǐng)域。
其SD插件一经(jīng)发布,在(zài)短(duǎn)短的(de)两(liǎng)天(tiān)内便成(chéng)为(wèi)了AI绘画领域最新(xīn)的(de)热点。
在此之(zhī)前,大家用了很多方法想(xiǎng)让AI生(shēng)成的结果尽可能的符合要求,但(dàn)是都不尽如人意,它的出(chū)现代表(biǎo)着(zhe)AI生成开始进(jìn)入真(zhēn)正(zhèng)的可(kě)控时期。
因为ControlNet可以直接提取画面的构图,人物的姿(zī)势和画面的深度(dù)信(xìn)息等。有了它的帮助(zhù),就不用频(pín)繁的用(yòng)提示词来碰运气,抽盲盒式的创作了(le)。
通(tōng)俗的(de)说(shuō)ControlNet相(xiāng)当于给AI绘画加(jiā)了(le)“魔法”,不(bù)少(shǎo)博主的作品(pǐn)已经(jīng)获(huò)得了大量的浏览量,“viggo”就是其中(zhōng)之一,他(tā)用朋友的照片直接带她们走进动漫世界(jiè)。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插(chā)件拓展找到对应的关键(jiàn)词;最(zuì)后用ControlNet插件绑(bǎng)定骨骼开始换关键词试效果。
通过图(tú)片(piàn)就可以(yǐ)看出来(lái),效果十分惊艳。
更(gèng)厉害(hài)的(de)是,除了(le)真实的照片(piàn),草图(tú)也可以加上“魔法”,知乎(hū)大牛(niú)“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩图。大神(shén)张吕(lǚ)敏其本尊也(yě)亲自回应(yīng)。
不得不说当(dāng)下AIGC已经(jīng)变(biàn)得越来越强大,甚至(zhì)输(shū)出(chū)的作品都已经(jīng)能以假乱真了。
02
难辨虚实,AIGC技术力爆发
警惕安全问题
近日,“苏州金鸡(jī)湖有游艇(tǐng)party”的消息火遍网络(luò),而经过警方辟谣这(zhè)所谓的“party”可能(néng)是全国第一起AI绘(huì)图诈骗(piàn)。
由(yóu)于这(zhè)个活(huó)动里面给出的美女照片都是AI制(zhì)作的真人(rén)照片绘图,因为太逼真,被大家当成真事(shì)传播了。
不过仔细观察可以发现,活动发(fā)起(qǐ)者提供的(de)照片中(zhōng)有个很(hěn)大的漏洞可以发现(xiàn)并非(fēi)真人(rén),而是AI绘图,那便是图片中女性的手(shǒu)指部分有的存在异(yì)常。
有行业人事表(biǎo)示:“现(xiàn)在因为手指部分的绘(huì)画(huà)算法比(bǐ)较复杂(zá),AI还不太(tài)会画(huà)人的手,但(dàn)最(zuì)新看到的图片已经有越来越完美的(de)AI模(mó)型出(chū)现,以后可能就完全(quán)没有漏洞(dòng)了。”
类(lèi)似的(de)AI作图(tú)诈骗在国外也已有发生(shēng)。据英(yīng)国(guó)广播公司报(bào)道,土耳其地震期间(jiān),有Tiktok用户使用AI合(hé)成了儿(ér)童受灾(zāi)的(de)假照片发(fā)布(bù)到网络,以此诱骗(piàn)善良的人打赏“捐助”从(cóng)而(ér)实施诈骗。
目(mù)前随着技术发(fā)展,AIGC已经能做(zuò)出真人照(zhào)片般的绘图效果,如果(guǒ)这样的图片被用来诈骗,将非(fēi)常可怕(pà)。
此外AIGC还(hái)引发了很多担忧,一方面,批判者(zhě)认为(wèi)AI在“学(xué)习”了大量(liàng)前人的作品之(zhī)后,其创作没有任何情绪和灵(líng)魂,难以和人类的艺(yì)术(shù)创作(zuò)相提(tí)并(bìng)论。
另一方(fāng)面,AIGC背(bèi)后的版权、目(mù)前都并没有得到有效(xiào)的解决(jué),还有AIGC会不会代替人类“至高无(wú)上”的创意。
马斯克也强调(diào),人(rén)工(gōng)智能的安全问题需要得到(dào)重视(shì),太晚(wǎn)就来不及(jí)了。
03
AIGC下一站(zhàn)除了视频,还(hái)有(yǒu)远方
技(jì)术都(dōu)是(shì)有(yǒu)两面性的,潜在(zài)的危害并不(bù)能(néng)掩盖其光辉的贡献。现在看来,人工智能技术(shù)将是第四次(cì)工业革命的核心驱动力量,将(jiāng)创造新的增长奇迹(jì)。
过去一年,人工智能(néng)在技(jì)术和商业层(céng)面都有了(le)巨大进展,AI绘画就是(shì)人工(gōng)智能技术发生方向性改变的一个代表。其下一站或(huò)许就是视(shì)频。
此前,Meta和谷歌(gē)先后发(fā)布了几条引(yǐn)爆科技圈的短(duǎn)视频。这些视(shì)频引(yǐn)发关注并非内容做得多优秀,反而都非常简单,比(bǐ)如一匹正在喝水的(de)马,一只画画(huà)的玩(wán)具熊,或者一段骑摩托车的(de)第(dì)一视(shì)角录像,随便一(yī)个有手机的人都可以(yǐ)随手(shǒu)录下一段(duàn)。
但这些短视频的(de)创作(zuò)方(fāng)式非常简单,创(chuàng)作(zuò)者仅仅需(xū)要向AI输入一段话,甚至(zhì)只是(shì)说(shuō)一下要(yào)求(qiú),AI就可以(yǐ)根据需要生成(chéng)一段视频。
谷(gǔ)歌发布的两个AI生(shēng)成视(shì)频(pín)分别来自(zì)于Imagen Video和(hé)Phenaki,前者主要(yào)突出(chū)的(de)是高清(qīng),与Meta的(de)Make-A-Video没有太多(duō)的差别(bié)。
在Make-A-Video公(gōng)布了AI生(shēng)成的(de)视频后,AI圈就(jiù)已经玩了一波梗,一个能够(gòu)做出(chū)更高(gāo)清视频的AI还(hái)不足(zú)以在短(duǎn)时(shí)间内戳中(zhōng)兴奋(fèn)点(diǎn)。
Phenaki更加令人(rén)震惊(jīng)的地方在于,它可以制作出超过(guò)2分钟的连贯的也有确切内容(róng)的视频,这才是真正让人们感(gǎn)到惊喜的地方(fāng)。因为(wèi)无论AI生成的视频(pín)多么高清(qīng),也只能是为内容生(shēng)产者提供一(yī)个灵感,一(yī)个素材,一个过场动画。
不(bù)过(guò)能够(gòu)制作出有具体(tǐ)剧情(qíng)内容的视(shì)频就(jiù)意味(wèi)着,一(yī)些视频(pín)创作(zuò)由AI代替(tì)人工完成已经初步有(yǒu)了(le)可能。
当下AI的(de)发(fā)展速度已经超过大(dà)部分人的想(xiǎng)象。内(nèi)容产业的本质是供给创造需求,AIGC作为全新的(de)内容生(shēng)产方(fāng)式,可以(yǐ)为内容产(chǎn)业带来更新的内容风格、更快的生产速度,更低的生产成本,这(zhè)无疑会驱动内容产业的大爆(bào)发。
除了AI绘(huì)图、视(shì)频(pín),AIGC技术还能(néng)应用(yòng)于音乐、代码、机器人动作等多种(zhǒng)内(nèi)容(róng)形式(shì)的生成。不(bù)难发现(xiàn)该项技术不仅在游戏等(děng)行业能(néng)得到(dào)有效(xiào)应用,对于下一代(dài)互联网各种元(yuán)素的构(gòu)建亦有关键意义。
从(cóng)商业化的角(jiǎo)度来看,文化娱乐、教育、传媒等诸多领域,本身就(jiù)对基于(yú)AI的可视(shì)化内容有强烈需(xū)求(qiú)。
因此,AI绘画(huà)及(jí)视(shì)频或不是(shì)结果,而只是AI进程中(zhōng)的(de)一(yī)块重要拼图(tú),有望在技(jì)术更新的加持下实现更大的应用价值。
AI从(cóng)理解内容,走(zǒu)向了可以生成内容,甚至能够(gòu)创(chuàng)造(zào)出独立价值和(hé)独立视角的内容。AIGC的再次出圈,更(gèng)代表着未(wèi)来的先进生产力(lì)即将到来。
04
紧抓大模型与算力,牢(láo)固AIGC底座
从(cóng)技术的发展也可以看出,在语言大模型、图像(xiàng)大模型(xíng)之后,多(duō)模(mó)态大模型已经成为了(le)新的(de)趋(qū)势。
大模(mó)型被誉为(wèi)当前人工智能发展的(de)智能底座(zuò),是全球竞争最激烈的(de)研究方向之(zhī)一,包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等众(zhòng)多头部(bù)企业(yè)都在竞相发(fā)力。
不过训练大(dà)模型的确价格不菲,以国盛(shèng)证券发布的(de)《ChatGPT需要多少算(suàn)力》报告估(gū)算,GPT-3训练一次的成本约为140万美元。而对于一些更大的LLM(大型语言模(mó)型),训(xùn)练成本则介(jiè)于(yú)200万(wàn)美元(yuán)至(zhì)1200万美元高价之间。
以ChatGPT在2023年1月的独(dú)立访客平均数1300万计算,其对(duì)应芯片需(xū)求为3万多片(piàn)英(yīng)伟达A100 GPU,初(chū)始投入成本约(yuē)为8亿(yì)美元,每(měi)日仅电费就在5万美(měi)元左(zuǒ)右。
此外不论是ChatGPT还是AIGC,都(dōu)离不开(kāi)庞大算力支(zhī)持。在关注各类大模(mó)型的(de)发展(zhǎn)同(tóng)时(shí),更应该关注算力(lì)网络的建(jiàn)设。
算力(lì)网络正驱动AI产业发展进入史诗级(jí)加速进程,让AIGC及(jí)通用AI这一人工(gōng)智能(néng)发展的终极(jí)目标离得更近。
因(yīn)为算力可以对(duì)突(tū)破性(xìng)技术创(chuàng)新提供大力的支持(chí)。这方面,多模态(tài)大模型(xíng)是典型。作(zuò)为面向未来(lái)强人工智能、通用人工智能的重要技术创新,多模态大模(mó)型已(yǐ)经(jīng)在人工智(zhì)能领域(yù)提出了很多年,业界也有不少技术突破,但是(shì),多(duō)模态大模型进一步往(wǎng)下走(zǒu),算力需(xū)求呈几何式上升,一般的算力基础(chǔ)设施很(hěn)快将难以胜任。
从图像、文字、语(yǔ)音(yīn)单(dān)独一项的训练,到双模态、三模态的跃迁(qiān),让人(rén)工智能可以灵活应对不同(tóng)模态的转化、像人与世界交互一样自(zì)然(rán),这(zhè)方面,由算(suàn)力网络来驱(qū)动将有明显优势。
此(cǐ)外,还(hái)有很(hěn)多(duō)需要爆发式增(zēng)长的算力来支撑(chēng)的技术创(chuàng)新,将在人工智能算力网络支(zhī)撑下快速(sù)推进。
AIGC已经露出曙光,期待(dài)在大(dà)模型和大(dà)算(suàn)力(lì)的支(zhī)持(chí)下AIGC能(néng)持续颠覆内(nèi)容生产的方式,将创造的边际成本降低,让万众(zhòng)受(shòu)益。
未经允许不得转载:橘子百科-橘子都知道 尽管的关联词后面是什么,尽管的关联词表示什么关系
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了