自聊天机器人ChatGPT火爆以来,微软公司创(chuàng)始人比(bǐ)尔·盖茨已多次公开谈(tán)论人工智(zhì)能话题(tí)。在最近的一次采访中,他再(zài)次(cì)表示:“AI可能(néng)会让(ràng)科技行业迎来一次(cì)剧烈(liè)的洗(xǐ)牌”。
这个结论是他(tā)在当地时间2月(yuè)20日接受《In Good Company》节(jié)目专访时提出的(de)。
他预期,AI的发展可能会威(wēi)胁到谷歌的(de)市占率,因为微软在(zài)AI方面的行动相当迅(xùn)速。而最终(zhōng)科技巨(jù)头将把AI整合(hé)成用户(hù)的(de)“全能(néng)助手”,包揽一切应用(yòng),与人们进行(xíng)沟通并提供建议,可以取代亚马逊(xùn)、Siri或Outlook等应用。
大(dà)佬口中全能助(zhù)手的到来(lái)可能尚需时日,但由(yóu)ControlNet引发的又(yòu)一次AI绘画浪潮(cháo),让AIGC在(zài)ChatGPT的话题热点包围(wéi)中杀出重围。
01
ControlNet颠(diān)覆AI绘画新玩法
AIGC向可控靠(kào)近
以AI绘画为代表的AIGC上一次爆火的时候(hòu),还是2022年8月,在美(měi)国科罗拉多(duō)州举办(bàn)的新兴数字(zì)艺术家竞赛中,一幅名为《太空(kōng)歌剧院》的作品获奖。
随后各大(dà)厂商的AI绘画软件被广大网友熟(shú)知并(bìng)体验,Stable Diffusion便是(shì)其中代(dài)表。
用户们可以在(zài)应用中输(shū)入(rù)一组(zǔ)关键词(cí)或者一张照片,就能获得一幅(fú)AI创(chuàng)作的画作。
作画的关键就是所输入的文(wén)本。同一组关键(jiàn)词也(yě)可(kě)以创作出很多张风格不(bù)一样的画作,这(zhè)让创作的过程就像开盲盒(hé)。
很多用户很喜欢(huān)这种不确定的惊喜,他们会将生成的(de)美图当做头像。而另一部(bù)分(fēn)喜欢(huān)翻看(kàn)AI绘画的“翻(fān)车”作品。在社交媒体(tǐ)上(shàng),许多用户分享AI“翻车现场”,例(lì)如,一位网友的小狗照片被AI画成了“肌(jī)肉(ròu)男(nán)”,还(hái)有网友的个人照片被AI识别成了(le)建筑。
而如今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可能要(yào)被颠(diān)覆了(le)。
ControlNet是一(yī)位正(zhèng)在(zài)斯坦(tǎn)福读博的中国人张吕敏创作的一种基于控制点的图像变形算法(fǎ),主要用(yòng)于数字(zì)图像处理、计算机视觉和计(jì)算机图(tú)形学等领域。
其SD插件(jiàn)一经发(fā)布,在短短(duǎn)的(de)两(liǎng)天内便(biàn)成为了AI绘画领域最(zuì)新的热点。
在此之(zhī)前,大家用了(le)很多方(fāng)法想让AI生成的(de)结果尽可能的(de)符(fú)合要求,但是都不尽如(rú)人意,它的出(chū)现(xiàn)代表(biǎo)着AI生(shēng)成开始进入真正的可控时期。
因为ControlNet可以直接提取画面的构图,人物(wù)的(de)姿势和画面的深度信息(xī)等(děng)。有(yǒu)了它(tā)的帮(bāng)助,就不用(yòng)频繁的用提示(shì)词(cí)来碰运气(qì),抽(chōu)盲(máng)盒式的创作了(le)。
通(tōng)俗的说ControlNet相当于给AI绘画加了“魔(mó)法(fǎ)”,不(bù)少(shǎo)博主的作品已经获得了(le)大量(liàng)的浏览量(liàng),“viggo”就(jiù)是其中之(zhī)一,他用朋友的照片直接带她(tā)们(men)走进动漫(màn)世界(jiè)。
viggo先用StableDiffusion图片转文字(zì)。
再用(yòng)Text2Prompt插件拓展找到对应的(de)关键词(cí);最后用ControlNet插件绑定(dìng)骨(gǔ)骼开始换关键词试效果。
通过图(tú)片就(jiù)可以(yǐ)看出来,效果十分惊艳。
更厉害的是(shì),除(chú)了(le)真实的照片(piàn),草图也可以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还能实现线稿转全(quán)彩图。大神张吕敏(mǐn)其本尊(zūn)也亲自回应。
不得(dé)不说当下AIGC已经(jīng)变得(dé)越来(lái)越(yuè)强大,甚至输出的作品都已经能(néng)以假(jiǎ)乱真了。
02
难辨(biàn)虚(xū)实(shí),AIGC技术力爆发
警惕安(ān)全问题(tí)
近(jìn)日,“苏(sū)州金鸡湖有游(yóu)艇party”的消息火遍网络,而经(jīng)过警方(fāng)辟谣这所谓(wèi)的(de)“party”可能是全国第一起AI绘图诈(zhà)骗。
由于这个活(huó)动里面(miàn)给出(chū)的(de)美女照片都是AI制作的真人照片(piàn)绘图,因为太逼(bī)真,被(bèi)大家当(dāng)成真事传播了。
不(bù)过仔细观察可以发现,活动(dòng)发(fā)起者提(tí)供的照片中有个很大的(de)漏洞可以发现(xiàn)并非真人,而是AI绘(huì)图,那(nà)便是图片中女性的手指(zhǐ)部分有的存在异常。
有行业人事表示:“现在因为手指部分的绘画算法比较复杂,AI还不太会(huì)画人的(de)手,但最新(xīn)看(kàn)到的(de)图片已经有越来越完美的AI模(mó)型出现,以后可(kě)能就完全没(méi)有(yǒu)漏洞(dòng)了。”
类似的AI作图诈骗在国外也已(yǐ)有发生。据英国(guó)广播公司(sī)报道,土耳其地震(zhèn)期间,有Tiktok用户使用AI合成了儿(ér)童受灾的(de)假照片发布到网络,以此(cǐ)诱骗善良的人(rén)打赏“捐(juān)助”从而实施(shī)诈骗(piàn)。
目前随(suí)着技术发展,AIGC已经能做出真(zhēn)人照片(piàn)般的(de)绘(huì)图效果,如果这样的图(tú)片被(bèi)用来诈骗,将非常可怕。
此(cǐ)外AIGC还引发了(le)很多担(dān)忧,一方面(miàn),批判者认为(wèi)AI在“学习”了大量前人(rén)的作品(pǐn)之后,其创作没有任何情绪(xù)人类的菊花能扩大到多少,人类的菊花是什么和灵魂,难以和人(rén)类的艺术创作相(xiāng)提并(bìng)论。
另一方面,AIGC背后的版权、目前都并(bìng)没有(yǒu)得(dé)到(dào)有效的(de)解决,还有AIGC会不会代替人类“至高无上”的创意。
马(mǎ)斯克也强调,人(rén)工智能(néng)的安全(quán)问(wèn)题需(xū)要得到(dào)重视(shì),太晚就来不及了。
03
AIGC下(xià)一站(zhàn)除(chú)了视频,还有(yǒu)远(yuǎn)方
技术(shù)都(dōu)是有两面(miàn)性的,潜在的危害并不(bù)能掩盖(gài)其光辉的贡献。现在看来(lái),人工智(zhì)能(néng)技术将是第四次工业革命的(de)核心驱动力量(liàng),将创造新(xīn)的增长奇迹。
过(guò)去一(yī)年,人工(gōng)智能在技术和商业层面(miàn)都(dōu)有了巨大进展,AI绘(huì)画(huà)就是(shì)人工智能技(jì)术发生(shēng)方向性改(gǎi)变的(de)一个代(dài)表。其下一站或(huò)许就是视频。
此前,Meta和谷歌先后发布(bù)了几条引(yǐn)爆科技(jì)圈的短视频。这些(xiē)视频(pín)引(yǐn)发关注并(bìng)非(fēi)内容(róng)做得多(duō)优秀(xiù),反而都非常简单(dān),比(bǐ)如一匹正在(zài)喝水的马,一只画画的玩具熊(xióng),或者(zhě)一段(duàn)骑摩(mó)托车(chē)的第(dì)一视(shì)角录像,随便一个有(yǒu)手机的人都可以随手录(lù)下一段。
但这些短视(shì)频的创(chuàng)作方式非(fēi)常(cháng)简(jiǎn)单(dān),创作(zuò)者仅仅需要向(xiàng)AI输入一段(duàn)话,甚(shèn)至只是说一下(xià)要求,AI就(jiù)可以根(gēn)据(jù)需要生成一段视(shì)频(pín)。
谷歌发布的(de)两个AI生成视频分(fēn)别(bié)来(lái)自(zì)于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的Make-A-Video没(méi)有太人类的菊花能扩大到多少,人类的菊花是什么多(duō)的差别。
在Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已经玩了一波梗,一个能(néng)够做出更高清视频的(de)AI还不足以在(zài)短时间(jiān)内(nèi)戳中兴奋(fèn)点(diǎn)。
Phenaki更加令人震(zhèn)惊的地方(fāng)在于,它可(kě)以制(zhì)作出超过2分钟的连贯的也(yě)有确切内容(róng)的视频,这(zhè)才是真正让人们感到(dào)惊喜的(de)地方。因为无论AI生成的(de)视(shì)频多么高清,也只能是为内容生产者提供一个灵感(gǎn),一个素材,一个(gè)过场(chǎng)动画。
不过能够制(zhì)作出(chū)有具体剧情内容的视频就意味着,一些(xiē)视频创作由AI代替(tì)人工完成已经(jīng)初(chū)步有了(le)可能。
当下AI的(de)发展速度(dù)已经超过大(dà)部分(fēn)人的想象。内容产业的本质是供给(gěi)创造需求,AIGC作为(wèi)全新的内容生产方式,可以为内容产(chǎn)业带来(lái)更新的内(nèi)容风格、更(gèng)快的生产速(sù)度,更低的(de)生(shēng)产成本,这无疑会驱动内容产(chǎn)业的大爆(bào)发。
除了AI绘图、视频,AIGC技术还能(néng)应(yīng)用(yòng)于音乐、代码、机器人动作等多种内容(róng)形式的生(shēng)成。不难(nán)发现(xiàn)该项技术不仅在游戏等(děng)行业能(néng)得到(dào)有效(xiào)应用,对于下一代互联网各种(zhǒng)元素(sù)的(de)构建亦(yì)有(yǒu)关键意义(yì)。
从商业(yè)化的角(jiǎo)度来看,文化娱乐(lè)、教育、传媒等诸多领域,本身就对基(jī)于AI的可视化(huà)内容有强烈(liè)需求。
因(yīn)此,AI绘(huì)画及(jí)视(shì)频或(huò)不是(shì)结(jié)果,而只是(shì)AI进程中的一块重要(yào)拼图,有(yǒu)望在技术更新的(de)加持(chí)下实现(xiàn)更大的(de)应用价(jià)值。
AI从理解内(nèi)容,走向了可以生成内容,甚(shèn)至(zhì)能够创造出独立价值和(hé)独立视角的内容(róng)。AIGC的再次出圈(quān),更(gèng)代表着未来(lái)的先(xiān)进生产力(lì)即将到来。
04
紧(jǐn)抓大模型与算力,牢固(gù)AIGC底座
从(cóng)技术的发展也可以看(kàn)出,在语言大模型、图像(xiàng)大模型之后(hòu),多模态大模型已(yǐ)经成为了新的趋势。
大模型被誉为(wèi)当(dāng)前(qián)人(rén)工智能(néng)发展的智(zhì)能底座,是(shì)全球竞争(zhēng)最激烈(liè)的(de)研究方向之一,包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等(děng)众多头部企业都在竞相发(fā)力(lì)。
不过(guò)训(xùn)练(liàn)大模(mó)型的(de)确价(jià)格不菲,以国盛证券发(fā)布的《ChatGPT需(xū)要多少(shǎo)算力》报告估算(suàn),GPT-3训(xùn)练一次的成本约为140万美(měi)元。而对于一些更大的LLM(大型语言模型),训练成本则介(jiè)于200万美元至1200万美元高价(jià)之间。
以(yǐ)ChatGPT在2023年1月的独立访(fǎng)客平均数1300万计算,其对应芯片(piàn)需求为3万多片英伟达A100 GPU,初始(shǐ)投(tóu)入成本约为8亿美元,每日仅电费(fèi)就(jiù)在5万美元左右。
此外不论(lùn)是ChatGPT还是(shì)AIGC,都离(lí)不开(kāi)庞(páng)大算(suàn)力支持。在关注各类大模型的(de)发展同时,更(gèng)应该关(guān)注(zhù)算力网络的建设。
算力网络正驱动AI产业发展进(jìn)入史(shǐ)诗级加速进程,让(ràng)AIGC及通(tōng)用AI这一人(rén)工智能发展的终极目标离(lí)得(dé)更近。
因为算力可以对突破性技术创新提(tí)供(gōng)大力的支持。这方面,多模态大模型是典型(xíng)。作(zuò)为面向未来强人工(gōng)智能(néng)、通用人工智能的重要(yào)技术创新,多(duō)模态大模型已经在人工智(zhì)能领域提出了很多年,业界也有不少技术突破,但是,多模态大模型进一步往下走,算力需求呈几何式上升,一般的算力基础设施很(hěn)快将(jiāng)难(nán)以胜任。
从(cóng)图像、文字、语音(yīn)单独(dú)一项的训练,到双模态(tài)、三(sān)模态的跃迁,让人工智能可以(yǐ)灵(líng)活应对(duì)不同模态的转化(huà)、像人(rén)与世界交互一样自然,这方面,由算力网络(luò)来驱动将有明显(xiǎn)优势。
此外,还(hái)有很多需(xū)要爆发(fā)式增(zēng)长的算力来支撑的技(jì)术创新,将在人工智能算力网(wǎng)络(luò)支(zhī)撑下快(kuài)速推进。
AIGC已经露出曙光,期待(dài)在大模(mó)型和大算力的(de)支持下AIGC能持续颠覆内容生产的方式,将创造的边(biān)际(jì)成本降低(dī),让万(wàn)众受益。
未经允许不得转载:橘子百科-橘子都知道 人类的菊花能扩大到多少,人类的菊花是什么
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了